全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6059 10
2015-08-09
悬赏 20 个论坛币 已解决
感谢帮助;
我需要从1大个数据中提取两天的数据进行分析;画出直方图。
结果在数据导入的时候,时间格式变换过程中遇到了很多问题。
power.txt 是我摘取了几个数据试验我语句所用的,还没等到在大数据上用,小数据就卡壳了,请教高手了。
consumption这个文件是所有完整的数据,需要从所有年份中选取2007年02月01日到02日两天的数据进行分析。
下面是我用power.txt 选取两天数据进行分析的过程

#数据导入:

data <- read.table("power.txt", sep=";",  header=TRUE)


#这句顺利导入,没什么问题;用data查看数据后无误;


data$Date <- as.Date(data$Date, "%d/%m/%y")
#这句改变格式后,2006年莫名其妙成为了2020年,神奇,详情请看图片2;不知道哪里错误了,请教。因为这里错误了,下面三句也无法测试对错了。无奈,着急!帮忙解决者给高分,谢谢了!

1问,为啥时间变了。
startdate <- as.Date("2006-12-16")
enddate <- as.Date("2006-12-17")
newdata <- data[which(data$date>=startdate&data$date<=enddate),]


#开始作图;
hist(newdata$Global_active_power, col="green")




这句测试后出现这个问题(提示

> hist(newdata$Global_active_power, col="green")

Error in hist.default(newdata$Global_active_power, col = "green") :
  'x'必需为数值2问,为啥出现这个;需为数值。。。。?






2.jpg

原图尺寸 46.59 KB

2.jpg

1.jpg

原图尺寸 42.87 KB

1.jpg

consumption.zip

大小:17.65 MB

 马上下载

本附件包括:

  • consumption.txt

power.txt

大小:724 Bytes

 马上下载

最佳答案

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-8-9 11:55:31
data <- read.table('power.txt', sep=';', header = TRUE)
data_Date <- as.Date(data$Date, format='%d/%m/%Y');data_Date
错误在于年份%Y设置错了。
我出来的数据是对的了!有图为证。
附件列表
1.jpg

原图尺寸 101.5 KB

1.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-9 12:20:49
顶起,请教高手,感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-9 12:28:53
解决思路很清晰啊,没看出有什么问题啊

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-9 12:35:36
可是搞不出来啊,疯掉了,本以为一个小时够了,搞了一天,查了n多资料,网上搜了N天,没招了,来坛里求助来了,高手快来呀!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-9 12:39:45
诸葛山下 发表于 2015-8-9 12:28
解决思路很清晰啊,没看出有什么问题啊
兄弟,麻烦帮我走走这个程序,看看是不是和我结果一样,我都想换个电脑试试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群