感谢帮助;
我需要从1大个数据中提取两天的数据进行分析;画出直方图。
结果在数据导入的时候,时间格式变换过程中遇到了很多问题。
power.txt 是我摘取了几个数据试验我语句所用的,还没等到在大数据上用,小数据就卡壳了,请教高手了。
consumption这个文件是所有完整的数据,需要从所有年份中选取2007年02月01日到02日两天的数据进行分析。
下面是我用power.txt 选取两天数据进行分析的过程
#数据导入:
data <- read.table("power.txt", sep=";", header=TRUE)
#这句顺利导入,没什么问题;用data查看数据后无误;
data$Date <- as.Date(data$Date, "%d/%m/%y")
#这句改变格式后,2006年莫名其妙成为了2020年,神奇,详情请看图片2;不知道哪里错误了,请教。因为这里错误了,下面三句也无法测试对错了。无奈,着急!帮忙解决者给高分,谢谢了!
1问,为啥时间变了。
startdate <- as.Date("2006-12-16")
enddate <- as.Date("2006-12-17")
newdata <- data[which(data$date>=startdate&data$date<=enddate),]
#开始作图;
hist(newdata$Global_active_power, col="green")
。
这句测试后出现这个问题(提示
> hist(newdata$Global_active_power, col="green")
Error in hist.default(newdata$Global_active_power, col = "green") :
'x'必需为数值2问,为啥出现这个;需为数值。。。。?
)