全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
33608 11
2014-05-17
data.rar
大小:(1.33 KB)

 马上下载

本附件包括:

  • hw1_data.csv

   
1.png
作为一个完全没有编程经验的小白,刚接触R,有如下几个小问题:
1.以上为数据的一部分,如果想截取某列,应该如何操作呢?
在我输入了 column=data[,1]之后 console上显示为:object of type 'closure' is not subsettable  请问是什么意思?
我应该如何操作?
2.如果我需要求当Temp这一列的数值大于60时Ozone这一列的平均值(去除NA),该使用什么功能呢?Subset?
具体来说该如何操作呢?
3.数据分割和选取的代码是 x[],这里我似乎不能使用类似于x[,1]来选取第一列,是因为x并不指代上面的数据么?
希望大家能帮下小弟,虽然问题比较小白。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-5-17 13:47:55
你只是把数据读出来了, 没有把值付给一个对象. 应该是 A=read.csv("hw1_data.csv")
column=A[,1].  在mean函数中加入选项na.rm=TURE就可以把缺失值去掉了. 用命令 help(mean)看一下帮助,帮助里有详细说明.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-5-17 13:50:18
fanyonghui 发表于 2014-5-17 13:47
你只是把数据读出来了, 没有把值付给一个对象. 应该是 A=read.csv("hw1_data.csv")
column=A[,1].  在mean ...
好的,十分感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-5-17 13:59:21
1.以上为数据的一部分,如果想截取某列,应该如何操作呢?
在我输入了 column=data[,1]之后 console上显示为:object of type 'closure' is not subsettable  请问是什么意思?
我应该如何操作?
===============
data是R的保留字段,是一个显示数据的程序,没有另外定义前,不能用数组的操作法则。
read.csv("hw1_data.csv") 只是实现读入csv文件,并显示的功能。你需要将数据赋值给一个对象,如“Mydata”
Mydata<-read.csv("hw1_data.csv")
之后Mydata是一个R的对象(类型:数据框),输入ls()可以看到。这时才可subset:

输入 column=Mydata[,1]
===============
2.如果我需要求当Temp这一列的数值大于60时Ozone这一列的平均值(去除NA),该使用什么功能呢?Subset?
具体来说该如何操作呢?
===============
可以在mean程序中加入,na.rm=T
mean(Mydata[,1][Mydata[,4]>60],na.rm=T)

Mydata$Temp>60 返回一组T/F值,这种在[ ]中的逻辑操作,实现Subset很方便。
na.rm可以用于sum, mean以及其他一些操作。
===============

3.数据分割和选取的代码是 x[],这里我似乎不能使用类似于x[,1]来选取第一列,是因为x并不指代上面的数据么?
===============
完全可以的,x[,1] 可以选取第一列,如果知道列名如col1_name可以直接用x$col1_name.
数据框,矩阵,列表稍有不同。
这里有个入门文件:
https://bbs.pinggu.org/thread-2132491-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-5-17 14:02:14
fanyonghui 发表于 2014-5-17 13:47
你只是把数据读出来了, 没有把值付给一个对象. 应该是 A=read.csv("hw1_data.csv")
column=A[,1].  在mean ...
> A=read.csv("hw1_data.csv")
> A
    Ozone Solar.R Wind Temp Month Day
1      41     190  7.4   67     5   1
2      36     118  8.0   72     5   2
3      12     149 12.6   74     5   3
....

> column=A[,1]
> help(mean)
starting httpd help server ... done
> mean(A[,1])
[1] NA
> mean(A[,1],trim=0,na.rm=FALSE)
[1] NA

不好意思又打扰了,想问下加粗的那一步之后的操作是不是有什么遗漏呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-5-17 14:16:39
snowyapple 发表于 2014-5-17 14:02
> A=read.csv("hw1_data.csv")
> A
    Ozone Solar.R Wind Temp Month Day
column就是数据例的第一列了, 输入column, 可以看到其中的内容.
mean(column, na.rm=TRUE) 或者 mean(column, na.rm=T)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群