全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
10766 12
2018-08-05
因为环境的限制,R上处理本身自带有的包,还有以下包,其他扩展包没有的情况下:
1.jpg
想要对某列缺失值填补该列的平均值;
比如数据框dt,
a<-c(1,2,3)
b<-c(1,NA,NA)
c<-c(2,NA,4)
d<-data.frame(a,b,c)
d
  a b c
  1 1 2
  2 NA NA
  3 NA 4
问题:想要将c列的NA值用c列的平均值代替;b列的用b列平均值代替;怎么做?
如果用:
dt[is.na(dt)]<-mean(dt$列名,na.rm=T)只能用某列的平均值代替所有的NA,这样是不准确的?在已有的情况下有没有办法?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-8-5 21:35:22
简单的问题用简单的工具。SPSS就很容易实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-5 21:37:00
dt$列名[is.na(dt$列名)] <- mean(dt$列名,na.rm = TRUE)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-5 21:42:35
colMeans函数就可以
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-6 10:06:41
nuomin 发表于 2018-8-5 21:42
colMeans函数就可以
d[is.na(d)]<-colMeans(d,na.rm=T)
谢谢,可以了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-6 10:09:00
cheetahfly 发表于 2018-8-5 21:37
dt$列名
谢谢,试了一下,你这个语句也是可以的。
d$b[is.na(d$b)]<-mean(d$b,na.rm=T)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群