全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5742 4
2009-03-23
我是一个r语言的初学者,现在手头有一批数据,九个变量,每一列为一个变量,大约20000条,里面有一些缺失值,使用什么方法进行填充呢?最好可以把语句给我写一下,因为自己实在太菜了...能够使用包当然也可以,我之前曾尝试使用一个impute包,可怎么也不成功。恳请高手给我指点一下啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-3-23 17:19:00

R中缺失值填0就可以

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-3-24 00:57:00
NA 行吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-27 14:57:18
缺失值如果相对于样本量不多的话,可以直接用该变量的平均值代替。
如果缺失值比较多的话,我比较喜欢用missForest()来自动填充缺失值。
library(missForest)
missForest(data.frame)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-27 20:54:59
snakepointid 发表于 2015-6-27 14:57
缺失值如果相对于样本量不多的话,可以直接用该变量的平均值代替。
如果缺失值比较多的话,我比较喜欢用mi ...
大神求助,我的数据也有缺失值,想用随机森林填补,但是不会,求大神随机森林填补的详细代码,谢过。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群