全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5462 5
2015-06-23
有一个600多个变量的数据集,有continuous, categorical variables
在R里,如何快速知道哪些变量包含missing value?
换言之,如何能将有missing value的变量作为输出结果?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-23 03:27:47
提示: 作者被禁止或删除 内容自动屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-23 03:33:27
ryoeng 发表于 2015-6-23 03:27
查了下,是个package。看看去。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-23 21:13:50
个人工作学习中常用的方法是,is.na(checking data frame),然后colSum.
如果colSum>0,那就是至少有一个missing value 了

或者直接每一个col用anyNA()
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-24 04:38:48
云豹 发表于 2015-6-23 21:13
个人工作学习中常用的方法是,is.na(checking data frame),然后colSum.
如果colSum>0,那就是至少有一个mis ...
谢谢帮助。我的问题是,数据特别大,总共有800多个变量。
一般我都在数据整理部分将missing调整过了,但是还想在跑模型之前,快速确认一遍。
变量特别多,所以在想,有没有个函数,跑一下,就能把还含有missing的变量列出来。
类似于SAS中:
proc means data= sample n nmiss; run;
就可以查所有的数值型变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-24 05:53:06
melody21 发表于 2015-6-24 04:38
谢谢帮助。我的问题是,数据特别大,总共有800多个变量。
一般我都在数据整理部分将missing调整过了,但 ...
which(colSums(is.na(df))!=0)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群