R 筛选变量 - 经管之家

R 筛选变量

Ava666

3065

收藏 2018-10-17

数据中大约有6700个变量，一共两万条数据，初步想把每个变量中缺失值比较多的和0比较多的变量筛选出来删除掉，怎么写代码使出现0的次数最多的变量从高到低依次排序，或者还有其他筛选变量的好方法吗？各位大神求解答，不胜感激！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

wang052235

2018-10-18 00:43:01

想了很久不一定可行
首先
mydata<-list()

for (i in 1:ncol(数据集)) {

n <- sum(is.na(titanic[,i]))
mydata[[i]]<-n
}#生成一个变量缺失值的list
mydata <- as.data.frame(mydata)#转变成数据框
然后合并，或者行列转换后合并，根据此列排序，然后删除na多的
不太确定能用，你试试把

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Ava666

2018-10-18 07:58:25

好的，谢谢了，我试试

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

ryoeng

2018-10-18 14:43:45

提示: 作者被禁止或删除内容自动屏蔽

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群