全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
8521 12
2017-03-29
数据集如下:

id   var1   var2   var3   var4   var5
1    5.4    6.7    5.8    4.9     NA
3    5.5    6.0    7.9    NA      8.8
5    2.9    9.9     8.9    5.9     NA
6    NA     NA     NA     8.7     6.8
7    4.9    2.0    8.9    3.8     5.8
10   4.4    3.8    6.8    NA      NA

......       ........
我想筛选出变量var5为缺失值,而其他变量均不是缺失值的行,比如第一行和第三行,这该怎么做呢?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-3-29 18:09:28
假设你的数据框是a

library(dplyr)
a%>%filter(!is.na(var1),!is.na(var2),!is.na(var3),!is.na(var4),is.na(var5))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 07:36:32
lanhong1993 发表于 2017-3-29 16:56
数据集如下:

id   var1   var2   var3   var4   var5
A<-A[which(is.na(A$var5)),]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 12:08:40
johnmy 发表于 2017-3-29 18:09
假设你的数据框是a

library(dplyr)
条件设置,似有问题吧。该是:
a%>%filter(not(is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4)) & is.na(var5))
但是:  
如果,有几百,甚至上千个变量,如何办?? 推荐 purrr包中的相关函数!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 13:07:51
jgchen1966 发表于 2017-3-30 12:08
条件设置,似有问题吧。该是:
a%>%filter(not(is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4)) & i ...
两个得到的结果一样,
“not”应该是“!”
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 13:09:50
!(x |y) is the same as !x & !y.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群