全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3663 3
2015-11-04
一组数据,变量有40个,就是40列。
我要做数据筛选。
1.第一列中包含语段"a11","a12","b23"。请注意是包含,实际不存在“a11”,往往是“a1120”之类的信息
2.第二列中不包含“美国”、“日本”等信息。请注意,也是不包含,而不是不等于。

请问具体的R语言语句应该怎么写?谢谢。会加分的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-4 11:30:09
用grep或grepl查找,然后取非就行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-4 11:31:51
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-4 13:32:26
假设楼主的数据为一数据框,名字为“testdat”,第一列名"a",第二列名"b",则过滤语句为:

result<-subset(testdat,grepl("a11|a12|b23",testdat$a) & !grepl("美国|日本",testdat$b))

下面是截图,这个公式编辑器太犯嫌了,总是会弄乱格式,谁知道怎么样去掉呢?


附件列表
R-find.PNG

原图尺寸 4.72 KB

R-find.PNG

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群