全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
8371 13
2019-02-21
R语言小白一枚!
文件中包含100W个样本,我想从中提取title含有“金融”,“理财”,“投资”字样的样本,生成一个新的data frame,该如何操作?谢谢大神指点! 微信截图_20190221141827.png
test.xlsx
大小:(19.88 KB)

 马上下载

附件列表
Rproblem.png

原图尺寸 62.21 KB

Rproblem.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-2-21 18:15:14
R函数语法忘记得差不多了,我写个Python的,你自己查得对应一下
df[df['title'].str.contains("金融|理财|投资")]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-21 19:09:10
可以用stringr包中的str_detect函数,如果title中含有金融、理财、投资则返回TRUE。

复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-22 09:24:49
诗人都在海底 发表于 2019-2-21 18:15
R函数语法忘记得差不多了,我写个Python的,你自己查得对应一下
好的,我试试,谢谢大神!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-22 09:37:56
swufeyumeng 发表于 2019-2-21 19:09
可以用stringr包中的str_detect函数,如果title中含有金融、理财、投资则返回TRUE。
谢谢回复,我试了您的code,出现错误
Error in df[str_detect(data$title, "金融|理财|投资"), ] :
  object of type 'closure' is not subsettable

是数据集不符合调用函数的标准吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-22 09:46:58
swufeyumeng 发表于 2019-2-21 19:09
可以用stringr包中的str_detect函数,如果title中含有金融、理财、投资则返回TRUE。
我新上传了一张图片是运行的问题,test文件是测试文件,还希望大神指点~谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群