全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2517 2
2015-01-30
R.T.:
我一个数据框数据  myData id  content
1   我来自安徽省
2   我来自江苏省
3   我来自浙江省
4   我来自北京

还有一组数据   addr
addr
安徽省
浙江省
江苏省
北京市
江西省
广东省

请问如何使用grepl找出myData中包含的addr信息。之前问了一个问题。一个人先用merge函数合并后用mapply进行。虽然可以实现但会导致数据量增加太多。内存吃不消。我觉得可以通过for (add in addr){grepl(add,myData[,2])}得到结果。请问有没有什么函数可以代替for循环。使用类似像sapply的函数让它自己循环执行完毕?非常感谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-30 19:14:43
多大数据?竟然会吃不消?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-30 21:53:08
呵呵哼哼哈哈 发表于 2015-1-30 19:14
多大数据?竟然会吃不消?
myData 是30w行,addr是55行。使用merge会产生30w*55大约1600,0000行。。R会自动崩溃。。机子是4G内存的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群