全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
855 3
2015-11-26
对于大约1万条数据,要做相互匹配,要求输出 结果A,B, 然后两个东西匹配的东西,求解决思路,我用一般的 双for循环速度太慢(就是A这个东西对应着20多个变量,B这个东西对应着相同的变量,两者匹配,输出A,B以及两者相同的变量),求解!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-26 16:37:15
在R里,一般做匹配,是用merge函数。
你说的找出相同变量,这个和有多少行没有关系吧。检查一下变量名就可以。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-1 11:23:30
额 看来 我是没说明白意思,我的意思不是那种oracel的联合查询, 打个比方是小明身高1.75,性别男,小红身高1.75,性别女,这样就输出,小明,小红,身高,说明小明和小红身高相同。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-2 19:45:03
给个思路吧,20个纬度,每个纬度转换成factor,然后做笛卡尔积,结果的每个元素其实就是一种情况,你可以自己按照某种原则对每个纬度进行编码,将20个纬度信息转换成数值编码,编码相同的显示出来。打个比方:性别,身高。假设各有2、20种情况,那么需要的编码长度各是1和5,那么就可以转换成1+5=6位数值。矩阵的melt好像也可以达到类似的效果,如何用help去
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群