全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1441 2
2013-08-08
各位大侠:
有一个问题:假设有两张表prob与qou 分别有变量iid,值如下
Prob     qou
Iid        iid
1           1
1           1
2           1
2           2
2          2
3          3
3           3
3          3


我的意思想为了提高效率仅让pro与quote两个表中的相同iid去匹配,如当pro中iid为1时,就只让它与quote中iid为1的匹配。而我对join的理解是,pro中的iid与quote中iid会进行全匹配,这样会有8*8=64次运算,而只让相同的iid匹配就只需2*3+3*2+3*3=21次运算。数据量越大,节省的循环次数应该越多。我觉得可以用双set语句执行。不知是否我的理解有错误?希望有大侠帮忙解决,谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-8-8 15:01:26
你如果只是想把两个数据集按照ID来进行横向连接的话,用merge语句就能实现~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-8 15:44:13
henryyhl 发表于 2013-8-8 15:01
你如果只是想把两个数据集按照ID来进行横向连接的话,用merge语句就能实现~
呵呵,谢谢,因为merge有可能出错,多对多匹配时与join的结果不一样。且我的数据是几千万行,看用双set语句加上使用索引会不会提高效率
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群