全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2383 6
2013-11-21
我有两个表,需要并接。
第一个表内变量n1,n2,n3,n4,n5,n6 第二个表内变量n。(变量数据类型一致)
现在需要并接两个表,第一个表为准,第一个表内n1~n6,只要有一个等于第二个表内n,就并接。
现在我用sql 左连接,可是数据量大,效率很低,这一步需要运行10分钟。
希望有高手提供高效的并接方法。

谢谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-11-22 11:38:18
表2 hash
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-22 11:52:00
assuming n is unique in the 2nd table
复制代码
The hash object in the big data step can be replaced with a format.
Alternatively, not quite as efficient but acceptable
复制代码
Tweak the code above if n is not unique
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-23 07:39:06
hash对表的观测数量有限制的吧,不能太多。
我想知道有没有data数据步可以实现同样功能性
数据步效率高
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-24 11:46:27
有没有这种情况, 表二第一个观测的n和表一第一个观测的n1相等, 也和第二个观测的n5相等. 这样的话, 表二中一条观测就要和表一中一条观测匹配两次. 或者, 表一中第一个观测的两个变量n1 n2分别和表二的第一个观测, 第三个观测相等, 这样就要表一同一条观测和表二的两条观测匹配两次?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-25 18:58:26
没有。n1不会等于N2~N5
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群