有两个数据集进行merge,一个为主表数据较大(billion级别record,20-30variables),另一个从表数据较小(thousands级别record,<=5variable)当对两个表进行merge或者bridge的时候,使用哪种方法的效率更高呢?
我现在能想到的有
proc sql
data merge(with and without index)
hash (内存有限,不确定)
proc format cntlin and put format
求大牛指点一下,哪种方法的效率最高,能排个顺序就更好了,多谢!