经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
SAS专版
如何提高效率拼接数据?
楼主
hnmjx
2383
6
收藏
2013-11-21
我有两个表,需要并接。
第一个表内变量n1,n2,n3,n4,n5,n6 第二个表内变量n。(变量数据类型一致)
现在需要并接两个表,第一个表为准,第一个表内n1~n6,只要有一个等于第二个表内n,就并接。
现在我用sql 左连接,可是数据量大,效率很低,这一步需要运行10分钟。
希望有高手提供高效的并接方法。
谢谢
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
soporaeternus
2013-11-22 11:38:18
表2 hash
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
邓贵大
2013-11-22 11:52:00
assuming n is unique in the 2nd table
复制代码
The hash object in the big data step can be replaced with a format.
Alternatively, not quite as efficient but acceptable
复制代码
Tweak the code above if n is not unique
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
hnmjx
2013-11-23 07:39:06
hash对表的观测数量有限制的吧,不能太多。
我想知道有没有data数据步可以实现同样功能性
数据步效率高
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
吕小布韦
2013-11-24 11:46:27
有没有这种情况, 表二第一个观测的n和表一第一个观测的n1相等, 也和第二个观测的n5相等. 这样的话, 表二中一条观测就要和表一中一条观测匹配两次. 或者, 表一中第一个观测的两个变量n1 n2分别和表二的第一个观测, 第三个观测相等, 这样就要表一同一条观测和表二的两条观测匹配两次?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
地板
hnmjx
2013-11-25 18:58:26
没有。n1不会等于N2~N5
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
点击查看更多内容…
7楼
hnmjx
2013-11-25 22:05:17
我是用
proc sql;
create table t as
select
a.*,b.*
on a.n1=b.n or a.n2=b.n or a.n3=b.n or a.n4=b.n or a.n5=b.n;
quit;
结果提示我无法优化的catersian产品链接。
这段代码运行了10分钟。真受不了
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
如何提高迅雷的下载速度?
叫你如何提高记忆的好书
MERGE 效率问题
经管考研
如何提高在线调查问卷的答卷回收率
朝九晚五的程序员如何提高开发技能
如何提高自控力
如何提高学术英语能力?
3C企业如何提高竞争力 自动化生产带来机遇
2017年注册会计师备考,如何提高效率
栏目导航
SAS专版
学道会
爱问频道
宏观经济学
情感交友
求助成功区
热门文章
2026“课题申报”抢跑号角的已吹响!国社科 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CDA 数据分析师:特征处理核心指南
电子行业深度报告:量子深潜-计算篇:从比特 ...
中国财经文本语料数据
您提出了一个足以获得诺贝尔奖的核心概念— ...
您提出了一个足以获得诺贝尔奖的核心概念— ...
2025年10月23日黄金行情分析
制造业全要素生产率(2000-2024年)
签个到
推荐文章
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
高校老师和学生都在偷偷上的智能体课,到底 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群