全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2349 8
2016-10-05
悬赏 100 个论坛币 未解决
老板要我把中国工业企业数据库的资料和CSMAR上的资料合并起来(通过中文名字匹配),用excel做工作量太大,只能手动的去搜索关键字。 求高手能不能用SAS帮忙做这个模糊合并的工作。下面是具体的excel文件
merge.xlsx
大小:(23.61 MB)

 马上下载





下面是具体的excel里的内容
55DB.tm.png
A-C列是CSMAR中我们留下来的数据 G-K列是中国工业企业数据库的资料。 要求: 如何C列的企业在I列中有, 就把F列的firm id 记录到E列的firm code 里面。 因为很多公司名字在两个数据库不是完全一样的, 比如说A 公司在 C列中叫做A 公司, 可能在I列里面叫做A 集团。  有描述的不详细的地方,可以给我发消息我会仔细说一下。

也可以手动在excel里面一个一个的做 求帮忙
可有偿做 具体信息qq:3444148576
607D.tm.png

原图尺寸 87.1 KB

607D.tm.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-10-5 11:04:50
先把数据导入sas。
data;两个数据集,加入是a,b。
然后语句格式是:
data c;
merge a b;
by var(变量名)
run;

采纳呀MUA!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-5 13:35:30
对你的问题, 有两点要澄清,1. 是CSMR与工业数据和并,或是工业数据与CSMR和并, 或是企业在任何两个数据出现,都需要合并。2.合并数据前需要对数据排序。对工业数据库中,企业名称输入不规范,比如天津市企业名称前带有*,或(, 或空格。这样的数据排序后,无法与对应的企业匹配。建议在EXCEL中将数据清洁整理。然后导入SAS,对企业名称排序后,按楼上的建议合并数据。并设定条件,是A与B合并, 或B与A和并,或A和B都合并。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-5 21:22:46
用stockid去爬公司的中文名,然后再做merge.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-6 09:51:23
NOIL 发表于 2016-10-5 21:22
用stockid去爬公司的中文名,然后再做merge.
有公司的中文名 第三列就是
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-6 10:09:10
llulla 发表于 2016-10-5 13:35
对你的问题, 有两点要澄清,1. 是CSMR与工业数据和并,或是工业数据与CSMR和并, 或是企业在任何两个数据出 ...
确实很多数据老师在下载过程中出了错误,导致出现你所说的* ( , 空格)等问题。 我已经在excel中用Vlookup 把C列和I列中名字完全一样的找出来了  现在存在的问题就是有很多企业的名字在这两列里面不是完全相等的,只能是近似相等。 那个merge by的方法不适用, 而且 sql的like选项好像只能是英文字符的匹配。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群