全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2918 9
2012-12-26
悬赏 50 个论坛币 已解决
各位大牛,求助!
知道各位不差钱,象征性悬赏一下最优答案,截止本周末,希望各位帮助:
我的数据数据是这样的:c是类别,后面是职位名称,
cname
财务/审计/税务财务主管
财务/审计/税务.财务储备干部
财务/审计/税务会计助理
财务/审计/税务销售财务
财务/审计/税务科技财务顾问
IT支持及其它售前/售后技术支持工程师
IT支持及其它技术支持工程师(电信)
IT支持及其它IT技术支持工程师 554BF91CA5


对应的,我需要在“财务/审计/税务”类别里的数据里面查找name中查找我感兴趣的关键词,这里有两个,分别是
“财务主管”和“财务顾问”,如果该name中含有这两个关键词,则在kw中标记出来,没有就显示“无”,如下
cnamekw
财务/审计/税务财务主管财务主管
财务/审计/税务.财务储备干部
财务/审计/税务会计助理
财务/审计/税务销售财务
财务/审计/税务会计助理(电脑开票专员)
财务/审计/税务会计助理
财务/审计/税务财务核算岗
财务/审计/税务会计
财务/审计/税务科技财务顾问财务顾问


看到这里还很简单,问题在于,不同的类别里面关注的关键词不同,
比如,在“财务/审计/税务”类里面,我关注的关键词有18个,在“IT支持及其它”类里面,我关注的完全不同的关键词有24个。
然后我一共有37个类别,每一类关注不同数量的不同的关键词。简化的原数据和类别对应表见附件。

最蠢的办法是(我的办法),把原始数据按每一个类别分成37个子文件,在每个子文件里面find各类对应的关键词,然后把所有的结果拼起来。

我能想到方便一点的解决方案是,二维数组,但是不会用,请大大们指点个方向也行,多谢了!

如果征集到了好的方法,我会系统的整理出关键字、问题描述和解决方案供讨论和交流的,请多多支持!

原始数据.xls
大小:(22 KB)

 马上下载





最佳答案

ziyenano 查看完整内容

proc import out=origin datafile="E:\原始数据.xls" replace; run; proc import out=keyword datafile="E:\分类关键词目录.xls" replace; run; proc sql; create table res as select a.*,b.key_word as kw from origin a left join keyword b on a.c=b.c and kindex(a.name,b.key_word) ne 0; quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-26 15:53:01
proc import out=origin
datafile="E:\原始数据.xls"
replace;
run;
proc import out=keyword
datafile="E:\分类关键词目录.xls"
replace;
run;
proc sql;
create table res as
select a.*,b.key_word as kw from
origin a left join keyword b
on a.c=b.c and kindex(a.name,b.key_word) ne 0;
quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-26 17:13:51
复制代码

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-26 17:37:24
老师她摸我 发表于 2012-12-26 17:13
老师她……
感谢回复,学习了!多谢!
然而,拿到我的真实场景里,这样还是要一个一个的输入所有的c,一共37个,以及所有的Kw小类,
我将来可能面临的类别比这个还多,甚至上升一个数量级,
所以还是想看一看有没有更简单的办法,刚刚开始,我还是想贪婪一点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-26 17:39:41
ziyenano 发表于 2012-12-26 16:52
proc import out=origin
datafile="E:\原始数据.xls"
replace;
ziyenano:这个看起来靠谱!多谢!
我明天试一下,如果行,那真的非常感谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-26 17:40:12
ziyenano 发表于 2012-12-26 16:52
proc import out=origin
datafile="E:\原始数据.xls"
replace;
这个看起来靠谱!多谢!
我明天试一下,如果行,那真的非常感谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群