全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3649 6
2011-09-28
悬赏 25 个论坛币 未解决

AN

CPC

_LABEL_

ass

CN88103663.3

北京

ASS_3

北方交通大学

CN88101806.6

北京

ASS_2

北京大学

CN88105651.0

北京

ASS_2

北京大学

CN88103800.8

北京

ASS_2

北京联合大学机械工程学院

CN88101957.7

安徽

ASS_2

巢湖市人民医院

CN88104290.0

辽宁

ASS_4

东北工学院

CN88107318.0

广东;44

ASS_1

广东省湛江农业专科学校

CN88105659.6

广西;45

ASS_1

广西河池师范专科学校

CN88107217.6

广西;45

ASS_1

广西化工研究所

CN88109070.0

广西;45

ASS_1

广西化工研究所

CN88101243.2

广西;45

ASS_1

广西冶金研究所

CN88101534.2

贵州;52

ASS_1

贵阳市化学工业设计研究所

CN88105793.2

湖南;43

ASS_1

国家机械工业委员会第八设计研究院

CN88100617.3

北京;11

ASS_1

国家建筑材料工业局科学技术开发服务中心

CN88100259.3

法国;FR

ASS_1

国家科研中心

CN88102858

法国;FR

ASS_1

莫拉姆实验室

CN88102063

法国;FR

ASS_1

葡萄香槟开发集团

CN88102670.0

苏联;SU

ASS_1

汽车电子、汽车拖拉机电器装置科研生产联合企业

CN88103376.6

苏联;SU

ASS_1

汽车电子、汽车拖拉机电器装置科研生产联合企业

CN88108766.1

苏联;SU

ASS_1

全苏工业联合会绝缘装置专业技术设计局



这是我开始的表,其中ass变量分为4个类型:1表示大学,2表示研究机构,3表示企业,4表示公立机构
我希望通过编程能够实现如下表,即增加OT(机构类型)变量,能够自动识别ass变量的机构类型
判断的依据是:
(1)若ass变量中最后两个汉字为“大学”、“学院”、“学校”,则OT为1;
(2)若ass变量中最后三个汉字为“研究所”、“研究院”、“实验室”,或ass变量中最后两个汉字为“中心”则OT为2;
(3)若ass变量中最后两个汉字为“企业”、“集团”,则OT为3;(4)若ass变量中最后两个汉字为“医院”或ass变量中最后一个汉字为“局”,则OT为4;
最后生成的表如下:

AN

CPC

_LABEL_

ass

OT

CN88103663.3

北京

ASS_3

北方交通大学

1

CN88101806.6

北京

ASS_2

北京大学

1

CN88105651.0

北京

ASS_2

北京大学

1

CN88103800.8

北京

ASS_2

北京联合大学机械工程学院

1

CN88101957.7

安徽

ASS_2

巢湖市人民医院

4

CN88104290.0

辽宁

ASS_4

东北工学院

1

CN88107318.0

广东;44

ASS_1

广东省湛江农业专科学校

1

CN88105659.6

广西;45

ASS_1

广西河池师范专科学校

1

CN88107217.6

广西;45

ASS_1

广西化工研究所

2

CN88109070.0

广西;45

ASS_1

广西化工研究所

2

CN88101243.2

广西;45

ASS_1

广西冶金研究所

2

CN88101534.2

贵州;52

ASS_1

贵阳市化学工业设计研究所

2

CN88105793.2

湖南;43

ASS_1

国家机械工业委员会第八设计研究院

2

CN88100617.3

北京;11

ASS_1

国家建筑材料工业局科学技术开发服务中心

2

CN88100259.3

法国;FR

ASS_1

国家科研中心

2

CN88102858

法国;FR

ASS_1

莫拉姆实验室

2

CN88102063

法国;FR

ASS_1

葡萄香槟开发集团

3

CN88102670.0

苏联;SU

ASS_1

汽车电子、汽车拖拉机电器装置科研生产联合企业

3

CN88103376.6

苏联;SU

ASS_1

汽车电子、汽车拖拉机电器装置科研生产联合企业

3

CN88108766.1

苏联;SU

ASS_1

全苏工业联合会绝缘装置专业技术设计局

4



请各位快快帮我!!!

pat888.xls

大小:15.5 KB

 马上下载

附件

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-9-28 16:24:32
提供一种思路吧,用substr+length。代码不好看,试试也许能解决问题。
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-9-28 17:36:32
既然是Excel的表,就用Excel里的IF嵌套就可以了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-9-28 21:26:27
可以尝试用正则函数,如:
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-9-28 23:13:47
webgu 发表于 2011-9-28 16:24
提供一种思路吧,用substr+length。代码不好看,试试也许能解决问题。
现在想想,还用这种思路的话,用ksubstr,klength更好一点。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-9-28 23:49:51
YueweiLiu 发表于 2011-9-28 21:26
可以尝试用正则函数,如:
这样其实与LZ所定义的规则有冲突,如果不能保证是最后出现的关键词的话,比如:复旦大学附属医院,就会被错误地归入1而不是4
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群