全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1158 3
2015-05-12
我有两个数据集  A 和 B   A                                                                                            
yearXX1

2000

山东省鲁能a

2001

北京电子b

2002

深圳市北海轮胎g

2003

海天酱油武汉f

数据集B
year1YY1

2000

山东鲁能2

2001

古古怪怪3

2002

北海轮胎深圳5

2003

跳跳糖条6
我想得到数据集C 如下:
yearXX1year1YY1
2000山东省鲁能a2000山东鲁能2
2002深圳市北海轮胎g2002北海轮胎深圳5
2001北京电子b...
2003海天酱油武汉f...
请问如何实现啊?
其实这个问题  有两步关键:第一步:删除“省”   “市”  这样的字符
第二步:模糊匹配   也就是说   变量 X 和变量Y 中的汉字一样但是前后顺序不同仍视为  相等   
谁能给解决一步也行啊,各位达人  求赠命令   O(∩_∩)O谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-5-13 09:51:25
哎呀   顶顶  达人赠个code吧   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-13 17:03:04
请问,x,y是否完全为中文,不会中英文混合,或单独英文?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-13 17:27:18
zhengbo8 发表于 2015-5-13 17:03
请问,x,y是否完全为中文,不会中英文混合,或单独英文?
嗯  一部分是中文里面混合英文字母  其余全中文
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群