全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 Excel
2663 6
2010-09-23
悬赏 10 个论坛币 已解决
我在做一个非常繁琐的楼盘片区归类问题。有两张表,一张是要归类的原始表,里面是我要归类的楼盘;一张是楼盘字典,里面有所有的楼盘及其片区信息。我要做的是根据楼盘字典,把原始表里面的楼盘的片区查找出来。
        问题是这样的,原始表里面的楼盘名称和字典里面的楼盘名称有很多出入,精确查找就无法做到。比如原始表里面是:凯丰花园(二期)、江西世纪豪庭(江西大厦)、光纤小区3号综合楼、深业.岭秀名苑、碧海*富通城、汇港名苑。而在楼盘字典里就是:凯丰花园、江西大厦、光纤小区、岭秀名园、碧海富通城、汇港名园。多字少字写错字都有,但是里面基本都有重复的几个字,位置字数都不一样。
        我在这里求教各位高手帮我解决下,在下感激不尽!
ps:下面附件里的楼盘只是其中一部分,其他还有很多,楼盘字典里面也是。我想知道怎么弄,先谢谢了!

原始表.xls

大小:132 KB

 马上下载

楼盘字典.xls

大小:237 KB

 马上下载

最佳答案

silencelove 查看完整内容

更新了一下,与上面的相比查到的更多,但是精确度没有上面的高。供参考
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-9-23 12:25:08
更新了一下,与上面的相比查到的更多,但是精确度没有上面的高。供参考
附件列表

pipei1.xls

大小:382.5 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-9-24 09:42:29
天哪!这里就没有高手可以帮帮我吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-9-24 10:01:11
我看了你的文件。只是你的要求太高了,这个模糊标准有点难。因为如果只是一个单词是另一个的一部分,那么有问题。但是你还有错别字,这个怎么模糊啊?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-9-24 11:58:32
3# silencelove

因为里面即使有错别字,但还是有几个字是相同的。我想找出有相同字最多的进行配对,这样准确性会比较高。比如说“汇港名园”写成“汇港名苑”,但是还是有三个字是相同的。不知道怎么实现查找?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-9-25 09:49:56
4# feixueshuai
帮你做了一下,请查看附件。
附件列表

pipei.xls

大小:359.5 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群