全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4803 1
2022-02-25
老师们好,我有一个关于R语言模糊匹配的问题,就是我有两个关于医院的数据包,一个是医院名称+地理信息,一个是医院名称+招聘信息,因为两个包不是一个地方下的所以医院名称不统一,所以想通过模糊匹配实现数据包的合并,我先尝试把医院名称都做了分词,之后再用merge匹配不成功,想问一下有没有好的解决方法?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-2-26 07:31:33
library(fuzzyjoin)
regex_left_join(A, B, by = c(医院名称 = "医院名称"))
#by参数中第一个医院名称是A的变量名,第二个“医院名称”是B的变量名
#不一定能实现完全精准匹配,结果需要人工核对
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群