全部版块 我的主页
论坛 休闲区 十二区 休闲灌水
487 2
2021-02-02
我现在有一批用户数据,里面有一个字段是用户职业,但记录的很乱。比如,“教师”这个职业,被记录为“老师”、“师”、“teacher”等各种表述方法。我现在需要分析用户的职业分布,需要归并这些杂乱的文字记录数据,不知道有没有什么可用的工具、软件?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-2-2 17:45:59

遇到这样的情况,我一般都找找规律,比如包含哪些关键词的,就替换成“教师”,同时已经替换过的后面标记1,最后检查一下,凡是没有标记或者多次标记的都手动检查一遍。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-2-2 17:47:10
非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群