全部版块 我的主页
论坛 休闲区 十二区 灌水吧
931 1
2019-12-25
我先自己制定了一个分词的词典,然后对需要分词的字段按词典存在的词组进行分词提取,字典不存在的忽略不分词不提取。

例如,我的词典为:(“计算机”,“软件工程”,“中外合作”,“电气类”)
需要分词的字段为: 计算机类(计算机科学与技术、软件工程)(学费:4500元/年)

我想要的分词提取结果为:计算机、软件工程


我知道可以设置停用词过滤不要的,但是我想分词只提取我想要的。因为不要的很杂没办法全部过滤,但是我知道我要的是什么。


请问R语言可以实现吗?如何操作?急求大神赐教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-1-20 13:56:03
wk <- worker(user = "E:/R-3.6.1/library/jiebaRD/dict/dict.txt",
             stop_word = "E:/R-3.6.1/library/jiebaRD/dict/stop.txt")
user 是设置的分词
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群