全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
23533 40
2014-03-28
淘宝123
淘宝网
淘宝买的
京东商城
!淘宝的
我有这样一列的数据,R语言中Rwordseg包分不出来,我如何自定词库(淘宝,....)对这列文本进行规范,哪位大哥能指教一下小弟..
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-28 09:42:28
通过安装自定义词典就行了
installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全【官方推荐】.scel',dictname="计算机",dicttype="scel")

> installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全【官方推荐】.txt',dictname="计算机",dicttype="text")

segmentCN(c("你好北京","今天是个好天气"))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-4 23:06:58
不错啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-16 09:38:25
hbwzhsh 发表于 2014-3-28 09:42
通过安装自定义词典就行了
installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全 ...
错误于installDict("F:\\myword.txt", dictname = "myword", dicttype = "text") :
  Wrong path of the dic file!
为什么会有这种错误,求解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-30 11:32:00
我想问一下为什么我installDict之后,4 words were loaded! ... New dictionary '自定义' was installed!但是进行分词的时候我自定义的词组都没有起作用,我是用Rstudio运行的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-12 18:30:58
拜托有些网友以后回复问题给出的方案是自己测验过得,很多经验贴都是抄别人的,根本不能解决问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群