全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4536 4
2016-10-11
悬赏 27 个论坛币 未解决
利用jiebaR切词,然后想统计词频出了问题,下面是代码:

library(jiebaR)
seg=qseg <= "F://jiebar.txt"
seg=seg[nchar(seg)>1]
seg=table(seg)

seg=seg[!grep('[0-9]+',names(seg))]
length(seg)

结果是为0  没有结果

又改了下代码,
f <- scan('F://jiebar.txt',sep='\n',what='',encoding="UTF-8")
seg <- qseg[f] #使用qseg类型分词,并把结果保存到对象seg中
到了这一步就出错了

Error in file.exists(code) : 转换文件名时出了问题--名字太长了?


望帮助,帮改或教我如何正确统计词频,谢谢
附件:
jiebar.txt
大小:(5.19 MB)

 马上下载


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-10-12 09:49:40
此帖仅作者可见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-12 09:52:25
此帖仅作者可见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-12 20:00:35
此帖仅作者可见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-31 10:59:42
此帖仅作者可见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群