统计词频出了问题，望大神帮忙 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛

统计词频出了问题，望大神帮忙

4629

4

收藏 2016-10-11

悬赏 27 个论坛币未解决

利用jiebaR切词，然后想统计词频出了问题，下面是代码：

library(jiebaR)
seg=qseg <= "F://jiebar.txt"
seg=seg[nchar(seg)>1]
seg=table(seg)

seg=seg[!grep('[0-9]+',names(seg))]
length(seg)

结果是为0 没有结果

又改了下代码，
f <- scan('F://jiebar.txt',sep='\n',what='',encoding="UTF-8")
seg <- qseg[f] #使用qseg类型分词，并把结果保存到对象seg中
到了这一步就出错了

Error in file.exists(code) : 转换文件名时出了问题--名字太长了？

望帮助，帮改或教我如何正确统计词频，谢谢
附件：

jiebar.txt
大小:(5.19 MB)

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2016-10-12 09:49:40

此帖仅作者可见

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2016-10-12 09:52:25

此帖仅作者可见

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2016-10-12 20:00:35

此帖仅作者可见

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-3-31 10:59:42

此帖仅作者可见

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群