利用jiebaR切词,然后想统计词频出了问题,下面是代码:
library(jiebaR)
seg=qseg <= "F://jiebar.txt"
seg=seg[nchar(seg)>1]
seg=table(seg)
seg=seg[!grep('[0-9]+',names(seg))]
length(seg)
结果是为0 没有结果
又改了下代码,
f <- scan('F://jiebar.txt',sep='\n',what='',encoding="UTF-8")
seg <- qseg[f] #使用qseg类型分词,并把结果保存到对象seg中
到了这一步就出错了
Error in file.exists(code) : 转换文件名时出了问题--名字太长了?
望帮助,帮改或教我如何正确统计词频,谢谢
附件: