全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3064 2
2015-07-28
分词时用这个语句:words = unlist(lapply(X = res,FUN = segmentCN))后,一些文件出现:“转换文件名时出了问题--名字太长了?”这个错误。求大神说下解决方法啊。
还有使用:
segmentCN("H:/123.txt")
test<- readLines("H:\\123.txt",encoding='UTF-8')
res=test[test != " "]
words = unlist(lapply(X = res,FUN = segmentCN))
word = lapply(X = words,FUN = strsplit," ")
v = table(unlist(word))
v = sort(v,deceasing=T)
head(v)
d = data.frame(word = names(v),freq = v)
write.csv(d, file="H:\\C.txt", row.names=FALSE)
进行分词和统计不管什么文件老是出现相同的结果,始终那么几个没见过的字进行的词频处理。是不是哪里出错了?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-29 09:12:02
急急,求大神
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-1-6 11:29:46
解决了吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群