悬赏 100 个论坛币 未解决
在Rwordseg中对于TXT文件分词的描述如下:
直接在函数中填入文件地址,运行后会在相同文件夹输出分词后的文件
输入:
1 > segmentCN("说岳全传_GBK.txt")
输出:
1 Output file: D:\说岳全传_GBK.segment.txt
2 [1] TRUE
但我自己使用的时候,结果是这样的:
> segmentCN("C:\\users\\Leon\\Documents\\test.txt")
[1] "c" "users" "leon" "documents" "test" "txt"
是把文件的地址给分词了,而不是文件的内容,求解决办法。
此外,如果不是对文件分词,而是对字符分词的话,使用returnType输出tm格式,发现无法使用,情况如下:
> segtest<- segmentCN(test, returntype="tm")
Error in segmentCN(test, returntype = "tm") :
unused argument (returntype = "tm")
请问这个问题如何解决?