全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5711 5
2014-01-18
悬赏 100 个论坛币 未解决
在Rwordseg中对于TXT文件分词的描述如下:

直接在函数中填入文件地址,运行后会在相同文件夹输出分词后的文件
输入:
1 > segmentCN("说岳全传_GBK.txt")
输出:
1 Output file: D:\说岳全传_GBK.segment.txt
2 [1] TRUE


但我自己使用的时候,结果是这样的:

> segmentCN("C:\\users\\Leon\\Documents\\test.txt")
[1] "c"         "users"     "leon"      "documents" "test"      "txt"


是把文件的地址给分词了,而不是文件的内容,求解决办法。

此外,如果不是对文件分词,而是对字符分词的话,使用returnType输出tm格式,发现无法使用,情况如下:

> segtest<- segmentCN(test, returntype="tm")
Error in segmentCN(test, returntype = "tm") :
  unused argument (returntype = "tm")


请问这个问题如何解决?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-28 16:34:20
是returnType不是returntype;可以把C:\\users\\Leon\\Documents\\设置为工作目录就可以啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-24 17:02:10
应该是把文本先读入内存吧……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-6 17:06:40
同问 解决了吗楼主??
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-6 17:14:53
楼主 你那个test是不是是一个文件夹? 这个后面必须加详细的txt文件名
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-7 11:17:43
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群