全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
8037 9
2017-04-25
求助救命,请教高人:
      用R语言做中文文本分析,分词后,准备做词云,代码如下:
      1.dtmxi<-DocumentTermMatrix(temp,control = list())
      2.inspect(t(dtmxi))
     错误信息如下:
     <<DocumentTermMatrix (documents: 4, terms: 2180)>>
     Non-/sparse entries: 3121/5599
    Sparsity           : 64%
    Error in nchar(Terms(x), type = "chars") :
    invalid multibyte string, element 1
    小白如何处理啊!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-7-27 20:38:07
解决了吗,也遇到了类似问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-7-27 21:14:58
qiaosangcc 发表于 2017-7-27 20:38
解决了吗,也遇到了类似问题
解决了,一个是文本的编码问题,如用tm包,文本编码必须是ANSI.另一个问题是文本中有不能识别的字符,如繁体字等。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-7-30 15:18:55
hayixiao 发表于 2017-7-27 21:14
解决了,一个是文本的编码问题,如用tm包,文本编码必须是ANSI.另一个问题是文本中有不能识别的字符,如繁 ...
我也遇到了这个问题,能给出具体解决步骤和代码嘛,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-17 03:35:29
请问您是怎么解决这个问题的,具体的代码是什么?谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-18 03:08:11
青青雅居 发表于 2017-8-17 03:35
请问您是怎么解决这个问题的,具体的代码是什么?谢谢!
文本编码问题,我是用文本软件如记事本转换的。繁体字转简体字用Word转换的,没有写代码。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群