R语言进行中文文本挖掘出现乱码

用户名是啥

6399

收藏 2015-05-09

悬赏 30 个论坛币未解决

紧急求助：要对一系列文件进行中文文本挖掘，文件有1000多个，目前有txt格式和html格式的，现在想要做出tdm词条文档矩阵，代码该咋写？？现在仅是做了这一步（如图），就已经出现中文乱码了，原谅我是编程小白，求大神们帮忙。本人邮箱kezhenw001@163.com，

caseshare-txt版本.zip

大小:7.59 MB

只需: 10 个论坛币马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

用户名是啥

2015-6-9 09:59:32

搞定了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

smile108

2015-8-5 08:50:08

用户名是啥发表于 2015-6-9 09:59
搞定了

请问楼主怎么搞定的呢？分享下心得咯。我在用这个的时候也出现了一个小问题。nec nos aëriae voce中间这个aeriae显示错误……
还望楼主指导
代码：txt <- system.file("texts","txt",package = "tm")
writeLines(as.character(ovid[[2]]))

附件列表

BAHKKV19Y$(A}M2G@G13JOD.png

原图尺寸 1.61 KB