全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6319 3
2015-05-09
悬赏 30 个论坛币 未解决

紧急求助:要对一系列文件进行中文文本挖掘,文件有1000多个,目前有txt格式和html格式的,现在想要做出tdm词条文档矩阵,代码该咋写??现在仅是做了这一步(如图),就已经出现中文乱码了,原谅我是编程小白,求大神们帮忙。本人邮箱kezhenw001@163.comQQ图片20150509204420.png

caseshare-txt版本.zip

大小:7.59 MB

只需: 10 个论坛币  马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-9 09:59:32
搞定了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-5 08:50:08
用户名是啥 发表于 2015-6-9 09:59
搞定了
请问楼主怎么搞定的呢?分享下心得咯。我在用这个的时候也出现了一个小问题。nec nos aëriae voce中间这个aeriae显示错误……
还望楼主指导
代码:txt <- system.file("texts","txt",package = "tm")
writeLines(as.character(ovid[[2]]))
附件列表
BAHKKV19Y$(A}M2G@G13JOD.png

原图尺寸 1.61 KB

BAHKKV19Y$(A}M2G@G13JOD.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-6 09:57:25
将R和Rstudio升级到最新版本,完美解决问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群