[R资源]基于R语言下的文本挖掘一些资料

fantuanxiaot

2015-2-12 18:57:30

Freddy0110 发表于 2015-2-12 18:18
R语言高手哦

如果介绍好原创直接加精

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

ahwhat

2015-2-13 07:32:40

来看看是咋样的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

cglee

2015-2-28 10:52:28

支持一下了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

chengganglee

2015-2-28 13:53:17

支持一下！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

quwuxi

2015-3-7 11:39:46

xiwangyoushijianxuexiyixia

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

小沫紫竹

2015-3-7 15:10:33

多谢分享。。。。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

17897

2015-3-7 21:16:57

好东西，肯定要支持！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

quwuxi

2015-3-7 21:19:06

回复本帖可获得 2 个论坛币奖励! 每人限 1 次

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

17897

2015-3-8 14:12:28

支持！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

YONGHU33

2015-3-12 17:10:05

多谢楼主！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

commercial

2015-3-14 16:31:43

不记得回复过没有

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

cindyyang0329

2015-3-21 20:57:08

好东西多学习

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

YULAN_YULAN

2015-4-14 10:01:58

毕业设计做这个模块，刚好要用到。。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

YULAN_YULAN

2015-4-14 10:05:03

YULAN_YULAN 发表于 2015-4-14 10:01
毕业设计做这个模块，刚好要用到。。。。

有没有不用积分就下载到的.....

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhuafeng2008

2015-4-21 08:14:18

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nsm120

2015-7-11 13:04:35

赞了好东东

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

phychosis

2015-7-11 14:58:56

谢谢楼主

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

pengdonghappy

2015-8-5 13:20:07

145xyz 发表于 2015-1-11 20:05
R 的好东西怎能不看

怎么看不见资料呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

pengdonghappy

2015-8-5 13:20:12

145xyz 发表于 2015-1-11 20:05
R 的好东西怎能不看

怎么看不见资料呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

郑志刚

2016-1-22 22:23:46

谢谢了，先学习下

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

风雨兼程12

2016-3-10 17:37:59

帖子很好，只是有个问题想请教一下，第二个pdf文档中，我自己在做实验的时候
txt<-Corpus(VectorSource(text))
txt<-tm_map(txt,removeNumbers)#去除数字
txt<-tm_map(txt,stripWhitespace)#去除多余空格
txt<-tm_map(txt,removePunctuation)#去除标点符号
txt<-tm_map(txt,removeWords, stopwords("english"))#将英文中的停词删掉
txt<-tm_map(txt,PlainTextDocument)#去掉空文件
前面这部分都没有问题，文档结果显示的是这个样子
<<VCorpus>>
Metadata:  corpus specific: 0, document level (indexed): 0
Content:  documents: 400
里面有400个文件，这个没有问题，可是为什么分词之后
txt<-segmentCN(as.character(txt))#将语料库中的中文时行分词
txt<-Corpus(VectorSource(txt))#出现了问题
现在形成的语料库显示的是
<<VCorpus>>
Metadata:  corpus specific: 0, document level (indexed): 0
Content:  documents: 3
只有3个文件，这是什么情况？
其实我有400个文档，我想形成的文档词条矩阵应该是400行的，而他只有3个文件，最后形成的文档也应该是3行的，这个怎么回事？跪求大神指导！！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

风雨兼程12

2016-3-12 17:21:31

请问一下大侠这里面第二个文档是不是有点问题啊就是关于停用词那一块的感觉不对啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

soccy

2016-3-12 17:42:23

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jacksum5

2016-3-14 23:34:05

多谢分享……

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

陌Moderato

2017-4-11 13:50:28

学习了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

没有Ru果

2017-5-29 15:38:53

下载不了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mjuwxyou

2021-10-20 22:34:45

回复本帖可获得 2 个论坛币奖励! 每人限 1 次

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群