请教一个文本挖掘tm包的问题

1825

收藏 2015-09-01

网上有一个《中文及英文的文本挖掘——R语言》的帖子。http://wenku.baidu.com/link?url=g5aw3voxuHC0QTza_KgHh05nQ_JPbo2g2BxuPtQOKQzy31KbgK6O-QLaItK7U1rCBSmWiYwXyb6rz3ViolH3BNgNzKW_U-A6Naa8sDvGGGe
其中有一段代码是
reut<-system.file("texts","crude",package='tm') # 用Corpus命令读取文本并生成语料库文件由于要读取的是xml文件，所以需要xml包reuters <- Corpus(DirSource(reut), readerControl = list(reader = readReut21578XML))
然后作者说，用inspect(reuters[1:2])，可以看到

为什么我用这个inspect(reuters[1:2])，看到的是下面这个呢？
<<VCorpus>>Metadata: corpus specific: 0, document level (indexed): 0Content: documents: 2[[1]]<<XMLTextDocument>>Metadata: 16[[2]]<<XMLTextDocument>>Metadata: 16

求指教，什么原因？