网上有一个《中文及英文的文本挖掘——R语言》的帖子。http://wenku.baidu.com/link?url=g5aw3voxuHC0QTza_KgHh05nQ_JPbo2g2BxuPtQOKQzy31KbgK6O-QLaItK7U1rCBSmWiYwXyb6rz3ViolH3BNgNzKW_U-A6Naa8sDvGGGe
其中有一段代码是
reut<-system.file("texts","crude",package='tm')
# 用Corpus命令读取文本并生成语料库文件由于要读取的是xml文件,所以需要xml包reuters <- Corpus(DirSource(reut), readerControl = list(reader = readReut21578XML))
然后作者说,用inspect(reuters[1:2]),可以看到
为什么我用这个
inspect(reuters[1:2]),看到的是下面这个呢?
<<VCorpus>>Metadata: corpus specific: 0, document level (indexed): 0Content: documents: 2[[1]]<<XMLTextDocument>>Metadata: 16[[2]]<<XMLTextDocument>>Metadata: 16
求指教,什么原因?