现有网上的实例,多从 R与文本挖掘 一书中取例
library(NLP)
library(tm)
library(XML)
library(SnowballC)
reut21578 <- system.file("texts", "crude", package = "tm")
reuters <- Corpus(DirSource(reut21578), readerControl = list(reader = readReut21578XML))
以上皆成功,
但
> reuters <- tm_map(reuters, as.PlainTextDocument)
就出现 Error in match.fun(FUN) : 找不到对象'as.PlainTextDocument'
R版本 3.2.3,难道是tm包更新后 函数格式变更了吗?
求一份完整验证后的实例,我想好好学习一下。