R语言中的英文分词问题

3970

收藏 2016-05-10

library(tm)
library(NLP)
library(twitteR)
for (i in 11:15) { cat(paste("[[", i, "]] ", sep=""))+ writeLines(strwrap(rdmTweets[]$getText(), width=73))}
df=do.call("rbind",lapply(rdmTweets,as.data.frame))
dim(df)
library(tm)
myCorpus=Corpus(VectorSource(df$text))
myCorpus
myCorpus=tm_map(myCorpus,tolower)
myCorpus=tm_map(myCorpus,removePunctuation)
myCorpus=tm_map(myCorpus,removeNumbers)
removeURL <- function(x) gsub("http[[:alnum:]]*", "", x)
myCorpus <- tm_map(myCorpus, removeURL)
myStopwords <- c(stopwords('english'), "available", "via")
myStopwords <- setdiff(myStopwords, c("r", "big"))
myCorpus=tm_map(myCorpus,removeWords,myStopwords)
myCorpus[1]
myCorpusCopy=myCorpus
library(SnowballC)
library(RWeka)
myCorpus<-tm_map(myCorpus,stemDocument)
for (i in 11:15) { cat(paste("[[", i, "]] ", sep="")) +writeLines(strwrap(myCorpus[], width=73))}
myCorpus <- tm_map(myCorpus, stemCompletion, dictionary=myCorpusCopy)
myDtm = DocumentTermMatrix(myCorpus, control = list(minWordLength = 3))

Error: inherits(doc, "TextDocument") is not TRUE
进行到英文词向量矩阵的时候，报错如下，求各位大神指教一下，感激不尽！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

新手弱问一段R语言的意思

急求关于R语言MSG包用法

用R语言谱曲

关于R语言XLM爬数据的问题

R语言程序报错

麻烦大神看一下R语言这个错误怎么解决

用R语言网抓数据文本@求助！

R语言意思相同的两行代码，运行结果却不一样？

R语言中调取函数

R语言中保存数据出现大量重复

栏目导航

R语言论坛

经管高考

行业分析报告

市场营销

金融实务版

休闲灌水

热门文章

表格结构数据的核心特征及具象实例解析

2026太空算力发展研究报告

中国提振消费的战略选择与国际经验，提振消 ...

下载到假资源如何退单

高教现代数学基础23 矩阵计算六讲徐树方,钱 ...

【24顶刊热点!】2000-2024上市公司股价崩盘 ...

安徽全省一盘棋发力汽车产业

现代数学基础21 控制论中的矩阵计算徐树方

求Journal of Computational and Graphical ...

【24重磅,详细,顶刊热点!】2000-2024上市公 ...

推荐文章

2026JG学术冬训营:从Stata初高到Python机器 ...

【必看】【本版版规，欢迎发悬赏贴求助】

26年寒假天津站｜Gemini论文写作&数据分析 ...

关于如何利用文献的若干建议

关于学术研究和论文发表的一些建议

关于科研中如何学习基础知识的一些建议 (一 ...

一个自编的经济学建模小案例 --写给授课本科 ...

AI智能体赋能教学改革: 全国AI教育教学应用 ...

2025中国AIoT产业全景图谱报告-406页

关于文献求助的一些建议

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群