全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据可视化
3074 1
2018-10-25
用R语言将将词频矩阵转换为数据框格式时,只出现了十个词语。并且最后的网络关系图也只有十个词语。如图。是出现了什么问题吗。代码如下:
train.rwordseg <- lapply(1:length(txt$Sentence), function(i) segmentCN(txt$Sentence, nature = TRUE))

wordcorpus <- Corpus(VectorSource(train.rwordseg))  #生成语料库

Sys.setlocale(locale="Chinese")
dtm1 <- DocumentTermMatrix(wordcorpus,control = list( wordLengths=c(4, Inf), # to allow long words
                                                      bounds = list(global = c(5,Inf)), # each term appears in at least 5 docs
                                                      removeNumbers = TRUE, # removePunctuation  = list(preserve_intra_word_dashes = FALSE),
                                                      weighting = weightTf, encoding = "UTF-8")) #转换数据格式

df_dtm1<-as.data.frame(inspect(dtm1))#将词频矩阵转换为数据框格式
df_dtm1 <- as.matrix(df_dtm1)

矩阵
网络图
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-10-25 20:39:30
我都找遍了也没有找到解决办法 就没有伸出援助之手的吗。。。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群