“词云”概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。其是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使阅读者只要一眼扫过就可以领略文本的主旨。本文简单介绍在R中如何绘制该图。
1命令如下1)设定工作环境
setwd("F:/Dropbox/R/map")
2)导入程序包
library(wordcloud)
library(tm)
3)读取及整理数据
crude<- tm_map(crude,removePunctuation)
crude<-tm_map(crude,function(x)removeWords(x,stopwords()))
tdm<-TermDocumentMatrix(crude)
m<-as.matrix(tdm)
v<-sort(rowSums(m),decreasing = TRUE)
d<- data.frame(word=names(v),freq=v)
4)绘制图示
wordcloud(d$word,d$freq,random.order=FALSE,colors=brewer.pal(8,"Dark2"))