全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
7208 1
2018-05-08

用R语言做词云图首先要进行分词,R中有两个包Rwrodseg和jiebaR包可以实现分词,仔细对比两个包可以发现jieba包做的更好,功能函数要多一些。这里我们以红楼梦文本为例,进行文本分析。本文实现三个部分任务:


  •        Part 1:以红楼梦110回为例,做词云图;
  •        Part 2:统计介词和助词频率;
  •        Part 3:统计指定词频率。

       首先,我们把红楼梦文本数据读取进入R里面,使用scan函数读取,并结合正则表达式分章节,最后用sapply函数分开文本:
复制代码
      接下来完成Part1部分:
复制代码
     效果图如下:
Snipaste_2018-05-08_20-02-33.png
      Part 2部分代码如下:
复制代码
    Part 2部分结果为(左边第一列为行序号):
复制代码


      Part 3部分代码如下:
复制代码
     结果为
复制代码
      以上就是一个简单的词云图例子。
                                                                                           R语言爱好者 大珞珞
                                                                                             2018年5月8日

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-5-8 20:11:49
代码中数据文件请前往QQ群(538911602)下载!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群