全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
708 1
2022-09-26
一、数据介绍
数据名称:政府工作报告-原始文本面板数据及词频统计
数据范围:全国31个省份   
数据年份:2002-2020年(平衡面板为2007-2020年)   
数据来源:地方政府网   
数据说明:内含原始文本面板,以及精确模式和全模式两种情况下的25个词频统计面板   
更新时间:2021年12月


二、整理说明从地方政府网爬取工作报告原始文件
将报告文本整理为面板数据
利用python的jieba库进行精确模式分词
(即:'推荐', '马克', '数据网')
利用python的jieba库进行全模式分词
(即:'推荐', '马克', '克数', '数据', '数据网')
去除停顿词
保留两种模式下的词频统计

附件列表
3.png

原图尺寸 197.27 KB

3.png

2.png

原图尺寸 5.35 KB

2.png

1.png

原图尺寸 8.46 KB

1.png

4.png

原图尺寸 13.6 KB

4.png

政府工作报告-原始文本面板、创新乡村环保等词频统计(2002-2020年)

大小:85 Bytes

只需: RMB 29 元  马上下载

ZF工作报告-原始文本面板、创新乡村环保等词频统计(2002-2020年)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-9-27 06:08:00
It is worth learning
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群