数据名称:政府工作报告-原始全文(1954-2024年)秒发
数据内容:政府工作报告文本数据覆盖三级政府部门,
数据时间:中央(1954-2024)、省级(2002-2024)、地级市级(2002-2024)
数据来源:地方政府网
2024年11月上新 作者自用
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
➤保留中英文、数字,统计全文文本总长度
➤保存原始文本、txt文件、文本长度、词频总数
只需: RMB 30元 马上下载
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝