全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
2228 4
2022-07-23

上市公司年报关键词爬取 2007-2021


【注】纯小白版本,已经写好了代码的整体使用说明,可能出现的错误也进行了总结,整体流程已经测试完毕,全流程可运行。

一、数据说明

  ①包含2007-2021年所有的年报txt文件

  ②年报关键词爬取的Python代码(两种)

        (1)基于Jieba分词库进行——适合同一类型的词频总数的统计,比如数字化转型一系列词频的统计。

        (2)快速基本版本,直接在Python中输出关键词,爬取速度非常快,适合需要每个关键词词频的情况。

   ③提供各个代码的使用说明

   ④批量PDF转txt的代码

   ⑤年报中总字数、总词频数、总句子数


二、数据展示
捕获.PNG
jieba使用说明.PNG




捕获1.PNG 捕获2.PNG


上市公司年报关键词爬取 2007-2021
大小:(76 Bytes)

只需: RMB 66元  马上下载



附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-11-30 17:55:40
您好,请问一下上面66元和999元是否有区别?
66元包含2007-2021年的代码、txt等所有材料吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-12-16 09:43:00
【注】纯小白版本,已经写好了代码的整体使用说明,可能出现的错误也进行了总结,整体流程已经测试完毕,全流程可运行。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-2-1 16:47:16
买了楼主的资料,现遇到如下问题,求解答:txt文档中,关键词内部如果有空格统计词频时会统计不上,比如“大数据”能统计上,但是“大  数据”就统计不上,请问楼主这个怎么解决?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-3-28 09:01:17
插眼cy
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群