另类数据在如今实证研究变得越来越重要,而上市公司的年报文本挖掘是一项非常有意思的工作。最近笔者看到有不少小伙伴有这样的需求,特用python做了相关的爬虫并年报关键词统计分析工作。
 
1、获得公开的年报文本,这里需要知道上市公司年报的链接,笔者通过新浪财经实现了目标;
 
2、根据年报文本信息,抓取关键词及其他操作,本案例一
人工智能和区块链作为统计关键词。
 
 A股上市公司年报关键词统计.zip
大小:(2.89 MB)
A股上市公司年报关键词统计.zip
大小:(2.89 MB)
只需: RMB 499元
 马上下载
本附件包括:
- A股年报文本url.xlsx
- annual_report_spyder.py
- 年报关键词统计_2011~2020.xlsx
- A股代码.xlsx