上市公司年报文本 【最新齐全】1999-2023年上市公司年报文本包含Python代码+pdf+txt格式 5.6W打
持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据
【原创整理,严禁转载,转载必究】
参考文献
[1]姜付秀,王运通,田园,等.多个大股东与企业融资约束——基于文本分析的经验证据[J].管理世界,2017,(12):61-74.
[2]伊志宏,杨圣之,陈钦源.分析师能降低股价同步性吗——基于研究报告文本分析的实证研究[J].中国工业经济,2019,(01):156-173.
[3]胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156+11+19-21.
[4]黄大禹,谢获宝,孟祥瑜,等.数字化转型与企业价值——基于文本分析方法的经验证据[J].经济学家,2021,(12):41-51.
[5]任宏达,王琨.产品市场竞争与信息披露质量——基于上市公司年报文本分析的新证据[J].会计研究,2019,(03):32-39.
数据说明
数据区间:包含1999-2024中国上市公司年报文本
格式:包含PDF和TXT格式,适用于文本分析
爬虫代码:提供详细的Python爬虫代码,便于学习和掌握爬虫技术。
文件格式:下载的PDF文件已转化为TXT格式,便于后续文本分析和处理。
文件过滤:在PDF批量下载过程中,已对年报进行了筛选,剔除了非年报文件,并保留了最新更新或更正的年报。
文件名称:对年报文件名称进行了统一命名,格式为“股票代码_年度_股票简称_****报告_发布日期”
| 年份 | 样本 |
| 1999 | 489 |
| 2000 | 585 |
| 2001 | 1167 |
| 2002 | 1230 |
| 2003 | 1292 |
| 2004 | 1379 |
| 2005 | 1368 |
| 2006 | 1456 |
| 2007 | 1572 |
| 2008 | 1625 |
| 2009 | 1774 |
| 2010 | 2130 |
| 2011 | 2365 |
| 2012 | 2493 |
| 2013 | 2537 |
| 2014 | 2653 |
| 2015 | 2843 |
| 2016 | 3137 |
| 2017 | 3513 |
| 2018 | 3622 |
| 2019 | 3934 |
| 2020 | 4392 |
| 2021 | 4921 |
| 2022 | 5187 |
| 2023 | 5364 |
| 2024 | 5405 |
| 总计 | 68433 |
赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。
欢迎大家购买,采集数据花费大量时间,请勿转卖,谢谢支持!
如您在使用本数据集的过程中有任何疑问,随时欢迎联系,我们将竭诚为您提供帮助,直到您满意为止!如有任何问题,欢迎私信沟通,期待满足您的数据需求!
由于年报文件较大,本数据通过百度网盘链接形式提供
上市公司年报文本数据包含年报爬虫Python代码 文本分析必备
上市公司年报文本 【最新齐全】1999-2023年上市公司年报文本包含Python代码+pdf+txt格式 5.6W打
持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据