这份【年报数据合集】包含了A股上市公司从2000年至2022年的年度报告信息,以面板数据的形式整理并提供了多种格式(Excel、PDF和TXT)供用户使用。以下是关于此数据集的详细说明:
### 数据概览:
- **数据名称**:上市公司年报面板数据
- **覆盖年份**:从2000年至2022年
- **数据范围**:A股所有上市公司的年度报告
- **更新时间**:预计于次年的1月进行数据更新(例如,2023年1月将包含截至2022年的数据)
- **格式提供**:
- 原始年报PDF和TXT文件
- 面板数据Excel (csv) 格式
### 数据整理与处理:
- **原始报告爬取**:从上市公司官方渠道或证券交易所获取原始年度报告。
- **文本面板化**:将报告内容转换成结构化的面板数据,方便分析使用。
- **保留关键信息**:在整理过程中,保留了中英文及数字等基本信息,并计算文本的总长度。
### 指标说明:
本数据集包含以下8个主要指标(具体指标名称可能根据实际提供的字段有所不同):
1. 股票代码
2. 公司简称
3. 年报标题
4. 发布年份
5. 年报内容全文文本总长度
6. 仅中英文数字统计的文本长度
7. 可能还包括其他如行业分类、主要财务指标等附加信息。
这样的数据集对于进行时间序列分析、文本挖掘、行业趋势研究及公司财务健康状况评估等多个方面提供了丰富的基础资料,是学术研究和市场分析的重要资源。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用