上市公司竞争战略成本领先差异化战略年报词频统计2001-2021数据关键词词集
数据来源:基于上市公司年报数据整理计算
数据范围:沪深上市公司,A股主板中小企业板科创板创业板
数据期间:2001-2021
| security_code | security_name | rep_period | rep_type | release_date | rep_size | cnt_char | cnt_word | cnt_sent | cost | diff |
1 | 平安银行 | 2001/12/31 | 财务报告全文 | 2002/4/18 | 422k | 34266 | 15842 | 191 | 0.002462 | 0.00202 |
1 | 平安银行 | 2002/12/31 | 财务报告全文 | 2003/4/24 | 338k | 37550 | 17373 | 1043 | 0.002072 | 0.001381 |
1 | 平安银行 | 2003/12/31 | 财务报告全文 | 2004/4/15 | 356k | 36714 | 16903 | 1004 | 0.002011 | 0.001538 |
1 | 平安银行 | 2004/12/31 | 财务报告全文 | 2005/4/26 | 430k | 48039 | 21896 | 1265 | 0.001461 | 0.000913 |
......
字段 字段标题 字段说明
security_code 证券代码 以上海证券交易所和深圳证券交易所公布的证券代码为准。
security_name 证券简称 以上海证券交易所和深圳证券交易所公布的公司最新证券简称为准。
rep_period 报告期间 报告对应会计期间截止日期,格式为“YYYY-MM-DD”。
rep_type 报告类型 文本数据源类型。
rep_link 报告链接 年报原文链接。
release_date 发布日期 年报发布日期,格式为“YYYY-MM-DD”。
rep_size 报告大小 年报文档大小,单位:KB。
cnt_char 总字数 年报总字数。
cnt_word 总词数 年报总词数。
cnt_sent 总句数 年报总句数。
cost 成本领先战略 年报成本领先战略指标词集对应的词频总和除以报告文本的总词数
diff 差异化战略 年报差异化领先战略指标关键词词集对应的词频总和除以报告文本的总词数
现有文献中的【成本领先战略】关键词集由125个扩展至227个词,并提供加总词频统计。
数据范围为2001-2021年上市公司年度报告全文,数据包含股票代码,年份,年报总词频(去停用词,数字,单位,日期,序号等),成本领先战略总词频,成本领先战略占比。
现有文献中的【差异化战略】关键词集由165个扩展至451个词,并提供加总词频统计。
数据范围为2001-2021年上市公司年度报告全文,数据包含股票代码,年份,年报总词频(去停用词,数字,单位,日期,序号等),差异化战略总词频,差异化战略占比。
一共包含50202条年报数据。
请参考文献:
胡楠等. 2020. 竞争战略与盈余质量--基于文本分析的实证分析.当代财经