2007-2022年上市公司创新信息披露数据
1.指标衡量:创新信息关键词/文本语段长度*100
年报文本(2007-2022)
管理层讨论与分析部分(2007-2021)
2.方法:采用“种子词集+Word2Vec神经网络相似词扩充”的方法构建描述性创新指标。首先,阅读相关文献确定种子词汇;然后使用Word2Vec
神经网络相似词算法确定扩充词汇(共401个);最后将年报中描述性创新关键词集的词频之和占年报总词数的比例乘以100衡量描述性创新信息披露。
3.参考文献:
[1]韦琳,肖梦瑶.描述性创新信息能提高资本市场定价效率吗?——基于股价同步性的分析[J].财经论丛,2022(8):58-68.