数据介绍:
- 年份:2000-2023
- 范围:A股上市公司
- 三个版本:数据要素(未剔除未缩尾)、数据要素(已剔除金融STPT未缩尾)、数据要素(已剔除金融STPT已缩尾)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
 
 
计算说明:
【数据要素相关关键词总词频】数据要素相关关键词:数据要素、大数据、算力、信息、数据化、算法。从上市公司年报中提取各个关键词词频,并进行加总后即为总词频。
【Indata】 Indata=In(数据要素相关关键词总词频+1)。
注:原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式。
参考文献:
- 赵丽,胡植尧.数据要素、动态能力与企业全要素生产率——破解“数据生产率悖论"之谜[J].经济管理,2024,46(07):55-72.
 
 
代码:
 
数据量:
 
描述性统计:
 
结果数据
