数据介绍:
- 年份:2000-2023
- 范围:A股上市公司
- 两个版本:数字化转型虚拟变量(未剔除)、数字化转型虚拟变量(已剔除金融STPT)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
参考做法,进行如下数据整理计算:
1.生成数字技术应用总词频,所涉及的关键词包括:“数字化"“数字化转型"“数字技术"“数字平台”“大数据”“数据分析”“数据挖掘”“云计算"“云平台"“云服务""人工智能"“区块链”“物联网”“5G”“机器深度学习”“互联网产业"“互联网+”“工业互联网”。
2.生成业务模式转型总词频,涉及关键词“电子商务"和“网络销售”。
3.生成数字化转型虚拟变量,具体为年报中涉及到数字技术应用或■业务模式转型相关关键词的样本设为1,否则为0。
4.生成数字化转型虚拟变量的稳健性替代变量,将年报中既涉及数字技术应用又涉及业务模式转型关键词的样本设为1,否则为0。
处理软件:原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式
参考文献:
- 李琦,刘力钢,邵剑兵.数字化转型、供应链集成与企业绩效——企业家精神的调节效应[J].经济管理,2021,43(10):5-23.
代码:
数据量:
描述性统计:
结果数据