数据介绍:
- 年份:2000-2023
- 范围:A股上市公司
- 三个版本:企业数字赋能(未剔除未缩尾)、企业数字赋能(已剔除金融STPT未缩尾)、企业数字赋能(已剔除金融STPT已缩尾)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
【企业数字赋能】参考文献使用数字化词频-逆文本频率(TF-IDF)来刻画企业数字赋能情况。具体地,计算方法如下:首先计算逆文本频率TF-IDF中的TF项,词语w的TF=In(词语 的词频/企业当
年年报总词数+1)。之后,在所有年报中统计包含词语w的年报的数量。 然后 计算逆文本频率TF-IDF中的IDF项,词语w的IDF=In[年报总数/(包含词语w的的年报数+1),本资科剔除B股数据后年报总数为62113个,因此年报总数为62113。在计算了词集中所有词的作项和IDF项之后,即可计算整个词集的逆文本频率TF-IDF=Zw(TFw×IDFw),即每个词的F项与IDF项相乘后加总。

注:词频数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式。具体关键词参考吴非等(2021)的数字化转型词集(数字化转型词集参考义献:吴非,胡慧芷,林慧妍,等.企业数字化转型与资本市场表现——来自股票流动性的经验证据J]管理世界,2021,37(07):130-144+10.)。
参考文献:
- 耿景珠,杜明威,刘文革企业数字赋能与全球价值链嵌入[J].当代财经,2023.(08):122-133.
代码:
数据量:
描述性统计:
结果数据