参考文献:赵宸宇,王文春,李雪松.数字化转型如何影响企业全要素生产率[J].财贸经济,2021,42(07):114-129.DOI:10.19795/j.cnki.cn11-1166/f.20210705.001.
数据描述:本文使用文本分析法和专家打分法构建制造业企业的数字化转型指数。首先,使用文本分析法构建 DIGI_text 变量。第一步,收集2008-2017年制造业上市公司的年度报告并转换为文本格式然后通过 Python 提取经营情况分析部分的文本。第二步,通过人工判断的方式抽取一定数量的数字化转型较为成功的企业样本。第三步,对选定好的样本进行分词处理和词频统计,筛选出与数字化转型相关的高频词语并制作成词云图。图中的关键词可以分为数字技术应用、互联网商业模式、智能制造和现代信息系统四个维度,这提示我们可以从四个维度构建企业的数字化转型指数。第四步,基于第三步形成的词语从上市公司总样本中提取其前后文本,并寻找出现频率较高的文本组合。第五步,在既有文献基础上对关键词进行补充,形成最后的分词词典。第六步,基于自建的分词词典,使用 Jieba 功能对所有样本进行分词处理,从数字技术应用、互联网商业模式、智能制造和现代信息系统四个方面统计关键词的披露次数,以此反映企业在各方面的转型程度。在此基础上,对词频数据进行标准化处理,使用熵值法确定各指标权重,最终得到 DIGI text 指数。