企业数字化转型-MD&A报告314个词频、文本统计(2001-2024年)
MD&A文本筛选:2014年及以前主要在“董事会报告”中筛选,2015年主要在“管理层讨论与分析”中筛选,2016年及往后主要从“经营情况讨论与分析”中筛选,2021-2024年主要在“管理层讨论与分析”中提取
数字化转型A:参考《管理世界》中吴非(2021)的做法,马克团队对
人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用五个维度76个数字化相关词频进行统计
企业数字化转型-MD&A报告314个词频、文本统计
数字化转型B:参考《财贸经济》中赵宸宇(2021)的做法,对数字技术应用、互联网商业模式、智能制造、现代信息系统四个维度99个数字化相关词频进行统计
企业数字化转型-MD&A报告314个词频、文本统计
数字化转型C:参考《经济研究》中甄红线(2023)的做法,对技术分类、组织赋能、数字化应用等类别下139个数字化相关词频进行统计
企业数字化转型-MD&A报告314个词频、文本统计
一、数据介绍
数据名称:企业数字化转型-MD&A报告词频、文本统计
数据范围:5706家上市公司
数据年份:2001-2024年
样本数量:65483条,345个变量
数据来源:上市公司“管理层讨论与分析”文本
数据说明:内含数字化转型314个词频、各维度水平、文本统计面板
二、整理说明
➤爬取2001-2024年上市公司年报
➤将MD&A报告文本整理为面板数据
➤统计年报全文的文本长度
➤统计全文中,中英文部分的文本长度
➤构建数字化术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇数目
➤计算数字化转型词频和、各维度水平词频和
➤计算3种方式下的数字化转型水平
三、指标说明
类别 年份 股票代码
code 股票简称 行业名称
行业代码 MD&A文本总长度 MD&A中英文文本总长度
数字化转型程度-A 数字化转型程度-B 数字化转型程度-C
人工智能技术-A 大数据技术-A 云计算技术-A
区块链技术-A 数字技术运用-A 数字技术应用-B
互联网商业模式-B 智能制造-B 现代信息系统-B
技术分类-人工智能技术-C 技术分类-区块链技术-C 技术分类-云计算技术-C
技术分类-大数据技术-C 组织赋能-人工智能技术-C 组织赋能-云计算技术-C
组织赋能-大数据技术-C 组织赋能-广义数字技术-C 数字化应用-技术创新-C
数字化应用-流程创新-C 数字化应用-业务创新-C 人工智能
等等。。。