1.资料名称:2022-2000年上市公司企业数字化转型指标测度数据
2.计算方式:参考《管理世界》吴非(2021)老师的做法,通过 Python 爬虫功能归集整理了上海交易所、深圳交易所全部 A 股上市企业的年度报告,并通过 Java PDFbox 库提取所有文本内容,并以此作为数据池供后续的特征词筛选。基于 Py⁃thon 对上市企业年报文本提取形成的数据池,根据下图 的特征词进行搜索、匹配和词频计数,进而分类归集关键技术方向的词频并形成最终加总词频,从而构建企业数字化转型的指标体系。具体的大家可以看一下参考文献,与参考文献做法完全一致
3.资料范围:包括原始数据、计算代码和计算结果,数据来源于上市公司年报
4.参考文献:
吴非, 胡慧芷, 林慧妍,等. 企业数字化转型与资本市场表现——来自股票流动性的经验证据[J]. 管理世界, 2021, 37(7):15.
id
year
证券代码
股票简称
行业代码
制造业取两位代码,其他行业用大类
五维度词频数年报合计
数字化转型程度1
五维度词频数管理层讨论合计
数字化转型程度2
AITechnology年报
BlockChainTechnology年报
CloudComputingTech年报
BigDataTechnology年报
DigitalTechApplication年报
AITechnology管理层讨论
BlockChainTechnology管理层讨论
CloudComputingTech管理层讨论
BigDataTechnology管理层讨论
DigitalTechApplication管理层讨论
ST或PT为1,否则为0
金融业为1,否则为0
资不抵债
沪深上市
北京上市
所属省份
所属城市
东部地区为1,否则为0
西部地区为1,否则为0
中部地区为1,否则为0
高科技行业为1,否则为0
高科技行业为1,否则为0
重污染行业为1,否则为0
重污染行业为1,否则为0
重污染行业为1,否则为0