随着
人工智能(Artificial Intelligence)、区块链(Blockchain)、云计算(Cloud Computing)、大数据(Big Data) 等“ABCD”技术的不断涌现,数字化(数字科技)正逐步成为全球企业创新变革的重要突破点。当前,企业发展环境产生巨大变化,数据处理能力从 KB 级跨越至 PB 级,人类经济社会正在迈入一个以“数字(数据)”为核心特征的全新时代。
现在数字经济的热度本人也不做过度的背景介绍了。现阶段关于数字化转型到底是何水平仍然没有明确的说法,所以大家都在寻找一个好的代理变量。宏观层面来看就是选取数字产业相关的指标进行综合求解。到了微观层面有专门选取人工智能相关的企业来作为代理变量,但是这种做法会使得样本量很小。吴非老师发表在2021年《管理世界》第7期的文章给了我很大的启示,可以通过文本挖掘的方法爬取上市公式年报中关于数字化转型的关键词,就和词频进行表征。这种做法也逐渐慢慢流行开来。但是该方法需要Python和大量的文本挖掘,使得一些“小白们”望而却步,鉴于此本文花费了很长时间对对该数据进行整理,目前得出3000+上市公式的数字化转型数据。
文本挖掘过程中关键次选取了 数字信息技术、人工智能、云计算、区块链、互联网和大数据六个维度共计60+个小指标(每个小指标都有具体数据)。小指标例如:数字化、数字营销、数字科技、数字运营、数字终端、数字经济、数字贸易、数字体系、数字供应链、数字金融、无人零售、信息时代、信息化、信息技术、信息集成、讯息通讯等。
完整的关键词信息放在附件sheet2中,sheet1为词频数据。因数据量大,个别公司可能存在重复的情况,例如某某公司可能在某某年份存在两个重复数据,自己运用的时候删除重复值就好了。
时间跨度为2009-2019年
2022年2月15日更新:
最近陆陆续续收到许多小伙伴关于2020年的需求,为满足广大群众这一需求,本人将2020年的公司报告也进行了词频统计。需要注意的是:本次更新的数据集与2009-2019年做了很大精简(限于时间,仅做了几个词频),涉及到的关键词有
人工智能技术、区块链技术、云计算技术、大数据技术、数字技术应用、数字化转型
本次数据集提供了证券代码、行业代码和行业名称