数字化转型数据-词频集合
2000-2023
原始词频数据+处理流程+最终直接匹配结果
随着年报的公布,整理了基本上最常见的数字化转型词频类的度量方式,全部都是目前为止最为常用的顶刊数据用法,具体数据说明如下,因其他版本涉及资产明细项目,后续还会继续更新。(全部为2023最新版本)
(已购买的朋友直接找我领取)
一、吴非
1、参考文献:
[1]吴非,胡慧芷,林慧妍,任晓怡.企业数字化转型与资本市场表现——来自股票流动性的经验证[J].管理世界,2021,37(07):130-144+10.DOI:10.19744/j.cnki.11-1235/f.2021.0097.
2、数据处理说明
将文章整理的相关词汇分别分类为人工智能技术、区块链技术、云计算技术、大数据技术、数字技术应用,通过加总词汇得到数字化转型指标,在处理时,已剔除关键词前存在“没”“无”“不”等否定词语的表述。基本流程是吴非数据处理的过程,具体可以仔细参考,这里不再赘述
注意!!!!:
①原始的词频数据经过python爬取输出
②关于词频数据的获取,这里给大家提供代码,该代码为jieba分词代码,包含有停用词,句子统计,不提供解释,也不要再问有没有处理代码了。
3、数据展示
二、赵宸宇
1.数据名称:上市公司数字化转型 企业数字化 (赵宸宇版本)
2.数据区间:2000-2022(原始词频是2000-2023,熵权选择了2007-2023)
3.数据来源:上市公司年报(原文章使用管理层分析与讨论部分,进行对应)
4.数据处理:
- 通过年报进行提取关键词
- 进行连续性缩尾处理
- 匹配了上市公司基本信息(板块、行业、性质等)
- 原始词频数据(赵宸宇披露的每个数字化词的词频全部包括)
5.指标包含:
- 数字化指标:数字化总得分 各维度词频(因该数据采用熵值法,所以对数据处理成了平衡面板数据,但原始的词频数据也有统计,大家进行参考时可仅采用词频数据而不适用熵值,具体使用可灵活选择)
- 企业基本信息指标:省份 区域 城市 成立年份 上市日期 上市年份 公司属性 是否国有企业
6.数据展示: