企业数字化转型词频
2001-2021
鉴于此,本文借助数字经济相关的国家政策语义表述,建立一个相对完备的数字化词典,并利用基于机器学习的文本分析法,构建一个较为全面反映中国上市企业数字化程度的指标。具体步骤如下:
第一步,构建企业数字化术语词典。由于缺乏专门的数字经济领域的术语词典,本文以国家政策语义体系为基础构建企业数字化术语词典。借鉴何帆和刘红霞(2019)等的研究,通过对中央人民ZF、工业和信息化部网站进行检索,人工筛选得到2012—2020年期间发布的30份重要的国家层面数字经济相关政策文件以用于提取企业数字化相关的关键词。经Python分词处理及人工识别,最终筛选得到197个频率大于等于5次的企业数字化相关词汇,这些词汇构成了本文的企业数字化术语词典。
第二步,对年报相关语段进行文本分析。本文把上述数字化术语词典中的197个词汇扩充到Python软件包的“jieba”中文分词库,然后基于机器学习的方法对上市公司年报“管理层讨论与分析”(MD&A)部分进行文本分析,统计得到197个与企业数字化相关词汇在年报中出现的频率。
第三步,企业数字化程度指标的构建。考虑到年报MD&A部分文本长度的差异,在提取得到每家上市公司每年年报中各个关键词的出现频率后,本文采用企业数字化相关词汇频数总和除以年报MD&A语段长度衡量微观企业数字化程度(Digital)。为了表述方便,本文将该指标乘以100。Digital指标数值越大,表示企业数字化程度越高。
三、数据包含内容
1、python程序 包含怎么使用停用词 如何进行爬取
2、输出的词频数量文件 30份重要的国家层面数字经济相关政策文
3、MDA的基本信息 总词数 总句数 总字数
4、最终结果 可以直接通过STATA 匹配使用的结果
只需: RMB 50元 马上下载
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
九月0219 发表于 2022-10-11 17:01 您好,我之前购买了老版本的,可以给我发下新版的吗?
a1010967149 发表于 2022-10-4 12:13 已购买老版本的朋友欢迎来领取
a1010967149 发表于 2022-10-15 16:04 欢迎进行购买,数据质量有保证!
a1010967149 发表于 2022-10-22 15:04 欢迎进行购买,数据质量有保证!
a1010967149 发表于 2022-11-9 10:00 高质数据欢迎大家咨询!!! 高质数据欢迎大家咨询!!!