全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
5527 35
2022-07-18

企业数字化转型词频

2007-2020

提供python程序+词频结果文件+最终可用文件


一、参考文献

[1]袁淳,肖土盛,耿春晓,盛誉.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021(09):137-155.DOI:10.19581/j.cnki.ciejournal.2021.09.007.

二、数据说明
  完全依据袁淳(2021)文章进行构建
   同时作为补充 加入了吴非的词频

鉴于此,本文借助数字经济相关的国家政策语义表述,建立一个相对完备的数字化词典,并利用基于机器学习的文本分析法,构建一个较为全面反映中国上市企业数字化程度的指标。具体步骤如下:


第一步,构建企业数字化术语词典。由于缺乏专门的数字经济领域的术语词典,本文以国家政策语义体系为基础构建企业数字化术语词典。借鉴何帆和刘红霞(2019)等的研究,通过对中央人民政府、工业和信息化部网站进行检索,人工筛选得到2012—2020年期间发布的30份重要的国家层面数字经济相关政策文件以用于提取企业数字化相关的关键词。经Python分词处理及人工识别,最终筛选得到197个频率大于等于5次的企业数字化相关词汇,这些词汇构成了本文的企业数字化术语词典。


第二步,对年报相关语段进行文本分析。本文把上述数字化术语词典中的197个词汇扩充到Python软件包的“jieba”中文分词库,然后基于机器学习的方法对上市公司年报“管理层讨论与分析”(MD&A)部分进行文本分析,统计得到197个与企业数字化相关词汇在年报中出现的频率。


第三步,企业数字化程度指标的构建。考虑到年报MD&A部分文本长度的差异,在提取得到每家上市公司每年年报中各个关键词的出现频率后,本文采用企业数字化相关词汇频数总和除以年报MD&A语段长度衡量微观企业数字化程度(Digital)。为了表述方便,本文将该指标乘以100。Digital指标数值越大,表示企业数字化程度越高。




三、数据包含内容

1、python程序 包含怎么使用停用词 如何进行爬取

2、输出的词频数量文件 30份重要的国家层面数字经济相关政策文

3、MDA的基本信息  总词数 总句数 总字数

4、最终结果 可以直接通过STATA 匹配使用的结果


1.PNG 捕获.PNG 结果.PNG






第一个文件
python程序.zip
大小:(2 KB)

只需: RMB 15元  马上下载

本附件包括:

  • stop_words.py
  • 匹配规则.py
  • 统计文件长度.py




第二个文件
输出文件.zip
大小:(4.88 MB)

只需: RMB 20元  马上下载

本附件包括:

  • 数字化词频1.csv
  • 数字化词频2.csv
  • 数字化词频3.csv




第三个文件
MDA整体.zip
大小:(1.9 MB)

只需: RMB 15元  马上下载

本附件包括:

  • MDA基本信息.csv




第四个文件
最终结果.zip
大小:(860.94 KB)

只需: RMB 15元  马上下载

本附件包括:

  • 搜词词典.txt
  • 结果.dta




包含所有的文件
数字化转型.zip
大小:(7.63 MB)

只需: RMB 50元  马上下载












二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-7-21 17:10:09
第一个文件包括词频统计的吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-21 17:39:42
li-aolin 发表于 2022-7-21 17:10
第一个文件包括词频统计的吗
有的,Python程序里提供合并停用词和爬取关键词的程序,但是没有结果,需要结果直接购买第三个即可。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-22 11:24:48
其他版本的数字化转型相关数据集见下:
https://bbs.pinggu.org/thread-11149594-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-23 09:51:36
a1010967149 发表于 2022-7-21 17:39
有的,Python程序里提供合并停用词和爬取关键词的程序,但是没有结果,需要结果直接购买第三个即可。
有最后的词频统计的程序吗,不是爬取关键词词典的那个,是最后根据关键词词典进行词频统计的那个,谢谢了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-23 10:45:48
li-aolin 发表于 2022-7-23 09:51
有最后的词频统计的程序吗,不是爬取关键词词典的那个,是最后根据关键词词典进行词频统计的那个,谢谢了
有词频统计的程序啊,主要就是设定好关键词词典然后爬取词频数量啊。不过更加小白易懂的版本可以看下这个https://bbs.pinggu.org/thread-11148898-1-1.html      有详细说明,有年报txt文档,可能出现的错误也进行了说明
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群