全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
3236 13
2022-05-03

数据一:2010-2020年上市公司数字化程度指标(基于袁淳等,2021),stata可直接使用的最终数据。

此份数据是比较严格的依据袁淳教授的《数字化转型与企业分工:专业化还是纵向一体化》而作,首先以Python对政策文件进行分析,在加上吴非等的数字化词汇后,得到238个全中文词语的数字化词典(目前数字化数据里,最大的词典量)。

最后通过wingo、Python等工具进行词频统计,确保质量可靠。如需从头到尾自行处理,也可购买完整版获得python代码(虽然我觉得只需要代码的可能没几个人,但如果确实有需要也可下方留言,会编辑单售这一部分)。

1.首先基于python对30余份国家政策进行分析,得到国家政策中出现的、高频数字化相关词语;同时为确保完整性,增加吴非等的数字化词汇(选取中文词汇),构成数字化词典(共238个词语。足够大的词汇量保证全面性)

2.为了最大限度减少误差,避免因python提取不全可能的误差,选择使用wingo进行分析,对数字化词典进行词频统计。wingo数据集提供精确词频、扩展词频、精确句频和扩展句频的分析(扩展就是在检索时,包含词频联想词);同时提供精确的文本总字数、总词数,其准确性要高于采取python爬虫爬取的结果,因为数据库的算法、复核更严谨,可以保证质量可信。

文件内容见最下方。


数据二:

基于祁怀锦教授《数字经济对公司治理的影响——基于信息不对称和管理者非理性行为视角》,根据数字化相关词频手工识别企业数字化相关无形资产占比。数据范围:2007-2020.

文件内容包括:计算方法、最终stata数据



数据在此出售,包含

一、结果版 数据一、二。

数据一:1.包含id、时间、词频、总词数、总词数不含字数、词频/总词数的dta数据,2010-2020年上市公司数据;2.一份238个关键词的数字化词典

数据二:计算代码及最终数据

二、过程版 数据一、二。

数据一:结果版全部,以及3.wingo数据库的全部基础数据,其中包括每个具体词汇的词频,有需要的可以按需求对部分词语进行加总,进行稳健性检验等 4.将基础数据转换为dta数据的程序文件do  5.依据4进行处理的词频数据7份

数据二:计算代码及最终数据

三、完整版 数据一、二。

数据一:过程版全部,以及6.原版关键词词典  7.Python识别政策文件程序、停用词程序、统计文本长度程序 8.三十份近十年数字经济政策  9.停用词和分词,可以完全实现从头的定制化操作(注:建议有编程相关经验的同学购买!虽然实际计算是我做的。但我个人是不懂python的,关键词分析这一部分的代码和结果是购买得到的,难以提供这方面帮助,抱歉)

数据二:计算代码及最终数据

欢迎购买,如有问题请在此询问,如果我懂的话会尽力解答。

结果版 数据一、二.rar
大小:(3.13 MB)

只需: RMB 22元  马上下载


过程版 数据一、二.zip
大小:(11.57 MB)

只需: RMB 45元  马上下载


完整版 数据一、二.rar
大小:(12.73 MB)

只需: RMB 72元  马上下载


数据二.rar
大小:(2.68 MB)

只需: RMB 4元  马上下载



以下为结果版、过程版、完整版的一览图:
结果版 过程版 过程版 完整版 完整版
注:最下方附件栏里的文件是不全的,已经设置高价,请勿购买。购买请在上方选择进行。
附件列表

完整版.rar

大小:10.06 MB

只需: RMB 55555 元  马上下载

过程版.zip

大小:8.8 MB

只需: RMB 55555 元  马上下载

结果版.rar

大小:467.63 KB

只需: RMB 55555 元  马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-18 16:40:52
没事啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-18 23:28:51
ptyh 发表于 2022-5-18 16:40
请问这个结果是不是存在重复值呀,我看有两个东方明珠,但是每年的东方明珠的数据又是不一样的
你好,请问能再详细描述一下吗?我自己查了一下东方明珠,发现就只有01-20年数据啊,没有什么重复……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-27 15:33:58
你好,请问还会继续更新2021年的数据吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-27 16:54:54
tyhag1 发表于 2022-5-27 15:33
你好,请问还会继续更新2021年的数据吗
你好。因为是基于wingo数据库做的,而不是python处理,所以我自己也没有太好办法再做(因为我当时是购买的wingo服务,那时候21年报表还没出全)。如果你有需要可以在购买后,用那份数字词典,自己在wingo数据库进行(闲鱼就有,3-5元的样子)。抱歉了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-27 20:01:42
雎尘_ 发表于 2022-5-27 16:54
你好。因为是基于wingo数据库做的,而不是python处理,所以我自己也没有太好办法再做(因为我当时是购买的 ...
意思是说,wingo会有2021年年报的库吗?只需要拿着词典里的词语去wingo里操作就行吗,不需要再用python了?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群