【努力做全网最热情、最专业的原创数据合集分享者,数据均有售后服务,欢迎咨询】【注意我这边统计的是2023最新版本,一手计算的!不是只到2022年的旧版数据,那个遍地都是!】
本数据集为独家整理并认真测算的2002-2023我国省级数字经济文本词频统计面板数据,同时提供学界最权威的2种方法结果。选取数字经济最科学的几十个关键词,统计其词频明细、文本长度、文本词频。包括dta和xlsx两种格式数据。数字经济毫无疑问是目前爆款研究方向,这个方向的实证论文很容易发国内外顶刊(发不了顶刊有何意义?)目前广泛流传版本有较多错误,一些重要的词频明显缺失,我和师兄认真勘误、更正了类似的问题,请放心做实证,亲层作为变量回归统计显著性较好。
1.测算流程图:运用Anaconda从地方政府网爬取工作报告文本文件→将报告文本整理为Panel Data→去除停顿词利用Anaconda的jieba库进行分词,统计词频数保留中英文、数字、标点符号
→利用正则表达式统计60个词频保留中英文、数字,统计全文文本总长度→保存文本词频总数、词频明细和文本长度。
2.关键词说明:目前学界公认的权威做法是金灿阳(2022)和陶长琪(2022)的做法,均运用Anaconda对政府工作报告进行分词处理,分别统计了省级政府工作报告中与数字经济相关的关键词的词频,需要注意,本数据集做法同学界普遍记法,把两位教授选取的数字经济关键词分别记为词频A和词频B然后进行统计。
欢迎点击购买↓↓↓
数据整理不易,仅用于学术写作,严禁某些团队或个人转售获利,保留追究一切非法获利行为法律责任的权利!
目前网上流传的大部分数字经济数据均存在一些问题(指标体系不科学等),我郑重承诺:本数据集为统计最全面的同类数据库,经过我们多重校对确认无误(例如,我随机查证了5个省份10年间的数据,将电子数据与政府公告、统计部门网站的数据进行肉眼比对,100%保证准确,才敢说万无一失),请大家放心使用。
在整理本数据集过程中,我始终秉持着严谨、客观、科学的研究态度,力求为相关研究领域作出有价值的贡献。因此,我可以向大家保证,我的数据质量是高度可信的,并希望能够为您提供满意的数据服务。如有定制需求,请私信。原创数据,请勿转售获利;数据文件售出后无法退换,数据集与本贴描述一致,请确保有需求后购买。
除本数据集外,如果您需要任何方向的微观、宏观数据库,可以私信我(不买也做朋友),常驻论坛,购买后有任何探讨欢迎私信,大家可以去任意数据平台或网站寻找,类似的热门数据价格至少是三四百块,效果还无法保证,这里我给您白菜价,祝您学术顺利、万事如意!
本人数量经济学博士,科研青椒一枚,深知学术不易,绝不是东拼西凑或者转售别人数据的贩子,分享给大家的数据集质量有目共睹,好评如潮,包售后,有问题随时交流,近期也收到了一些无理的莫名诋毁,你敢来,我就能跟你耗下去,不怕被骂你就来,谢谢!
学术不易,互相帮助,推数字经济动应用经济学高质量发展!感谢经管之家论坛的各位老师提供平台让我能与大家交流进步!