金融科技指标python爬取代码资料包
资料包详解
各位同学!请注意。为了满足各位同学不同需求,该资料推出两款百度界面“金融科技”关键词爬取资料包。
第一款:该资料爬取的数据是“百度搜索量”全部,只要小伙伴的爬取样式为“年份+个体+关键词”这样的样式进行获取,该python代码都可以使用。其中,个体可以为“省份、城市、银行、企业等等”,代码中,小伙伴也可以自定义爬取的年份区间,例如2010年到2021年,关键词则为你需要爬取的某个指标。
第二款:该资料爬取的数据是“百度资讯”界面,也就是百度新闻该关键的数量,只要小伙伴的爬取样式为“年份+个体+关键词”这样的样式进行获取,该python代码都可以使用。其中,个体可以为“省份、城市、银行、企业等等”,代码中,小伙伴也可以自定义爬取的年份区间,例如2010年到2021年,关键词则为你需要爬取的某个指标。
目前,该资料包也在不断更新迭代,为的就是提升爬取速度和满足多样化需求,提高同学满意度。购买的同学后续也可免费更新。每一份资料都来自幸苦付出哩!!!
每款资料包含以下几个文档
- python代码
- 来自某泰安中我国所有银行原始数据
- 对原始数据进行降重的stata的do文档和处理后的数据集
- python代码以及本人为大家爬取的案例数据
- 对爬取的案例数据进行整理的stata的do文档《包含因子分析和主成分分析代码》
- 整个流程的word文档,可参考该文件进行一一操作
参考文献(2020,财经研究)金融科技、银行风险与市场挤出效应_金洪飞
最终结果案例展示
第一款资料案例展示
第二款资料案例展示
第一款资料链接:
第二款资料链接:
两款款资料链接:
补充内容 (2023-3-2 21:15):
请注意,第一款资料包不在出售
补充内容 (2023-3-2 21:15):
请注意,第一款资料包不在出售
补充内容 (2023-3-2 22:08):
最近请同学们不要购买金融科技指数资料包。由于百度网页获取发生改变,目前爬取难度有所增加,目前请同学们不要购买
补充内容 (2023-4-2 10:10):
第二个资料已经可以使用了
第二个资料已经可以使用了
第二个资料已经可以使用了
第二个资料已经可以使用了
补充内容 (2023-4-2 14:23):
将要购买的同学请注意:爬取目前依然不稳定。如果爬取人数过多,可能会导致百度禁止的情况
将要购买的同学请注意:爬取目前依然不稳定。如果爬取人数过多,可能会导致百度禁止的情况
补充内容 (2023-4-11 16:49):
本人现在向大家开放之前已经爬取好的2006-2021年403家上市公司48个相关金融科技关键词的数据,数据量差不多在30多万。如果需要可直接购买第二款资料获取
补充内容 (2023-4-11 16:50):
目前,本人已经爬取了部分2022年相关城市的数据,由于百度方面原因还未完全获得。但是这部分已经爬取好的也一并放在第二款资料包内
补充内容 (2023-4-11 16:51):
请注意,如果获取第二款目前代码不稳定是无法爬取的。但是里面有上述本人已经爬取好的数据
补充内容 (2023-4-13 11:48):
更正:是403个地级市
补充内容 (2023-4-16 08:45):
现在购买可8折
补充内容 (2023-4-19 21:06):
该资料已经可以爬取了
补充内容 (2023-4-20 10:43):
由于同学们的电脑配置不同,购买后的同学可私信联系我进行操作
补充内容 (2023-4-20 14:03):
地级市金融科技2022年度48个关键词已经获取完毕
补充内容 (2023-4-28 12:52):
新资料链接
https://bbs.pinggu.org/forum.php ... ;extra=#pid86121532