全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
4164 12
2021-01-17
      本帖提供和讯网企业社会责任数据爬虫及数据整理代码供大家学习参考。                        

      步骤一:数据爬取。爬虫用到python的requests、demjsonpandas三个模块,通过更改参数分年度下载,其中:
      1.requests模块是向服务器发起请求
      2.demjson适用于解析非标准json字符串
      3.pandas用于数据整理和输出结果
      步骤二:数据整理。用stata的xls2dta命令批量导入并合并多个excel文件。

以下为过程文件展示截图:
微信图片_20210117172513.png 微信图片_20210117172805.png 微信图片_20210117172822.png 微信图片_20210117172933.png







附件列表

CSR评分数据及代码.rar

大小:2.35 MB

只需: RMB 10000 元  马上下载

CSR评分数据及代码(爬虫).rar

大小:3.69 MB

只需: RMB 10000 元  马上下载

更新版,以此为准

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-2-1 22:11:09
水上浮萍1996 发表于 2021-1-17 17:50
本帖提供和讯网企业社会责任数据爬虫及数据整理代码供大家学习参考。                        

   ...
怎么没办法买哇
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-2-1 22:40:59
祥梓 发表于 2021-2-1 22:11
怎么没办法买哇
如果有需要,可以加一下我的qq,617828755。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-23 11:28:00
你好,请问你在爬取和讯网时,有没有出现403报错,被误认为是黑客爬取,你是怎么解决
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-24 00:25:22
请问为何无法购买呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-24 11:08:08
cunluo~(^з^)-☆ 发表于 2021-3-23 11:28
你好,请问你在爬取和讯网时,有没有出现403报错,被误认为是黑客爬取,你是怎么解决
和讯网还是比较友好的,没有特别的反爬机制,我也就是请求的时候设置了一下headers,然后解析的时候用demjson解析了非标准的json字符串,整个过程没有很复杂。没有遇到您说的这种情况,不好意思哈~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群