全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
8608 28
2019-09-17
写过两篇帖子,关于如何从巨潮资讯网以及上交所下载年报:
https://bbs.pinggu.org/thread-7320099-1-1.html
https://bbs.pinggu.org/thread-7292296-1-1.html
本来想把深交所爬取同样放在上一篇帖子中,但是发现深交所采用的是post请求中的payload方式
在写的时候没反应过来,琢磨了一下才弄懂代码该怎么写。
也就是需要用到payload为参数进行访问。
比如
`{"seDate":["",""],"channelCode":["fixed_disc"],"bigCategoryId":["010301"],"pageSize":30,"pageNum":2}`

## 代码的基本思路
1. 获取深交所所有上市公司PDF的地址
2. 通过访问PDF地址进行下载


代码如下:
爬取深交所.txt
大小:(3.52 KB)

只需: 10 个论坛币  马上下载

(代码有误)
在使用中发下代码编写有误,故重现附上更正后的代码:
批量下载深交所年报(更正).txt
大小:(3.44 KB)

只需: 10 个论坛币  马上下载

(代码有误)
感谢南风拂面 的意见,(实在抱歉)因为网站访问到第500页后无法显示,爬取报错,只能以三年为单位,分多次下载。代码如下:
分年度下载.txt
大小:(4.05 KB)

只需: 10 个论坛币  马上下载



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-9-23 10:03:51
请用论坛币购买过的此代码的朋友私信邮箱,会将更正后的代码发到邮箱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-11-14 19:18:39
您好,在使用您的深交所年报代码时出现如下错误
复制代码

向您求教,恳请指导一二
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-11-14 19:45:15
南风拂面 发表于 2019-11-14 19:18
您好,在使用您的深交所年报代码时出现如下错误

向您求教,恳请指导一二
你好,我再次检查了一下代码,实在抱歉,当时写代码没有发现这个失误,因为网站超过500后访问就无法访问了,最多显示500页内容,所以现在新写了一份代码(以三年为一个时间段进行下载)。实在抱歉,麻烦留下邮箱。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-11-14 20:09:21
dream1095 发表于 2019-11-14 19:45
你好,我再次检查了一下代码,实在抱歉,当时写代码没有发现这个失误,因为网站超过500后访问就无法访问了 ...
麻烦您了 打扰了您好几次 1243439689@qq.com
非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-11-15 06:17:31
408796054@qq.com  谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群