请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
bxshi 发表于 2015-8-12 02:10 详细一点,就要这个页面还是要点这个页面的每个链接然后下载html,点开了链接之后需不需要在打开的页面里再 ...
shaode01 发表于 2015-8-13 21:38 楼上的没有回答到点子上,之所以会出现这个错误,是因为你要访问的url是带参数的, ?后面的 spm=a1z10.5- ...
bxshi 发表于 2015-8-13 22:10 把参数放到payload就可以了?我直接curl访问这个地址同样是302过多然后失败,请问你能否给一下代码?
bxshi 发表于 2015-8-12 22:46 明白了,这个问题是因为urllib不能好好处理302重定向导致的错误,你需要用requests包来抓数据。 代码如下 ...
shaode01 发表于 2015-8-13 23:14 我错了,这跟参数貌似没有关系,我访问天猫首页是没有问题的 https://www.tmall.com/?spm=a1z10.5-b.0.0 ...
万人往LVR 发表于 2015-8-14 15:35 谢谢。不过还是报错了,请问有别的解决方法吗?
bxshi 发表于 2015-8-15 01:51 你可以把错误贴上来吗?
万人往LVR 发表于 2015-8-17 08:57 谢谢!
bxshi 发表于 2015-8-17 11:32 并不是很清楚python在windows下的使用,有两点可以试一下: 1) 将https改成http 2)返回的错误是个war ...
shaode01 发表于 2015-8-17 17:08 你可以试试代码里的其他链接,都没有错误,只有你要爬的这个页面报错 The HTTP server returned a redir ...
python爬虫源码.rar
大小:12.35 KB
只需: 1 个论坛币 马上下载
几个python爬虫源码
lxb66666 发表于 2015-8-20 10:46 这是几个python爬虫的源代码
shaode01 发表于 2015-8-24 21:32
万人往LVR 发表于 2015-8-25 10:12 谢谢,但是还是出错,ios是可以运行成功的,甚至不用这么麻烦都能运行成功。不过我是windows。