全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
724 3
2017-12-12
初学爬虫,自己想爬个贴吧图片,结果出现以下问题:
源代码:
import urllib.request
url1 = 'https://tieba.baidu.com/p/5441684190'
response1 = urllib.request.urlopen(url1)
html1 = response1.read().decode('utf-8')

import re
reg=r'src="(.+?\.jpg)" size' #r'src=为正则表达式
imgre=re.compile(reg)
imaglist=re.findall(imgre,html1)
x=67
for imgurl1 in imaglist:
    print(x)
    urllib.request.urlretrieve(imgurl1,'C:\\Users\\thtf\\Desktop\\贴吧\\%s.jpg'%x)
    x+=1
print('抓取结束')

运行后出现:
QQ截图20171212005519.png
请问各位大神这怎么解决

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-12-12 09:41:03
1、我运行了,81,82都过了。
2、imaglist[27]错了,你看一下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-12 19:08:42
fengxingliulizi 发表于 2017-12-12 09:41
1、我运行了,81,82都过了。
2、imaglist[27]错了,你看一下。
等于说是网页出错了?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-13 09:33:51
Thanos123 发表于 2017-12-12 19:08
等于说是网页出错了?
应该是
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群