用正则表达式爬取豆瓣读书网站 链接 书名 作者 年份,电脑一直卡着为啥?(附代码和截屏,Spyder和cmd都运行不出来),好几次了都是这样,难道正则表达式有问题 还是电脑问题。
import requests
import re
content = requests.get('https://book.douban.com/').text
pattern = re.compile('<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>', re.S)
results = re.findall(pattern, content)
for result in results:
url, name, author, date = result
author = re.sub('\s', '', author)
date = re.sub('\s', '', date)
print(url, name, author, date)