爬虫存储数据丢失 - 经管之家

› 论坛 › 提问悬赏求职新闻读书功能一区 › 经管百科 › 爱问频道

爬虫存储数据丢失

1707

2

收藏 2018-09-13

悬赏 20 个论坛币未解决

当前使用的python版本是3.6

from bs4 import BeautifulSoup
import requests
url = "http://news.cdu.edu.cn/index.php?m=news&a=slist&cat_id=2"
r = requests.get(url)
r_text = BeautifulSoup(r.text, "lxml")
titles = r_text.select("li > a.fl")

# 可以打印出全部20条爬取的信息
for i in titles:
print(i.get_text())

# 只能存储第一条爬取的信息
for i in titles:
data = {'title': i.get_text()}

请问这是怎么回事啊，谢谢各位坛友的帮助。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2018-9-14 13:24:48

# 可以打印出全部20条爬取的信息
titletext=[]
for i in titles:
titletext.append(i.get_text())
print(i.get_text())

data = {'title': titletext}

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2018-9-14 13:26:12

你最后的循环每提取一次文本就要覆盖一次字典，结果只能保存最后一条title了

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群