全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
1638 2
2018-09-13
悬赏 20 个论坛币 未解决
当前使用的python版本是3.6

from bs4 import BeautifulSoup
import requests
url = "http://news.cdu.edu.cn/index.php?m=news&a=slist&cat_id=2"
r = requests.get(url)
r_text = BeautifulSoup(r.text, "lxml")
titles = r_text.select("li > a.fl")

# 可以打印出全部20条爬取的信息
for i in titles:
    print(i.get_text())

# 只能存储第一条爬取的信息
for i in titles:
    data = {'title': i.get_text()}

请问这是怎么回事啊,谢谢各位坛友的帮助。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-9-14 13:24:48
# 可以打印出全部20条爬取的信息
titletext=[]
for i in titles:
    titletext.append(i.get_text())
    print(i.get_text())



data = {'title': titletext}
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-9-14 13:26:12
你最后的循环每提取一次文本就要覆盖一次字典,结果只能保存最后一条title了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群