Python爬虫程序源代码:采集高清无码壁纸, 实现定时自动更换电脑彼岸壁纸
实现目标:Python采集高清无码壁纸, 实现定时自动更换电脑壁纸
包含:
(1) 程序源代码
(2) 完整的视频教程,全过程指导
环境使用]:
Python 3.8
Pycharm
[模块使用]:
requests
re
win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)
先听一下歌 等一下后面进来的同学,15:05正式开始讲课 [有什么喜欢听得歌曲 也可以在公屏发一下]
相对应的安装包/安装教程/激活码/使用教程/学习资料/工具插件 可以加木子老师微信
---------------------------------------------------------------------------------------------------
目标网址:http://www.netbian.com/index.htm
爬虫实现的流程: 实现批量的数据采集
一. 数据来源分析
1. 明确需求: 明确采集的网站以及数据是什么?
- 网址:http://www.netbian.com/index.htm
- 数据: 壁纸 / 标题
2. 抓包分析: 通过浏览器开发者工具, 分析我们需要数据可以请求那个链接能够得到
壁纸链接:
- 打开开发者工具: F12
- 刷新网页
- 通过关键字搜索, 数据对应的数据包位置
关键字:200109iFLnY
古海寻踪-张良王者荣耀高清壁纸: http://www.netbian.com/desk/32206.htm
美女刘亦菲2023年10月桌面日历 : http://www.netbian.com/desk/32204.htm
32206 -> 壁纸ID <唯一性>
获取所有壁纸ID就可以了
http://www.netbian.com/index.htm
来源: 壁纸目录页面链接
http://www.netbian.com/index.htm
来源: 壁纸详情页链接
http://www.netbian.com/desk/32206.htm
目的: 获取壁纸链接 / 壁纸标题
http://img.netbian.com/file/2023/0920/200109iFLnY.jpg
二. 代码实现步骤
第一次请求: 获取壁纸ID / 壁纸详情页链接地址
1. 发送请求 -> 请求壁纸目录页面
2. 获取数据 -> 获取网页数据内容
3. 解析数据 -> 提取我们需要壁纸详情页链接地址
第二次请求: 获取壁纸链接 / 标题
1. 发送请求 -> 请求详情页链接地址
2. 获取数据 -> 获取网页数据内容
3. 解析数据 -> 提取我们需要壁纸链接 / 标题
第三次请求: 获取壁纸内容
1. 发送请求 -> 请求壁纸链接地址
2. 获取数据 -> 获取壁纸图片内容
3. 保存数据 -> 保存本地文件夹
"""