Python爬虫程序源代码2:爬取A站视频下载流媒体m3u8格式视频含教程全过程
Python爬取A站视频,下载流媒体m3u8格式视频
包含:
(1) 程序源代码
(2) 完整的视频教程全过程
一. 数据来源分析
1. 确定需求(确定要爬取的内容是什么?)
爬取A站视频内容 (标题)
2. 通过开发者工具(F12/鼠标右键点击检查)进行抓包分析
(视频 / media[过滤音频/视频数据内容])
二. 代码实现
代码实现的过程/步骤, 都是根据分析的过程来的
1. 发送请求 对于视频详情页url发送请求
2. 获取数据 获取视频详情页的网页源代码
3. 解析数据 提取m3u8 url地址
4. 发送请求 对m3u8发送请求
5. 获取数据 获取m3u8返回的数据内容
6. 解析数据 提取所以 ts url地址
7. 保存数据 保存ts 视频片段
8. 合并视频