Python爬虫程序源代码:python采集B站番剧合并音频和视频python采集B站番剧,合并音频和视频
包含:
(1) 程序源代码
(2) 完整的视频教程,全过程指导
Bilibili、
第一步: 抓包分析 / 分析视频内容数据
通过开发者工具进行抓包分析
1. 通过 m4s 媒体文件 --> 找到对应数据包
数据包: https://api.bilibili.com/pgc/player/web/v2/playurl<音频和视频>
2. 通过 不同集数 数据包参数对比
avid cid ep_id
参数对应数据包 ->https://api.bilibili.com/pgc/view/web/season?ep_id=249469
目的: 获取视频画面内容 / 音频内容
需要三个参数: avid cidep_id --> https://api.bilibili.com/pgc/view/web/season?ep_id=249469
爬虫基本步骤: 发送请求 -> 获取数据 -> 解析数据 -> 保存数据
发送请求 -> 对于数据所在链接地址请求
获取数据 -> 获取服务器返回的数据内容
解析数据 -> 提取你需要的数据
保存数据 -> 把你需要的数据进行保存
headers 根据不同网站, 添加字段是不一样的
B站: 登陆账号 视频清晰度更高
批量替换:
选择替换的内容 -> ctrl+ R 输入正则命令 进行匹配替换
(.*?): (.*) --> 你要匹配什么数据
'$1': '$2', --> 需要替换添加什么内容
print 输出函数
for循环遍历
列表取值 / 字典取值
字符串创建定义 / 字典创建
open函数的使用