Python爬虫程序源代码4:python采集B站视频弹幕,实现词云图分析全过程指导python采集B站视频弹幕, 实现词云图分析
包含:
(1) 程序源代码
(2) 完整的视频教程,全过程指导
bilibili哔哩哔哩
采集B站视频弹幕:
1. 简单 <√>
2. 复杂
通过爬虫程序采集数据
1. 分析数据在什么地方
- 通过浏览器开发者工具进行抓包分析
I.打开开发者工具: F12 / 右键点击检查选择选择network<网络>
II. 直接点击弹幕列表
III. 找到链接 seg.so
发送请求
获取数据
解析数据
保存数据
发送请求->模拟浏览器对于url地址发送请求
-模拟浏览器 <没有伪装>
提醒你没有登陆账号
-w_rid <加密参数 没有做解密>
你没有访问权限
爬虫内容稍微核心点知识点: JS逆向
参数加密 --> 解密分析加密规则