Python爬虫程序源代码:抖音视频采集爬取
实现目标:Python 爬虫之 抖音视频采集
包含:
(1) 程序源代码
(2) 完整的视频教程,全过程指导
[知识点]:
动态数据抓包
requests发送请求
X-Bogus 参数逆向
[开发环境]:
python 3.8 运行代码
pycharm 2022.3 辅助敲代码
requests pip install requests
分析数据来源
找到作品链接
https://www.douyin.com/aweme/v1/web/aweme/post/?device_platform=webapp&aid=6383&channel=channel_pc_web&sec_user_id=MS4wLjABAAAAqsOmrExIsJbZ2b0QLzytzAhAFbJUROH72_yVYM7Zq8E&max_cursor=0&locate_item_id=7273024102460362047&locate_query=false&show_live_replay_strategy=1&need_time_list=1&time_list_query=0&count=18&publish_video_strategy_type=2&pc_client_type=1&version_code=170400&version_name=17.4.0&cookie_enabled=true&screen_width=1920&screen_height=1080&browser_language=zh-CN&browser_platform=Win32&browser_name=Chrome&browser_version=116.0.0.0&browser_online=true&engine_name=Blink&engine_version=116.0.0.0&os_name=Windows&os_version=10&cpu_core_num=6&device_memory=8&platform=PC&downlink=10&effective_type=4g&round_trip_time=0&webid=7206570248416773684&msToken=5tGWEtdYSWlzOgB96wdvpSwDH3wwbSwp5UFDBc8wBZk9LOMycvwvFaZ9HB4TP6vGrr4bW8I-DjKo3_Csn9SZSrD6llhIDlFoj3EEz7rRBcJLKZrRyDufL4XkeO0idCY=&X-Bogus=DFSzswVOvYiANSVTtyeXaVXAIQ5p
import requests
import execjs
ctx =execjs.compile(open('xb.js', mode='r', encoding='utf-8').read())
"""