Python学习路径建议:
编程基础及数据清洗→(爬虫)→机器学习→文本分析&机器学习进阶
Python师资培训课程矩阵:
编程基础与数据清洗
爬虫应用
文本分析
机器学习
机器学习进阶
课程信息:
课程时长:
编程基础与数据清洗:15小时
爬虫实战:12小时
文本分析:12小时
机器学习:36小时
深度学习:24小时
上课方式:
编程基础与数据清洗,机器学习,深度学习:在线学习,提供配套资料及授课老师答疑
爬虫实战与文本分析:远程直播,提供录播回放+配套资料+授课老师答疑
→授课与答疑均是授课老师陈远祥本人,非助教答疑
→不同于其他Python课程,单独为学术研究打造的Python课程
讲师介绍:
陈远祥老师,北京邮电大学副教授 。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。
发表SCI/EI学术论文100余篇,其中第一或通讯作者论文60余篇,申请发明专利20项。主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。
IEEE、OSA会员,OpticsExpress, IEEE Photonics Technology Letters,PhotonicsJournal,Applied Optics等多个SCI期刊审稿人。
课程内容:
Python编程基础与数据清洗
C1:前言
C2:Python语言概述
C3:Python中的数据类型
C4:控制流
C5:函数设计与使用
C6:面向对象编程
C7:文件操作
C8:Numpy
C9:pandas
C10:matplotlib绘图
C11:pyechart绘图
Python爬虫 2024年4月新课加入AI助力内容~
1. 爬虫基础
目标:掌握爬虫基本概念,爬虫基本流程,掌握网页基础知识,学会简单网页制作
1) 什么是网络爬虫
2) 爬虫的基本原理
3) web网页基础
4) 爬虫基本流程
2. 页面解析和数据存储
目标:掌握正则表达式的用法,学会利用正则表达式进行文本信息提取,掌握常见文本信息存储方法
1) 基于正则表达式的文本信息提取
2) 文本文件存储
3) JSON文件存储
3. urllib和requests
目标:掌握两种基本的请求发送方法,通过案例展示,实现单页和多页数据爬取,掌握动态页面爬取方法,掌握模拟登录,IP代理常用方法,实现高效率、大规模的网络爬取
1) 请求头的构造
2) get请求与post请求
3) 单页和多页数据的爬取
4) 动态页面的数据爬取
5) 模拟登录
6) 代理的基本使用
7) 高效代理池的维护
4. Beautiful Soup和Xpath
目标:通过案例,掌握两种高效的网页信息解析和提取方法,实现网络数据的高效提取
1) Beautiful Soup简介
2) Beautiful Soup的页面解析
3) Beautiful Soup节点选择方法
4) 什么是Xpath
5) Xpath常用匹配规则
6) Xpath的节点选择
5. Selenium和Playwright
目标:通过案例,掌握动态渲染页面的两种自动化的爬虫方法
1) Selenium的安装与配置
2) Selenium的基本使用
3) 页面的访问与节点定位
4) 节点信息的获取
5) Playwright的安装
6) Playwright的编写模式
7) Playwright代码生成
8) Playwright的常用操作方法
6. 验证码的处理
目标:针对验证码反爬虫机制,掌握几种常用验证码识别方法
1) OCR识别验证码
2) 图像匹配识别滑动验证码
3) 深度学习识别滑动验证码
7. Scrapy和分布式爬虫
目标:掌握scrapy爬虫框架和常用方法,理解分布式爬虫原理
1) scrapy框架介绍
2) scrapy入门
3) scrapy的节点选择
4) Spider的用法
5) 分布式爬虫原理
6) 分布式爬虫部署
8. 基于AI辅助的网络爬虫
目标:利用AI辅助爬虫,提高爬虫效率
1) 自动提取信息
2) 适应动态网页
3) 突破反爬机制
Python文本分析 2024年4月新课加入AI助力内容~
1. 文本分析概述
目标:掌握文本分析的基本概念,文本分析的发展历程,文本分析流程和挑战
1) 文本数据与文本分析
2) 自然语言处理的流派
3) 文本分析的常见应用
4) 文本分析的层次
5) 文本分析的流程
6) 文本分析的挑战
2. 文本单元的提取与标注
目标:掌握文本常用清洗方法,分词原理和方法,词性标注方法
1) 文本清洗
2) 分词
3) 词性标注
3. 文本特征的选取与表示
目标:掌握文本的常用结构化表示方法,利用多种方法实现文本特征提取,理解每种特征提取的优缺点
1) 文本向量化
2) 词袋模型
3) TF-IDF
4) Word2Vec
5) GloVe
6) Doc2vec
4. 关键词提取
目标:掌握三种关键词提取方法
1) TF-IDF
2) TextRank
3) LDA
5. 文本分析的应用
目标:掌握文本分析的常见应用,和传统的机器学习方法结合,实现文本的分类,聚类,摘要提取,情感分析等功能
1) 文字云
2) 文本分类
3) 文本聚类
4) 文本摘要
5) 情感分析
6. 基于深度学习的文本分析技术
目标:掌握最新的深度学习在文本分析中的应用,包括RNN,LSTM,CNN,注意力,Transformer等模型和机制的引入
1) RNN
2) Bi-LSTM
3) textCNN
4) GRU
5) 注意力机制
6) BERT和Transformer
7. 基于AI辅助的文本分析
目标:AI辅助文本分析,高效提取文本价值
1) 文本摘要
2) 文本翻译
3) 文本分类
4) 文本聚类
5) 情感分析
Python机器学习:
第一部分:机器学习思想与学术应用介绍:
· 机器学习基本思想
· 机器学习分类
· 常用机器学习常用算法
· 机器学习评价标准
· 机器学习算法库介绍
· 机器学习常见学术应用
第二部分:算法原理与实战
1、 KNN算法:
KNN算法基本原理,常用相似度衡量方法、KNN用于分类和回归,KNN模型的优化与调参
案例应用:鸢尾花分类与波士顿房价预测
2、 决策树:
决策树基本原理,决策树分类,决策树用于分类和回归实现,决策树参数优化
案例应用:保险行业用户画像
3、 线性回归:
线性回归模型基本原理、岭回归、LASSO回归和弹性网
案例应用:基于不同场景之下共享单车投放量的精准预测
4、 逻辑回归:
逻辑回归基本原理,从线性回归到逻辑回归,逻辑回归实现和参数优化
案例应用:数字化人力资源之员工流失风险预警
5、 神经网络与深度学习简介:
神经网络基础,神经网络中的激活函数,神经网络Python实现与参数调优,深度学习简介
案例应用:数字识别与图片分类
6、 贝叶斯网络:
贝叶斯分类原理,朴素贝叶斯,贝叶斯模型分类
案例应用:门户网站新闻分类
7、 支持向量机:
支持向量机分类原理,线性SVM和非线性SVM
案例应用:人脸识别
8、 随机森林:
决策树与随机森林,随机森林原理,随机森林Python实现与参数调优
案例应用:泰坦尼克沉船预测
9、 聚类:
聚类原理,聚类和分类区别,kmeans聚类原理,kmeanspython实现,模型评估指标及稳定性讨论
案例应用:航空客户价值分析
10、时间序列分析:
时间序列特征,时间序列模型介绍,时间序列建模
案例应用:电商线上零售商品销量预测
第三部分:Python机器学习学术应用与基金申请
1、机器学习学术应用:数据发现与变量创造,预测,因果推断
2、机器学习学术论文解读与写作指导
· 机器学习方法识别车险欺诈效果的比较研究
· 大数据思维下的利率定价研究
· 基于机器学习预测的投资组合量化研究
· 通货膨胀影响因素识别:基于机器学习方法的再检验
3、机器学习与基金申请(国自然)
基金申请流程与常见思路
成功案例分享:基于机器学习的损伤感知与补偿机制研究
Python机器学习进阶:
一、 集成学习介绍与应用
1. 集成学习的优势
2. 集成学习常用算法介绍:原理与实现
1) 随机森林
2) adaboost
3) GBDT
4) Xgboost
5) Stacking
3. 集成学习算法的学术应用
二、 高级特征工程处理技术
1. 特征工程的重要性
2. 常用特征工程处理技术:
1) 特征选择
2) 特征构造
3) 特征转换
4) 特征学习
3. 特征工程的在学术研究中的应用
三、 神经网络与深度学习
1. 神经网络的引入,为什么需要深度学习?
2. 深度学习常用模型介绍与应用:
1) 卷积神经网络与图像处理
2) 循环神经网络与文本分析
3) 多模态网络与应用
3. 深度学习在学术研究中的应用:
1) 股票市场预测
2) 信用风险评估
3) 资产定价
课程费用:
编程基础:1300元;
爬虫:2000元;
文本:3000元;
机器学习:5200元;
机器学习进阶:4200元
提供电子版发票及课程通知,结业证书
在线报名:
编程基础:https://www.peixun.net/main.php?mod=buy&cid=1874
爬虫:https://www.peixun.net/main.php?mod=buy&cid=1937
文本:https://www.peixun.net/main.php?mod=buy&cid=1938
机器学习:https://www.peixun.net/main.php?mod=buy&cid=1898
机器学习进阶:https://www.peixun.net/main.php?mod=buy&cid=1851
报名流程:
1. 点击在线报名链接,在线提交报名信息;
2. 提交订单,支持支付宝/微信/银联在线支付;对公转账请联系我们;
3. 确认发票信息,2个工作日发送至邮箱;
4. 发送课程资料及开通流程,入交流答疑群。
试听及课程咨询:
尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu
