全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
4364 32
2023-08-03

Python学习路径建议

编程基础及数据清洗→(爬虫)→机器学习→文本分析&机器学习进阶


Python师资培训课程矩阵:

  • 编程基础与数据清洗
  • 爬虫应用
  • 文本分析
  • 机器学习
  • 机器学习进阶

课程信息

课程时长:

编程基础:918分钟

爬虫:611分钟

文本:611分钟

机器学习:2160分钟

深度学习:1440分钟


上课方式:在线学习,提供全部资料及授课老师答疑

授课与答疑均是授课老师陈远祥本人,非助教答疑

不同于其他Python课程,单独为学术研究打造的Python机器学习学术应用课程


讲师简介

陈远祥老师,北京邮电大学副教授 。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。

发表SCI/EI学术论文100余篇,其中第一或通讯作者论文60余篇,申请发明专利20项。

主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。

IEEE、OSA会员,OpticsExpress, IEEE Photonics Technology Letters,PhotonicsJournal,Applied Optics等多个SCI期刊审稿人。陈远祥老师近2年开设的Python师资培训系列课程受到了高校群体的认可。


课程内容:

Python编程基础与数据清洗

C1:前言

C2:Python语言概述

C3:Python中的数据类型

C4:控制流

C5:函数设计与使用

C6:面向对象编程

C7:文件操作

C8:Numpy

C9:pandas

C10:matplotlib绘图

C11:pyechart绘图


Python爬虫

1. 爬虫基础

1.1 爬虫基本概念

1.2 通用爬虫和聚焦爬虫

1.3 http的请求与响应

1.4 网页基础知识


2. 简单爬虫实现

2.1 爬虫基本原理

2.2 爬虫与反爬虫

2.3 正则表达式

2.4 requests库实现http请求

2.4.1 实战1:豆瓣电影分类排行榜(JSON数据格式)

2.4.2 实战2:猫眼电影排行榜数据提取

2.4.3 实战3:基于cookies爬取豆瓣短评分析

2.5 BeautifulSoup

2.5.1 网页的解析

2.5.2 网页元素的选取

2.5.3 实战:从中国天气网获得天气数据;爬取豆瓣电视剧评分


3. 爬虫高级技术进阶

3.1 多页面的爬取

3.2 动态渲染页面的爬取

3.3 基于selenium的自动化爬取技术

3.4 实战:多页面爬取京东商品数据


Python文本分析

1. 文本处理常用字符串方法精讲

  • 字符串的不变性
  • 排序行
  • 段落格式化
  • 二进制转化为ASCII
  • 重复字词过滤
  • 提取邮件地址
  • 提取URL地址
  • 大写转换
  • 符号化
  • 删除停用词
  • 同义词与反义词处理
  • 文本翻译
  • 单词替换
  • 拼写检查
  • WordNet接口
  • 语料访问
  • 标记单词
  • 块和裂口
  • 块分类
  • 文本分类
  • 双字母组
  • 文字改写
  • 文字换行
  • 频率分布
  • 文字摘要
  • 词干算法
  • 约束搜索
  • numpy数值计算要点串讲
  • Pandas数据处理串讲
  • python统计图表展示


2. 重要的库

jieba库简介


3. 关键词提取

  • 关键词任务概述
  • TF-IDF算法原理
  • 相似文章推荐原理介绍
  • 实例:红楼梦文本分析的实现
  • 文件与词库的读取
  • 完成分词与词云图的绘制


4. 文本分类

  • 新闻素材介绍
  • 新闻内容的关键词提取
  • 词向量转化与ngram模型
  • 朴素贝叶斯算法完成新闻分类


5. 文本聚类

语料的加载,文本特征的提取,利用聚类算法对文本进行聚类


Python机器学习:

第一部分:机器学习思想与学术应用介绍:

  • 机器学习基本思想
  • 机器学习分类
  • 常用机器学习常用算法
  • 机器学习评价标准
  • 机器学习算法库介绍
  • 机器学习常见学术应用


第二部分:算法原理与实战

1、 KNN算法:

KNN算法基本原理,常用相似度衡量方法、KNN用于分类和回归,KNN模型的优化与调参

案例应用:鸢尾花分类与波士顿房价预测


2、 决策树:

决策树基本原理,决策树分类,决策树用于分类和回归实现,决策树参数优化

案例应用:保险行业用户画像


3、 线性回归:

线性回归模型基本原理、岭回归、LASSO回归和弹性

案例应用:基于不同场景之下共享单车投放量的精准预测


4、 逻辑回归:

逻辑回归基本原理,从线性回归到逻辑回归,逻辑回归实现和参数优化

案例应用:数字化人力资源之员工流失风险预警


5、 神经网络与深度学习简介:

神经网络基础,神经网络中的激活函数,神经网络Python实现与参数调优,深度学习简介

案例应用:数字识别与图片分类


6、 贝叶斯网络:

贝叶斯分类原理,朴素贝叶斯,贝叶斯模型分类

案例应用:门户网站新闻分类


7、 支持向量机:

支持向量机分类原理,线性SVM和非线性SVM

案例应用:人脸识别


8、 随机森林:

决策树与随机森林,随机森林原理,随机森林Python实现与参数调优

案例应用:泰坦尼克沉船预测


9、 聚类:

聚类原理,聚类和分类区别,kmeans聚类原理,kmeans python实现,模型评估指标及稳定性讨论

案例应用:航空客户价值分析


10、时间序列分析:

时间序列特征,时间序列模型介绍,时间序列建模

案例应用:电商线上零售商品销量预测


第三部分:Python机器学习学术应用与基金申请

1、机器学习学术应用:数据发现与变量创造,预测,因果推断

2、机器学习学术论文解读与写作指导

机器学习方法识别车险欺诈效果的比较研究

大数据思维下的利率定价研究

基于机器学习预测的投资组合量化研究

通货膨胀影响因素识别:基于机器学习方法的再检验


3、机器学习与基金申请(国自然)

基金申请流程与常见思路

成功案例分享:基于机器学习的损伤感知与补偿机制研究


Python机器学习进阶:

一、 集成学习介绍与应用

1.集成学习的优势

2.集成学习常用算法介绍:原理与实现

    1) 随机森林

    2) adaboost

    3) GBDT

    4) Xgboost

    5) Stacking

3.集成学习算法的学术应用


二、 高级特征工程处理技术

1. 特征工程的重要性

2. 常用特征工程处理技术:

    1) 特征选择

    2) 特征构造

    3) 特征转换

    4) 特征学习

3. 特征工程的在学术研究中的应用


三、 神经网络与深度学习

1. 神经网络的引入,为什么需要深度学习?

2. 深度学习常用模型介绍与应用:

    1) 卷积神经网络与图像处理

    2) 循环神经网络与文本分析

    3) 多模态网络与应用

3. 深度学习在学术研究中的应用:

    1) 股票市场预测

    2) 信用风险评估

    3) 资产定价


试听及课程咨询:

尹老师

电话:13321178792

QQ:42884447

WeChat:JGxueshu

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-8-3 14:06:00

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-8-3 14:06:28

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-8-3 14:06:50

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-8-3 14:21:17
看看,学习学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-8-3 16:18:00
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群