| 第一章:课前基础-数据库 SQL |
1、数据库基本概念 2、DDL 3、DML 4、单表查询 5、多表查询 6、常用函数 6、SQL 大厂面试题 |
1、掌握 MySQL 数据库基本概念,常用函数、DDL 数据定义语言及 DML 数据操作语言 2、掌握单表查询、多表查询查询方法,查询结果排序、限制查询等方法 |
| 第二章:课前基础-Python |
1、Numpy 数组 2、Pandas 数表 3、Pandas 数据清洗与可视化 4、控制流 5、类与对象 6、自定义函数 |
掌握使用 Python 进行海量数据清洗以及可视化探索数据的能力。 |
| 第三章:课前基础-数学统计基础 |
1、线性代数 2、微积分 3、描述性统计 4、参数估计 5、假设检验 6、相关分析 7、一元线性回归 |
1、掌握数学基础知识(线性代数、微积分等) 2、掌握统计学基础知识(描述性统计、参数估计、相关分析、卡方分析、一元线性回归等) |
| 第四章:SQL |
1、MySQL 语句 2、Python 连接 SQL 数据库 3、SQL 4、实操案例:零售电商多表分析 |
1、掌握数据库 MySQL 语句与实战 2、Python 连接 SQL 数据库 3、掌握案例:零售电商多表分析 |
| 第五章:指标体系+统计分析 |
1、分析基础 2、指标体系的意义与构建 3、常用指标体系 4、统计分析可视化 5、指标体系 |
1、掌握数据分析基础:数据分析的概念、过程、能力 2、掌握常用指标体系的意义与构建 3、掌握统计分析可视化 4、掌握指标体系案例:企业经营分析 |
| 第六章:Pandas |
1、Python 基础 2、Python 数据清洗可视化 3、Python 实操 4、案例:教育行业分析-学校学科教育可视化 数据分析师岗位需求-lagou 数据处理及分析 |
1、掌握 Python 基础与数据清洗可视化 2、掌握 Python 实操案例:教育行业分析-学校学科教育可视化 3、掌握 Python 实操案例: 数据分析师岗位需求-lagou数据处理及分析 |
| 第七章:方差分析与线性回归 |
1、统计分析 2、相关分析 3、方差分析 4、线性回归 5、模型建立 6、模型估计 7、模型检验 8、实操案例:识别分析-用户支出影响因素分析 |
1、掌握统计分析,包含相关分析,方差分析等 2、掌握线性回归,包含模型的建立与估计等 3、掌握统计模型的检验 4、掌握案例:识别分析-用户支出影响因素分析 |
| 第八章:逻辑回归与主成分分析 |
1、逻辑回归 2、模型评估 3、分类与回归的结合 4、数据降维 5、主成分分析 6、因子分析 7、实操案例:用户流失分析-员工流失预警 因子分析-城市发展水平综合分析 |
1、掌握逻辑回归,包含模型的建立与估计 2、掌握模型评估、分类与回归的结合 3、掌握信息压缩-主成分分析与因子分析(数据降维) 4、掌握案例:用户流失分析-员工流失预警 5、掌握案例:因子分析-城市发展水平综合分析 |
| 第九章:标签体系与用户画像 |
1、标签体系的设计原理 2、用户标签的制作方法 3、客群分析-标签体系与用户画像 4、AB test 5、实操案例: 应用用户画像-美国某企业用户画像实战案例 |
1、掌握标签体系的设计原理 2、掌握用户标签的制作方法 3、掌握客群分析-标签体系与用户画像 4、掌握 AB test 应用最广泛的对比分析方法 5、掌握案例:应用用户画像-美国某企业用户画像实战案例 |
| 第十章:时间序列 |
1、时间序列分析 2、ARIMA算法 3、Box-Jenkins 建模 4、时间序列回归 5、实操案例: 销售额预测-线上平台销售额预测实战案例 |
1、掌握时间序列分析(ARIMA 算法) 2、掌握 Box-Jenkins 建模流程 3、掌握时间序列回归 4、掌握案例:销售额预测-线上平台销售额预测实战案例 |
| 第十一章:数据处理与特征工程 |
1、数据采集 2、数据录入 3、数据清洗 4、特征工程基础 5、特征预处理 6、特征的选择转换 7、数据管理 8、数据分类 9、数据建模 10、实操案例: 产品目标人群分析-市场数据的应用案例 |
1、掌握数据采集处理方法,包含数据采集、数据录入、数据清洗 2、掌握特征工程基础,包含特征预处理、特征的选择与转换 3、掌握数据管理,包含数据分类、数据建模 4、掌握案例:产品目标人群分析-市场数据的应用案例 |
| 第十二章:聚类分析与决策树 |
1、层次聚类 2、Kmeans 聚类 3、决策树应用 4、聚类分析评价方法 5、实操案例: 用户分群-零售行业运营案例 |
1、掌握层次聚类知识 2、掌握 Kmeans 聚类知识 3、掌握聚类分析评价方法-决策树应用 4、掌握案例:用户分群-零售行业运营案例 |
| 第十三章:数字化工作方法 |
1、数字化工作方法 2、运筹优化方法 3、线性规划与二次优化 4、基于业务流程的优化 5、实操案例: 数字化运营综合案例-某机构营销响应概率预测与风险预测案例 |
1、掌握数字化工作方法 2、掌握运筹优化方法,包含线性规划与二次优化、基于业务流程的优化 3、掌握数字化运营综合案例-某机构营销响应概率预测与风险预测案例 |
| 第十四章:ETL 与数仓 |
1、ETL 基本概念与常用工具 2、Kettle 核心概念与配置 3、数据接入策略与调度 4、Kettle 转换 5、Kettle 作业 6、Kettle 连接数仓 7、ETL 实战项目 |
1、掌握 ETL 基本概念与常用工具 2、掌握 Kettle 核心概念、转换 3、掌握 ETL 连接数仓,实操 ETL 实战项目 |
| 第十五章:数据接入与大数据 |
1、分布式存储 2、PySpark 分布式计算 3、Spark 与 Flink 工作原理 4、Spark 基本语法 |
1、掌握分布式存储与计算 2、掌握 Spark 与 Flink 工作原理 3、掌握 Spark 基本语法 4、掌握使用 PySpark 实现分布式计算 |
| 第十六章:决策树 |
1、决策树 2、信息熵 3、ID3决策树 4、C4.5决策树 5、CART树 6、模型调参 7、实操案例:病马死亡归类与识别案例 用户分类-保险行业用户分类分析 |
1、掌握决策树与信息熵 2、掌握 ID3, C4.5, CART 树 3、掌握 模型调参:网格搜索 4、掌握案例:病马死亡归类与识别案例 5、掌握案例:用户分类-保险行业用户分类分析 |
| 第十七章:数据挖掘与 Pipeline |
1、数据挖掘导论 2、KNN 3、朴素贝叶斯 4、Pipeline 工作流 5、使用 Pipeline 提交算法模型 |
1、掌握数据挖掘导论 2、掌握 KNN 邻近算法 3、掌握朴素贝叶斯法 4、掌握 Pipeline 工作流 5、使用 Pipeline 提交算法模型 |
| 第十八章:正则回归、SVM |
1、带正则项的回归分析 2、SVM 3、MLOps 基本概念 4、MLFlow 实战 MLOps 5、大数据环境下的回归分析实现 |
1、掌握带正则项的回归分析 2、掌握大数据环境下的回归分析实现(用 Spark 实现) 3、掌握 SVM 支持向量机 4、掌握 MLOps 基本概念 5、掌握 MLFlow 实战 MLOps |
| 第十九章:关联规则与协同过滤 |
1、关联规则 2、评估指标 3、Apriori 算法 4、协同过滤 5、大数据环境下的协同过滤实现 6、实操案例:产品组合策略-电信公司产品捆绑销售策略分析案例 |
1、掌握关联规则,包含关联规则的概念、评估指标、Apriori 算法等 2、掌握协同过滤 3、掌握大数据环境下的协同过滤实现 4、掌握产品组合策略案例-电信公司产品捆绑销售策略分析案例 |
| 第二十章:集成与提升方法 |
1、集成学习理论基础 2、AdaBoost 3、随机森林及其 Spark 实现 4、GBDT 5、XGBoost 6、LightGBM 7、CatBoost 8、NGBoost |
1、掌握集成学习的理论基础 2、掌握 AdaBoost 3、掌握随机森林及其 Spark 实现 4、掌握 GBDT, XGBoost 5、掌握 LightGBM, CatBoost, NGBoost |
| 第二十一章:特征工程进阶 |
1、数据不平衡问题 2、特征的构造与学习 3、模型可解释性专题(SHAP 和 LIME) 4、感知器 5、多层感知器 |
1、掌握掌握数据不平衡问题相关知识 2、掌握特征工程进阶:特征的构造与学习 3、掌握模型可解释性专题(SHAP 和 LIME) 4、掌握感知器及多层感知器 |
| 第二十二章:深度学习基础 |
1、深度神经网络基础 BP 神经网络架构 2、反向传播算法 3、梯度与学习率专题 4、图像分析-手写数字自动识别 |
1、掌握深度神经网络基础 2、掌握 BP 神经网络架构 3、掌握反向传播算法 4、掌握梯度与学习率专题 5、掌握图像分析-手写数字自动识别 |