全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
713 0
2022-03-04
课程简介
本课程将世界客户关系管理方面的领导者美库尔公司 (Merkle Inc)在专业管理咨询方面的几十年的经验积累与CDA数据分析研究院的教学理念与方法相结合,归纳了在商业智能系统设计、客户画像、精准营销、生命周期价值管理等主题的课程。为实践者提供全面的使用R进行商业数据分析的解决方案。 本课程以案例为主线,结合开源R工具,全面讲解了客户生命周期管理中涉及的主要机器学习主题。而且注重业务与算法的深入结合,在轻松的氛围内体会算法的奇妙之处。

学习目标
  • 学会高级数据分析及机器学习算法知识
  • 掌握最流行的开源数据挖掘软件之一R
  • 熟知整个商业数据挖掘框架、流程与思路
  • 了解前沿技术,增强业务与技术对接能力


学习对象和基础
  • 各行业数据分析、机器学习从业者
  • 金融、电信、零售、医学等各行业业务数据分析人员
  • 政府事业单位大数据及数据挖掘项目人员
  • 数据挖掘岗位就业、提拔涨薪、技能优化等从业人员
  • 对数据挖掘感兴趣的各界人员


岗位职责
  • 深入理解企业的业务需求,构建涵盖用户行为,用户群组、特征标签等企业级用户大数据模型,并完成项目实施落地。
  • 负责编制算法设计文档,根据不同的应用场景进行适当的算法选型、仿真测试、结论验证、算法迭代、模型优化,并完成数据分析结论的可视化报告输出。
  • 对企业数据保持充分理解和高度敏感,积极思考并拓展数据应用场景,负责数据应用方案拟定、执行落地、效能评估、模型优化,持续加强数据应用能力并丰富应用场景。
  • 探索并挖掘企业经营过程中的客观规律,形成企业经营的经验知识库,依据这些规律协助经营决策、指导产品优化、助力业务增长、提升服务水平,以此加强数据驱动能力,实现企业数字化转型。


任职要求
  • 计算机、数学、统计学相关专业,硕士及以上学历;有3年以上数据挖掘或算法研发的相关经验。
  • 熟练使用SQL,熟练使用Mysql/Oracle/Hive中的至少一种数据库工具;熟悉主流的大数据技术,比如Spark、Hbase、Storm、Flink、NoSQL等。
  • 熟悉R、Python、Java中至少一种开发语言;熟悉SPSS、SAS等数据分析工具;熟练使用TensorFlow、Pytorch、sparkMLlib、flinkML等主流机器学习框架。
  • 有扎实的数据结构和算法功底,精通关联、聚类、回归、预测等算法的原理与应用,能够针对不同的业务需求使用不同的算法模型实现业务诉求,能够独立进行数据建模和参数调优。
  • 具有金融、电信行业用户画像、精准营销等项目研发实施经验优先;具有电商行业智能推荐算法研发实施经验优先。


目标人群
  • 对机器学习感兴趣的人员
  • 对数据科学领域感兴趣的人员
  • 对数据挖掘感兴趣的人员
  • 对数据挖掘感兴趣算法研究的人员


课程内容
第一章:R语言编程与统计分析
  • R语言入门与安装
  • R的数据类型与数据结构
  • R的程序控制
  • R的函数与数据导入
  • 变量的分类
  • 变量统计特征探索
  • 变量的可视化探索
  • 参数估计
  • 假设检验与单样本T检验
  • 两样本T检验
  • 方差分析方法

第二章:市场调研与数据处理技术(基于R)
  • 市场调研方法与类型
  • 定性调研与定量调研
  • 数据抽样技术
  • 分析调研数据
  • 调研结构的交流与审查
  • 数据的获取方法
  • 数据清理方法
  • 数据变换
  • 数据规约

第三章:回归分析预测
  • 回归分析的理论基础
  • 回归分析模型的构建
  • 回归的建模
  • 回归建模的结果解读
  • 回归诊断
  • 异常值处理
  • 多重共线性处理
  • 自相关处理
  • 异方差性处理
  • 挑选最佳模型

第四章:客户画像
  • 聚类方法简介
  • 相似性 相异性的衡量
  • 聚类算法的分类
  • 阶层式聚类方法
  • 分割式聚类方法
  • 群数的判断
  • 群特征描述
  • 以R语言进行阶层式聚类分析及算法参数调整
  • 以R语言进行分割式聚类分析及算法参数调整
  • 聚类分析部分作业

第五章:K最近邻算法
  • K最近邻分类及数字预测的原理
  • K最近邻模型建置
  • K最近邻应用
  • 以R语言进行K最近邻分类模型建置及算法参数调整
  • 以R语言进行K最近邻数字预测模型建置及算法参数调整
  • KNN部分作业

第六章:贝叶斯网络
  • 贝式网络简介
  • 朴素贝式网络模型建置
  • 贝式网络模型建置-TAN模型原理
  • R语言实作案例:银行信用评分卡案例
  • 以R语言进行朴素贝式网络模型建置及算法参数调整
  • 以R语言进行贝式网络模型建置及算法参数调整
  • 数学与科学的反映- 贝式网络作业

第七章:决策树算法模型
  • 分类树的学习及测试阶段
  • 分类树的种类及分类树的归纳学习原理
  • 分类树的属性选择
  • 分类树的砍树方法
  • 分类树与分类规则
  • 回归树的归纳学习原理
  • 回归树的改进-模型树
  • 回归树的属性选择方法
  • 以R语言进行分类树模型建置及算法参数调整
  • 以R语言进行回归树模型建置及算法参数调整
  • 分而治之的算法模型-决策树-作业

第八章:神经网络算法
  • 生物神经网络的构造
  • 倒传递神经网络的架构
  • 以倒传递神经网络建立分类模型
  • 顺向数值传递
  • 逆向权重及偏移植修正
  • 神经网络逐步分类学习过程及CISPACE演示
  • 以倒传递神经网络建立数字预测模型
  • 神经网络逐步数字预测学习过程及CISPACE演示
  • 数值型及类别型属性的数据前处理
  • 类神经网络的优缺点及与线性回归...间的关系
  • 人工智能的底层模型- 神经网络作业
  • 以R语言进行分类模型建置及算法参数调整
  • 以R语言进行数字预测模型建置及算法参数调整

第九章:罗吉斯回归
  • 罗吉斯回归简介_以罗吉斯回归建立分类模型_数据前处理
  • 罗吉斯回归逐步分类学习过程及CISPACE演示
  • 以R语言进行分类模型建置及算法参数调整
  • 应用最广的模型之一-罗吉斯回归-作业

第十章:支持向量机
  • 线性可分与线性不可分_坐标转换
  • 支持向量_决策边界_线性支持向量机
  • 错误率与最大决策边界_非线性支持向量机及核函数_支持向量机与线性
  • 以R语言进行分类模型建置及算法参数调整
  • 以R语言进行数字预测模型建置及算法参数调整
  • 最受欢迎的智能算法-支持向量机作业
  • R数据挖掘答疑-李御玺
  • R语言答疑-李御玺

第十一章:时间序列分析
  • 时间序列分析简介
  • 时间序列分析简介1
  • 时间序列分析简介2
  • 时间序列模型介绍
  • 时间序列模型介绍-序列平稳
  • 时间序列模型介绍-白噪声序列
  • 时间序列模型介绍-自回归模型
  • 时间序列模型介绍-移动平均模型
  • 时间序列模型介绍_ARMA 模型
  • 时间序列模型介绍-ARIMA模型
  • ARIMA 预测
  • BOX-JENKINS 建模流程
  • 时间序列R程序--理论应用
  • 时间序列R程序理论应用-白噪声序列
  • 时间序列R程序理论应用-自回归模型
  • 时间序列R程序理论应用-ARMA模型
  • 时间序列R程序理论应用-ARIMA模型
  • 时间序列R程序理论应用- BOX-JENKINS 建模流程
  • 时间序列R程序--企业案例:电商渠道电脑销量的预测

第十二章:时间序列分析
  • 关联规则概念与原理
  • 本课程所需要准备的软件与配置
  • 推荐系统的基本概念与分类
  • 如何评价一个推荐系统
  • 购物篮分析与关联规则
  • 什么是购物篮分析--原理与基本概念
  • 关联规则挖掘算法与其优缺点
  • 案例:家居用品商店的营销策略
  • 关联规则可视化
  • 相似性推荐与系统过滤
  • 如何收集用户偏好
  • 如何计算相似度
  • 相似性与协同过滤
  • 相似性和协同过滤--5.案例
  • 基于内容的推荐与混合推荐
  • 基于矩阵分解(SVD)的推荐算法
  • SVD矩阵分解--原理
  • SVD矩阵分解--案例

第十三章:集成学习算法
  • 集成学习简介
  • 集成学习模型建置
  • 以R语言进行袋装法模型建置及算法参数调整
  • 以R语言进行提升法模型建置及算法参数调整
  • 以R语言进行随机森林模型建置及算法参数调整
  • 机器学习兵器谱的屠龙刀-集成学习算法作业

第十四章:文本分析
  • 文本分析基本概念_文本分析流程
  • 中文分词与中文词性标注_关键词提取与N-gram字组
  • 文件分类1
  • 文件分类2
  • 文本聚类
  • 情感分析
  • 自然语言处理与机器学习结合-文本分析作业

第十五章:社会网络分析
  • 社会网络表示方式_网络密度_网络节点进出程度
  • 扩散分析_扩散分析理论
  • 群组分析_社会相似性_分割群组_群组与群组成员描述
  • 以R语言进行扩散分析模型建置、选择模型及算法参数调整
  • 以R语言进行群组分析模型建置、选择模型及算法参数调整
  • 统计学的新兴领域—社会网络分析作业

第十六章:深度学习
  • 深度学习算法的历史_物体侦测、语言处理
  • 网络架构1
  • 网络架构2
  • 卷积层_池化层_联结卷积层及池化层
  • 以R语言进行DNN手写数字模型建置、选择模型及算法参数调整
  • 以R语言进行CNN手写数字模型建置、选择模型及算法参数调整
  • 人脑工作机制的模拟器—深度学习作业

第十七章:大型项目实作案例
  • 策划某跨国电脑公司的营销活动
  • 商业上建模流程
  • 技术上建模流程
  • 逻辑回归模型1
  • 逻辑回归模型2
  • 逻辑回归模型3
  • 逻辑回归模型4
  • 线性回归模型1
  • 线性回归模型2
  • 两阶段的应用
  • 零售业忠诚客户预测案例大型实际案例(数据大小超过20G)
  • 零售业忠诚客户预测项目
  • 数据集表格及字段意义说明_数据集表格及字段描述性统计
  • 数据的一些观察_数据的检察_解题思路的说明_衍生性字段的产生
  • 效能评估方式的说明
  • 以R语言进行分类模型建置、选择模型及算法参数调整
  • 以R语言进行分类模型建置、选择模型及算法参数调整
  • 以R语言进行分类模型建置、选择模型及算法参数调整
  • 零售业项目实作案例作业
  • 金融业银行信用卡评分项目实作
  • 评分卡1 业务理解
  • 评分卡2 数据理解
  • 评分卡3 数据准备
  • 评分卡4 变量粗筛
  • 评分卡5 变量细筛
  • 评分卡6 建模
  • 评分卡7 模型评估
  • 评分卡8 评分转换
  • 评分卡9 模型监测
  • 评分卡10 代码演示

加入课程《R语言机器学习工程师》

DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群