数据挖掘
--模型算法、代码实现、经典应用
| 报名时间 | 2013-12-31 08:49 至 2014-01-17 23:00 |
| 培训时间 | 上午9:00-12:00;下午1:30-7:00;答疑 |
| 培训地点 | 北京市海淀区首都体育学院 |
| 培训费用 | 3000元 /2000元(凭学生证优惠价) |
| 授课安排 | 2014-01-18至2014-01-19(两天) |
我要报名
讲师介绍:
钟超,毕业于哈尔滨工程大学,现任京东商城商业智能部高级数据挖掘工程师。
主要研究方向为:最优化方法,机器学习,推荐系统,搜索引擎算法。同时关注大规模机器学习算法的实现,专注于机器学习算法在电商中的应用。
负责和参与了京东多个重要的数据挖掘应用项目,理论基础扎实、擅长算法代码实现,实战经验丰富。
课程特色:
通俗易懂地系统讲述经典数据挖掘算法,算法结合代码让听众深入算法内部;
多个大型互联网公司内部实际应用案例,让听众结合理论更好的理解理论和增强数据挖掘算法的实际应用能力,快速将数据挖掘应用到实践中。
本课程用Python实现各个算法,但不要求学员必须有Python经验,通过一些互联网案例展示机器学习的应用,但又不限于互联网。
学员对象:
企业员工,想对数据挖掘的理论进一步深入梳理,并想增加数据挖掘的实战应用储备;
对数据挖掘有兴趣或者想转行为数据挖掘的人员,但要求对数据挖掘及其中模型和算法有基本了解;
在校硕士和博士研究生,有一定的数据挖掘知识基础。
培训目标:
对数据挖掘的模型和算法有一个系统、深入的理解,使学员可以具备对数据挖掘高级部分的自学能力;
现场展示模型和算法的代码实现,使学员具备算法的代码实现能力;
丰富的实战案例,启发学员对数据挖掘应用的更深层次理解,使学员能更灵活的应用数据挖掘与实践。
课程大纲:
一 机器学习概述
1 统计学习
2 监督学习
3 模型评估与选择
4 模型的泛化能力
二 预测算法
1 一元线性回归
1.1为什么用回归
1.2一元线性回归模型
2 最优化方法-梯度下降法
3 基函数与核函数
3.1多项式回归
3.2回归模型中的基函数
4 欠拟合与过拟合
4.1欠拟合
4.2过拟合
5 多元线性回归
6 应用实例
三 分类算法
1 线性分类器-感知器
1.1感知器
1.2感知器的学习策略
1.3优化损失函数
1.4代码实现
2 线性分类器-逻辑回归
2.1逻辑回归分布
2.2二项逻辑回归
2.3参数估计
2.4基函数
2.5过拟合(正则化)
2.6参数的矩阵表示
2.7代码实现
3 贝叶斯分类器
3.1贝叶斯公式
3.2高斯贝叶斯分类器
3.2.1理论简介
3.2.2代码实现
3.3多项式贝叶斯分类器
3.3.1 构造数据集信息
3.3.2 计算特征(单词)概率
3.3.3 计算整篇文档的频率
3.3.4 贝叶斯公式
3.3.5 选择分类
3.3.6 费舍尔方法
3.3.7 增量式训练
4 总结
5 应用实例-主动客服
四 聚类算法
1 KMEANS
2 谱聚类
3 应用实例-网格化配送
五 降维算法
1 主成分分析(PCA)
1.1 主成分应用
1.2一个例子
1.2.1求主成分和主成分得分
1.2.2确定分析精度
1.2.3分析结果
1.2.4程序解析
2 隐性语意分析(LSA)
2.1基于LSA的文本摘要算法
2.2文本降维
3 应用实例-文本聚类
六 模型选择
1 交叉验证
2 准确率、召回率、F-得分
3 混淆矩阵
七 推荐算法
1 推荐系统概述
2 推荐系统类型
3 推荐系统的组成
4 基于协同过滤的推荐
4.1什么是协同过滤
4.2协同过滤的核心
4.3协同过滤算法
4.3.1基于用户的协同过滤推荐
4.3.2基于项目的协同过滤推荐算法
5推荐算法评价
5.1训练数据和得分
5.2准确率和召回率
八 技术前沿
1 深度学习
2 流形学习
3 知识图谱
4 推荐阅读
我要报名
联系方式:
魏老师:
Mail:vip@pinggu.org
QQ:1143703950 
Tel: 010-68478566