统计学习基础
卿来云中国科学院硕士院信息学院lyqing@gucas.ac.cn / lyqing@jdl.ac.cn
概率 vs. 统计
概率:研究随机事件出现可能性数学分支,描述非确定性正式语言基本问题:给定以一个数据产生过程,输出性质? 统计推断:处理数据分析和概率理论数学分支,与数据挖掘和
机器学习是近亲基本问题:给定输出数据,该数据产生过程?
数据产生过程
观察到数据
概率
统计推断
统计学习
统计学 ≈ 依据数据进行推理学科统计学习 ≈多元统计分析 + 计算统计学多元统计分析 ≈ 基于一个多元变量数据集,预测函数值计算统计学 ≈ 统计问题计算方法 (a.k.a. 统计计算) + 计算繁重统计方法数据挖掘 ≈ 研究
数据分析,尤其是大数据量/复杂数据集