昨日阅读3 小时,总计135 小时
《机器学习导论》2nd Edition ---(土耳其)Ethem Alpaydin 著 范明 昝(zan)红英 牛常勇译 ----机械Press-2014.3
当前,这样的数据分析已经不能再依赖人工完成了,因为:1)数据量巨大;2)能做这种分析的人非常少且人工分析很昂贵。
统计学中,
从特殊的观测到一般的描述称为推断(inference),
学习称为估计(estimation)。
分类在统计学中称为判别式分析(discriminant analysis)
工程学中,分类称为模式识别(pattern recognition),方法是非参数的,且更大程度是凭借经验的。
ML与AI有关,因为智能系统应该能够适应其环境的变化。视觉、语音、机器人等应用领域都是从样本数据中学习。
电子工程领域,信号处理(signal processing)的研究使得自适应计算机视觉和语音程序出现。
隐马尔可夫模型(Hidden Markov Models, HMM)的发展对于语音识别尤其重要。
近年来,基于核的算法(如支持向量机)日趋流行。尤其适合生物信息学、NLP方面的应用。
对学习而言,好的数据表示至关重要,而核函数则是一种引进这种专家知识的好方法。
需要的不是新算法,而是大量数据实例和在这些数据上运行算法的充足计算能力。
Data Mining源于ML算法在商界海量数据上的应用。在计算机科学领域,Data Mining也称为数据库知识发现(knowledge discovery in database, KDD)
本书目标:结合所有研究领域(统计学、模式识别、神经网络信号处理、控制、AI以及Data Mining)研究重点,以给出统一的处理问题方法,并提出求解方案。
1.4 相关资源
ML的最新研究成果会发表在不同领域的会议和期刊上。ML专门的期刊有Machin Learning和Journal of Machine Learning Research。
神经网络为主的期刊有
Neural Computation、Neural Networks、IEEE Transactions on Neural Networks。
统计学方面的期刊:
Annals of Statistics、Journal of the American Statistical Association。
IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE模式分析与机器智能汇刊)