全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1038 0
2016-11-25
数据挖掘如何入门_数据挖掘基础知识_数据挖掘成长之路

从数学的角度谈一下吧:最基本的理解数据挖掘,应该需要最优化,凸分析(这个其实只要一点点),线性代数,统计学,数值计算等(等我想起来了再补充)。老实说,对数学课程的种类不多,范围不大,但是对理解的深度却要求颇高。你不理解欧式空间距离,就没办法理解k临近,你不理解条件概率和最大似然估计就不理解贝叶斯、EM算法,你不理解马尔可夫, 你就不理解隐式马尔可夫,你不理解梯度,就没法理解梯度下降法,你不理解常用的数值算法思路,就没法理解随机梯度下降法。

总而言之,大多数工科学术学习数学的套路:记公式,套题。是不太适合进行深入学习的。数学中有很多公认的直觉性的东西,也许聪明人他没有在专业数学领域学习过,也有这种直觉,但是对于大多数人认为数学很难,也就是因为既没有大量的时间去琢磨数学思维,又没有“天赋”。

对于数据挖掘初学者的建议,就像前面的朋友说的,希望你从少数算法入手,理解意义,code出来,在这个code的过程中,发现自己不理解的,再去查资料,会提升很快。

关键不是数学的哪里,关键是怎么学。工科数学都会学高数,线代,概率统计,数学物理方程,数值算法之类的吧。把这些课程中,原理都弄明白。因为大部分大学生学习数学知识为了应付考试,而应付考试只要记住公式套用就行了,你如果能明白这个公式怎么来的,就能明白后面的机器学习的算法了。

老实讲,如果你本科数学比较牢靠的话,建议看一下优化相关的理论,比如说凸理论。然后直接可以开始看机器学习相关的书了。因为你是数学专业出身,我给你推荐三本书,应该是非常符合数学人的口味的。李航的统计学习方法,李航是日本哪个大学的博士,目前在华为诺亚方舟实验室,这本书讲的浅显易懂,条理清楚,逻辑严密。周志华的机器学习,周志华是南京大学的教授,这本书也非常重理论,非常好,讲的范围要比第一本书大,方法也更新。第三本是PRML,这本书重在用bayes流派的思路解释机器学习,如果基础牢靠,这本书会让你收获非常大,这本书在git上有汉译版,我曾经翻译过两章,直到我在git上找到了汉译版,翻译质量也很不错。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群