问:数据挖掘/机器学习,这一方向数学很重要,但是我现在除了大学高数和线性代数以外,平时在数学上没花什么时间。请问,我现在应该去补充哪些数学知识,如果可以的话,能否也推荐一下所需的书籍
答:填鸭式学习效率低下,非常不推荐盲目地做技术储备。
搞技术也要做到不忘初心,你明确你的最终目的是什么?我甚至能想象出你未来1年的状态,看经验贴,然后花大半年学习统计、线代、泛函分析、测度、拓扑、图论,苦苦针扎,耗时无数。当你终于熬出了黑眼圈时,忽然发现,我tm要学的不是数据挖掘吗?为什么感觉这个方向好难,好痛苦,亚历山大...
我从毕业半年之后就逐渐纠正了自己的技术学习方法误区。cs相关领域有一个巨大的优势,就是大多数都可以通过动手来实现。一定要利用好这个优势。我现在学习一门新的技术,入门阶段是不会看完整的书的。看书应该是一个反向验证和知识整理的过程,也就是等你动手实践过,google搜索过,遇到了无数的疑惑,大部分被解决了,小部分残留在脑海中挥之不去,跟猫爪一样,就是通过看一些高质量的博文,学到了不少相关的知识点,但是太零散,无法形成体系时才回过头去看书。这样的正反馈过程才是更有利于你掌握一门技术的。
数据挖掘也一样,你首先做的应该是先钻进去,搜一下常见的算法,找几种易于实现它的工具和语言(python, r, matlab), 搜一些备用的数据集。然后看到一个好的算法,先学习,后实现,再优化,遇到不懂的google。当你经过某个阶段,终于感觉到数学基础成为你进步的瓶颈时才开始回过头去学习它。
摸黑走了一段夜路,被绊倒无数次,很痛苦。但那些坑坑洼洼总会有印象的吧?第二天白天起个大早再走一遍,也许你会说:"卧槽,原来是这么些破玩意绊倒了老子"。
转自知乎「YuMo」回答
2016年,经管之家《机器学习》全国4月开课,详情请戳:http://www.peixun.net/view/558.html