说明:这个帖子分5部分,每部分都根据我自己的体验和思考说了一个问题。以下是相关链接,欢迎拍砖。当然也欢迎版主加精,呵呵。
写给统计专业的学弟学妹们(1)——我学习统计的不幸与幸运
写给统计专业的学弟学妹们(2)——关于选择统计专业的若干问题
写给统计专业的学弟学妹们(3)——到底要怎么学习统计
写给统计专业的学弟学妹们(4)——找数据分析师相关的工作要注意什么问题
写给统计专业的学弟学妹们(5)——考博的一些建议
至于怎么学习好统计,我觉得有如下几点值得注意:
1) 首先要明白学习统计要达到的目的:能运用所学习的统计方法和模型去解决实际中于数据相关的问题,并产生价值;
2) 对统计学的历史还是应该去了解一下,比如可以去读一下陈希孺院士的《数理统计学简史》、《奈曼.来自生活的统计学家》,甚至功底足够可以去看看经典的文献《StatisticalModeling: The Two Cultures》等等,这样可以加深对统计的理解;
3) 一定要注重软件的学习,比如SAS和R,能用这些软件编程去处理实际数据,并能去做模拟数据实验;
4) 一定要注意学习各种统计方法和算法,尤其是统计算法的学习;
5) 一定要注意学习完相关的理论之后应该找个具体的实际问题去应用一下。看具体的流程是怎么样的;
6) 如果有可能可以辅修一下计算机专业java和C相关的课程。或者选修一下市场营销和金融相关的课程。
3)和4)两点大家尤其要注意,这是我们之前比较忽视的,但是这两点对于进企业的同学而言是非常重要的。
另外个人建议能多读一点能实际指导数据分析和数据建模的书籍,为此我推荐了如下一些书籍。这些书有一个共同的特点就是基本上没有理论证明。主要是思想、方法、算法和具体实践性的案例介绍:
1) 例解回归分析 译著中国统计出版社 郑明译
这本书是康奈尔大学统计系的一个教授所著,通篇都是用各种实际的例子解释在回归分析中遇到的问题,比如异方差检验 和处理、共线性处理等等
2) Logistic回归模型 高等教育出版社 王济川
这本书的作者是貌似是国外一所大学的医学统计教授,全书通过一个实际的案例由浅入深的讲解logistic建模过程中遇到 的各种问题
3) 应用时间序列分析(第三版)(21世纪统计学系列教材)中国人民大学出版社 王燕
这本书的作者是人大统计系的王燕,已经是第三版。全书对于时间序列模型无论是ARMA还是ARCH模型的思想及建模流程都做了深入浅出的描述。
4) 应用多元统计分析 北京大学出版社陈诗一译
这个书的作者是加拿大某个大学统计系的教授。著名的统计学家、统计学最高奖项COPSS奖得住范剑青教授亲自推荐。的确书写的也蛮不错。将理论和应用做到了很好的结合;
5) 数据挖掘导论 人民邮电出版社 译者: 范明 / 范宏建
这本实在特别值得推荐,可以说是大家小品,通俗易懂。据几个机器学习的博士说他们那些兄弟们基本人手一本。这本书对目前常见的数据挖掘算法都做了深入浅出的描述。实在是做分析和挖掘的同志们的居家必备;
6) SAS编程与数据挖掘商业案例 机械工业出版社姚志勇
这本书的作者是eBay(如果大家对数据挖掘这个行当有了解的话,eBay实际上代表着这个行业应用的世界一流水准。我们通常说的阿里的一流水准实际上很多是跟eBay学的)的一个很资深的数据挖掘工程师写的。作者自称是用良心在写书。的确,书写的很能指导商业实战。而不像很多书基本上是纸上谈兵。尤其是书中关于sas base和sas marco,及后面三个案例的讲解,堪称经典
7) 信用风险评分卡研究:基于SAS的开发与实施 社会科学文献出版社 林治乾译
这本书的作者书上有介绍,好像是个国外的博士。整本书通过一个案例讲信用卡评分的完整流程和SAS代码实现都做了非常完整而详细的描述。作者讲解的流程跟实际商业实践的流程一致。所以读这本大家能清楚的看到理论跟实践的差异。
以上这些书我个人觉得应该是统计专业毕业的本科和硕士必备的专业书籍。而且也是必读书籍。
当然要想毕业后进入企业能快速而轻松的胜任数据分析相关的工作,个人觉得以下这些书籍也非常值得一读:
1) 谁说菜鸟不会数据分析 电子工业出版社张文霖等
这本书在当当和京东上都是畅销书,实在是刚入门数据分析人员的必备书籍
2) 数据分析-企业贤内助
这本书也非常适合作为入门读物,整体而言应该比第一本书在实用性和思想性的水平有过之而无不及。
3) Excel图表之道 电子工业出版社 刘万祥
一图顶前言,的确,对数据分析师尤其如此。数据分析师做的数据分析图表往往是专业性最直接的体现
4) 你早该这么玩Excel 北京大学出版社 吴昊
excel实际上是第一统计分析工具。这本书讲的特别通俗。
5) 不懂项目管理还敢拼职场 湖南文艺出版社李治
数据分析的工作往往会根据数据分析得出很多结论去指导决策。很多时候这种项目是夸部门的事情,所以项目管理的能力必不可少。这本书应该说是一本这方面不可多得的书。
6) 麦肯锡系列:麦肯锡传奇、麦肯锡工具、麦肯锡意识、麦肯锡方法 金字塔原理
7) 大前研一系列:思考的技术、专业主义等
6)和7)我个人定义为思维相关的书籍。实际对于一个数据分析师而言,最重要的有四点:结构化的思维能力、业务能力(商业直觉)、专业技能和沟通能力。其中结构思维能力是重中之中。这个大家看了之后会发觉其实大部分人都没有意识到这是个问题,甚至没有意识到这是种能力。
当然除了系统的去读一些专业相关的书籍外,浏览一些重要的专业网站也是提升专业水准的一种很重要方式。我简单罗列一下我自己经常上的一些网站:
1) https://bbs.pinggu.org/forum-68-1.html 人大经济论坛sas专版
2) http://cos.name/ 统计之都
3) http://www.itongji.cn/ 中国统计网
4) http://f.dataguru.cn/ 炼数成金
5) http://www.kaggle.com/ 一个国外的数据挖掘竞赛平台
6) http://lexjansen.com/ sas全球用户大会的上所有的文章在这个网站上都能找到
最后想说的,如果真的喜欢统计,踏踏实实把几本重要的书读透,这个还是非常有必要的。如果真的能学的很通透,我相信找份不错的工作应该是水到渠成的事情。