问题:我是数学系学生,未来想向数据分析师发展,需要学会哪些软件:如SPSS、SAS、MATLAB、EXCEL、C++、SQL等,需要学哪些呢?需要精学哪些专业课程:如数值分析、概率统计、泛函分析等,有哪几门是特别重要的呢?
希望您能帮我做一个较为具体的规划(侧重于学习软件/专业课的先后顺序)
我具体想做的行业是金融(这是因为我个人感觉证券啊期货啊很高大上的样子,其实具体是什么我也不太清楚,就是一种无缘无故的行业崇拜吧)或者商业(可能形容的不太具体...就是有点像阿里巴巴的数据分析师,通过分析成交数据预测你喜好的品牌等等),这两个行业哪个的未来发展情况会更好一些?我看到网上的招聘很多都是后者的招聘,而前者(金融业的数据分析师)招聘得很少,故有此问。从事金融业或商业,我需要看些什么书来补充该行业所需知识?
如果只是本科毕业,能否胜任数据分析师的工作(假设所需的软件知识已经具备)?继续读研会不会更好?哪些学校(国内外)在数据挖掘这块比较强大?(我是中大的学生)
张捷
我是大四二本学校毕业生,读的统计学,归在数学系。个人感觉如果你有机会读研,就读研把。因为本科出来知识学的还太少,如果专门向往数据分析数据挖掘这一块走的话,除了掌握SPSS sas 的一些常用分析软件的方法外,其实更多的要结合你的公司的业务知识。另一方面,这一块属于技术类别了,本科出去一般都是从初级数据录入员开始做,让你了解公司业务。如果想进一步提升到分析阶段,除了你专业只是够硬外,还得会根据你理论分析出来的东西再和公司结合,说白了你得有能力给出相关报告和建议。我是选择考研,现在成绩没出,不过这期间有去投简历面试,以上是按我个人情况的一些看的
关丹辉
你首先要确认自己喜欢的行业和目标职业:金融行业 or IT行业 or 电子商务等,不同的行业对数据分析的要求差距很大,主要表现在行业知识、软件应用等等。另一个是目标职业,不同的目标职业定位,需要的技能加点组合方式也完全不同,比如大数据、数据分析、数据挖掘,对编程语言的要求就不是一个等级的。根据你的描述,你更倾向于数据分析,而不是数据挖掘或者机器学习之类,因此,在下面的回答中,均以数据分析为基准。
1、软件工具
数据分析最常用的工具,是Excel——任何行业都要用到,我个人认为Excel甚至是其他统计软件的基础。此外,在kdnuggets上有个投票,最近几年,R语言排行第一,其次就是Python和SQL及类SQL。我的理解是,不同的行业要求是不一样的,比如在金融行业,一般都是采用非常成熟的SAS来做数据分析和挖掘,而在金融建模中还是倾向于matlab。在国内,很多中小企业,都是Excel和盗版的spss。在电子商务互联网方面,R语言和sql都是很重要的。此外,excel和sql是可以短时间学会的,而对于R语言和SAS这种有语言味道的工具,需要学习的时间会比较长。
2、哪几门课,特别重要
一般而言,数据分析用不到那么高深的泛函分析,但是,如果你会了更好。对我而言,对重要的课程是概率统计类课程。这类课程是基础中的基础,重要性再怎么强调也不为过。基础好了,之后如果想涉及机器学习或者数据挖掘算法研究,都可以很快的适应和学习。这些课程中,蕴含的思想,更是值得揣摩和深思。对不确定性的认识和对问题的辩证思考,这是数据分析师不可或缺的。
3、学习规划
这个真心不敢随便规划。每个人的性格是不一样的,专注的方向点和兴趣点也不一样。关于金融行业的行业知识学习,我不太清楚,毕竟我没有在金融做过,只是打过点交道。对于数据分析课程,基础的课程就是概率论与统计,如果你觉得需要延伸,建议你去coursera上选一些课程,比如霍普金斯大学的数据分析课程等等——这方面课程还是蛮多的。关于coursera或者edx等学习平台,不再赘述。
4、行业前景
目前不是互联网金融了吗?虽然都是对用户的分析、对商业的分析,但是其实最终都会落到对这个世界的理解,对人性的理解。
5、行业读物
金融行业,不太熟,只是学过金融学,听前辈说,有太多东西要学习了。这个找相关前辈咨询吧。
6、本科以及考研,院校
本科当然可以胜任数据分析了,数据分析对统计要求还是有的,但是数学系本科足够了。但是,你要是做数据挖掘或者机器学习方面的话,对学历要求还是比较高的。数据分析师,对工作经验要求比较高。读研与否,要看自己的权衡了。院校的话,中山大学不是挺好的嘛,此外,在统计方面,人民大学和厦门大学都是很强悍的。
要选好自己的行业和目标方向,只有方向确定了,后面的各种问题才会显得相对比较容易。而在选方向时,需要对各个方面有个基本的认知,这是一个很繁琐的信息收集和认知的过程。
张伟棋
说说自己的想法,我是数学系的学生,现在一家大数据创业公司实习,也会去国外读datascience。
我的情况应该和你比较接近了,在大一大二的时候学院还没有分专业,那时候最倾向的也是数理金融方向,和你一样,对行业不了解,但是就是有种莫名的行业崇拜。但后来还是因为要出国的原因选择了统计,现在想起来真是有些盲目啊,不过现在我庆幸当初做了这个决定。
前面的答案给出了数据分析,统计领域常用的软件,语言,R,SQL,python,SPSS,Excel之类,但我并不建议把这些看成一项项求职技能去掌握,会跟不上未来行业发展的变化。原因在于数据科学的发展和更新速度太快。就像马云说的“这是一个变化的年代,当很多人还没有搞懂PC互联网的时候,移动互联网来了,当很多人还没弄懂移动互联网,大数据来了。”也许几年后就会变成“大数据还没弄懂,XXX来了。”
近两年以mapreduce,Hadoop很火,各个以大数据为名的公司都要搞,当很多业内专家开始买书,上课了解什么是分布式计算平台的时候,Google已经宣布将弃用mapreduce,转而研发新的文件是新的分布式文件式分布系统Caffeine。当很多人还在纠结R,python,matlab什么工具的可视化效果更好的时候,新的工具一次次地让人眼前一亮,如果有兴趣,看看Tableau,看看ployly,看看qlikview。新的工具已经能让毫无专业背景的人轻而易举的做到 R python之类做不到的事情。当很多人还以为想象着传统的数据分析行业就是扒数据分析数据的时候,看看一大批的data entrepreneur 都在用在什么样的方式玩数据:
The Platform for Big Data and the Leading Solution for Apache Hadoop in the Enterprise
Mode - Get your insights together
BigML is Machine Learning for everyone
Flurry
Data Solutions
[/url]