CDA数据分析师所要掌握的数据分析工具详解
作为一名专业的CDA数据分析师,其所要掌握的数据分析工具也是非常专业的。所以想成为一名合格的CDA数据分析师,因为所要掌握的数据分析工具非常有针对性和难度性,所以不是一般人说想成为就可以成为的。下面我来给大家讲讲CDA数据分析师所要掌握的数据分析工具详解,让大家通过对CDA数据分析师所要掌握的数据分析工具详解之后,更加清楚地认识到成为一名CDA数据分析师的不易与成就感。
CDA数据分析师所要掌握的数据分析工具详解:Excel
这个软件大多数人应该都是比较熟悉的。Excel满足了绝大部分办公制表的需求,同时也拥有相当优秀的数据处理能力。其自带的ToolPak(分析工具库)和Solver(规划求解加载项)可以完成基本描述统计、方差分析、统计检验、傅立叶分析、线性回归分析和线性规划求解工作。这些功能在Excel中没有默认打开,需要在Excel选项中手动开启。除此以外,Excel也提供较为常用的统计图形绘制功能。这些功能涵盖了基本的统计分析手段,已经能够满足绝大部分数据分析工作的需求,同时也提供相当友好的操作界面,对于具备基本统计学理论的用户来说是十分容易上手的。
CDA数据分析师所要掌握的数据分析工具详解:SPSS
原名Statistical Package for the Social Sciences(社会科学统计软件包),现在已被IBM收购,改名后仍然是叫SPSS,不过全称变更为Statistical Product and Service Solutions(统计产品与服务解决方案)。SPSS是一个专业的统计分析软件。除了基本的统计分析功能之外,还提供非线性回归、聚类分析(Clustering)、主成份分析(PCA)和基本的时序分析。SPSS在某种程度上可以进行简单的数据挖掘工作,比如K-Means聚类,不过数据挖掘的主要工作一般都是使用其自家的Clementine(现已改名为SPSS Modeler)完成。需要提一点的是SPSS Modeler的建模功能非常强大且智能化,同时还可以通过其自身的CLEF(Clementine Extension Framework)框架和Java开发新的建模插件,扩展性相当好,是一个不错的商业BI方案。
CDA数据分析师所要掌握的数据分析工具详解:R
R是一个开源的分析软件,也是分析能力不亚于SPSS和Matlab等商业软件的轻量级(仅指其占用空间极小,功能却是重量级的)分析工具。R支持Windows、Linux和Mac OS系统,对于用户来说非常方便。R和Matlab都是通过命令行来进行操作,这一点和适合有编程背景或喜好的数据分析人员。R的官方包中已经自带有相当丰富的分析命令和函数以及主要的作图工具。但R最大的优点在于其超强的扩展性,可以通过下载扩展包来扩展其分析功能,并且这些扩展包也是开源的。R社区拥有一群非常热心的贡献者,这使得R的分析功能一直都很丰富。R也是我目前在工作中分析数据使用的主力工具。虽然工作中要求用Matlab编程生成结果,但是实际分析的时候我基本都是用R来做的。因为在语法方面,R比Matlab要更加自然一些。但是R的循环效率似乎并不是太高。
CDA数据分析师所要掌握的数据分析工具详解:Matlab
也是一个商业软件,从名称上就可以看出是为数学服务的。Matlab的计算主要基于矩阵。功能上是没话说,涵盖了生物统计、信号处理、金融数据分析等一系列领域,是一个功能很强大的数学计算工具。是的,是数学计算工具,这东西的统计功能只不过是它的一部分,这东西体积也不小,吃掉我近3个G的空间。对于我来说,Matlab是一个过于强大的工具,很多功能是用不上的。当然,我也才刚刚上手而已,才刚刚搞明白怎么用这个怪物做最简单的Garch(1,1)模型。但毫无疑问,Matlab基本上能满足各领域计算方面的需求。