全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
14471 17
2014-02-11
       做数据分析的,无论你是金融界,医药界,学术界or……各种界,总离不开使用软件。初入门的,面对名目繁多,品种齐全的分析软件,总要在入哪个门这一十字路口徘徊一阵(当然,也有牛人每个软件都精通),但毕竟大多数等人总会相对惯用一种软件。其中,可能R&SAS便是其中一个纠结点吧。那么这两个软件到底有什么不同?或者他们的针对的用户群有什么不一样?我们先来看看网上的一些评论:

R开源、免费,扩展包丰富,但是语言本身特性比较匮乏,可读性不高,处理数据量不大的研究比较方便,处理数据量很大的就得借助数据库。R语言相比于SAS更偏向与编程,就是要把你的统计研究的问题转化成编程问题,把数据用R对象(Vector, List, Data Frame等等)存储起来,然后用特定的函数操作这些R对象,把数据整理成可以进行统计分析的形式,然后用统计分析的函数来执行分析,如果不熟悉这些对象的操作方式,很容易发生细节或者操作思路上的问题。例如:数据类型不匹配(读入的数据明明是股票代码字符串,读进来变成数字),不知道如何批量转化数据(根据某个变量合并数据,如果合并中发现缺失就用线性插值来填补)等等,需要不断地积累经验才行。R相比与SAS的一个最大优势就是扩展包相当多,相当全面,对于大部分研究问题而言都不需要自己去实现底层的计算方法,在CRAN上的扩展包已经能够基本满足各种统计检验、数据挖掘、数据可视化等方面的需求,但是扩展包比较零散,很多时候需要自己去「淘金」。

SAS很庞大,但主要优势在于入门简单,语言可读性强,语言思路比较符合统计分析的思路:大体上是数据步整理筛选数据,过程步做数据分析等等。写SAS代码的过程就是告诉SAS系统做什么,而不是怎么做,减少了很多编程细节上的麻烦。由于SAS程序是基于数据集来执行的,在处理大批量数据时(例如用整个金融市场所有股票的所有日数据分时段做三因素模型)速度很快,具有明显的优势。但是在处理很小的数据片段上有时显得比较麻烦,比如想做一个简单的回归然后获得回归系数和残差序列,然后做一些检验,R代码明显比SAS代码简单,因为R代码直接操作对象,而SAS代码考虑的是一个数据集整体上的操作,而不是单个对象层面上的操作。




       对于上文说的,楼主觉得还是比较客观的。身边的有用R也有用SAS,我从来不觉得软件之间有什么明显的好坏之分,再简单的软件,你若能掌握的好,照样你成大牛!但从周遭的情况看来,楼主还是觉得这两个软件在用户群上有所区别:SAS——大公司,特别是500强的用的较多(谁让它贵啊!),当然处理大批量的数据(像金融行业)得心应手,通常业界普遍认为它的数据质量可靠。R——越来越多的数据分析公司开始使用,最大的优点当然是免费;开源,图形处理能力很强(当然算法也不错),作为一股新兴力量,这几年的涨势非常高!

       但是,两者在学术领域的应用楼主真的知之甚少,有没有童鞋可以分享一下经验?或者自己的工作领域,如果涉及到这两个软件,能否也谈谈各自的心得体会呢?让更多的在软件门口的同学有所选择方向……




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-2-11 13:49:09
matlab不好吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-11 13:55:45
李双建 发表于 2014-2-11 13:49
matlab不好吗
好啊,计算速度很快啊。只是这两个经常被放在一起,所以想问问大家啊~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-11 14:15:34
R好 一般没有基础的话很难的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-11 14:51:58
李双建 发表于 2014-2-11 14:15
R好 一般没有基础的话很难的
我是觉得没有基础 这两个软件都很难
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-11 17:04:24
精通一种就ok
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群