11# kakamama
这个比较的问题,本人就不敢乱加评论,只能就个人了解的软件做一些简单的对比。从统计软件来看,R和SAS是最专业的,SPSS好像一些功能比较简化,很少见到专门做统计的人用。
关于R和SAS:
1.R的优势在于其灵活性,毕竟是开源软件,全世界的学者都在贡献力量,所以R里面往往可以通过PACKAGE,使用最前沿的方法和模型,这也赋予了R无与伦比的强大的整合能力和创造力。另外,由于R的package都是实实在在做研究的人编写的,他们往往了解在使用过程中,对相应方法,什么样的使用方式最方便可行,所以,R的package用起来是很顺手的。从这点来讲,SAS是商用软件,设计遵从严格的形式,而且由专门的程序员和软件工作者设计,稳定性更高,但是灵活性就差很多,而且可能设计的方式不一定是最适合大家使用的。SAS官方软件及函数主要都由SAS公司发行,所以往往只囊括了一些比较成熟的方法,其扩展性低于R。所以,SAS比较适合用来做已有的方法。而R适合来探索。
2. 找工作,还是SAS好些。正如上面说的,R的优势在于灵活性,所以在学术界是比较吃香的。另外R是免费的,所以做科研的人往往愿意使用R。但是,实际在大公司进行数据分析的时候,往往采用比较成型和通用的方法,这些领域SAS做的很好。最重要的是,SAS系统的可靠性高于R。所以在企业界,SAS使用的更多。当人,有些高科技公司自己的技术足够牛,创新的东西比多,是不用SAS的,比如Google.
3. R处理大数据集的能力较差。R比较适合处理小数据集或中等数据集,在面对大数据集(>=1GB)时,往往很受制约。这时候,往往需要借助于一些专门处理大数据集的package(比如bigmemory, biglm),以特殊的形式处理数据。但是SAS处理大数据集的能力是在R之上的。
4. R是免费!所以,即使在中国,大家也可以大声高喊,我们用的是正版的R。但是我想国内绝大部分用SAS的人,使用的都是破解版吧,而且好多还是2004年就过期的....
对于非统计软件,MATLAB的计算功能很强大,一些优化的方式也很厉害,但是MATLAB主要是针对工程计算方向的,统计功能一塌糊涂,完全不能和R比较。
个人观点,不同意勿喷