最初spss的全称是社会科学统计软件包(Statistical Package for the Social Sciences);2000年以后更名为统计产品与服务解决方案(Statistical Product and Service Solutions);2009以后则称为IBM SPSS。至于中间发生了什么事,感兴趣的可以自己查一下。
下面是个人使用spss的一些零散的感想(以spss20.0为例),主要是针对有“争议”的地方谈谈自己的看法:
(1)很多人认为spss有很多功能无法实现。关于这一点,我们看出,spss软件在处理横截面数据时功能很强大,做了这么多年,这方面的处理能力没是什么要说的,均可以有效的完成,至于时间序列数据的预处理上,其所提供的时间函数等也是很丰富的,在完成一些较复杂的时序性质的数据操作上也完全可以得心应手,像移动平均,循环、字符操作等内容,均可以通过spss程序、时间函数、lag等内容实现。Spss的在函数,宏等内容与同类软件相比没有显示出太弱的地方(SAS除外)。其实很多功能,之所以没法实现很多情况下是因为我们对这款软件还不熟。
也有一种倾向就是,认为spss很好学,但我感觉能称得上是spss高手的却很寥寥,也可能是大家都认为这个软件很好学,太简单了,所以没太用心去学吧。
(2)spss的计算速度上,有了非常明显的改善,好像是利用多线程分析和CPU分布式计算这两种技术,这个具体是怎么弄的,我也不清楚,只知道官方的说法是可以运行海量数据,至于海量的多大这个好像给予的说法也很含糊不清等等如是,我大概测了一下,测试结果如下:
(我的系统有点落伍)在CUP、系统等运行环境相同的情况下,用 3亿4千万的观察,对比spss20.0(尽管spss20.0界面只能装下8千万,但实际可用计算更多的观测)与SAS9.2的结果: a、运行一元回归SAS用时是1分32秒,spss的用时是1分43秒。 b、其他多元统计的收到的结果,也类似,包括图形。Spss是慢一些,但差距并不是很大。这也出乎我的意料。 c、不过在运行一些很复杂模型的时候,差距变大的趋势有些明显。进一步希望有更多的论证。 |
|
(3)OMS这个功能很好用,是spss的输出管理系统,可以将结果的直接输出到不同的格式文件中,例如,word、excel、PDF、XML、文本、HTML等格式。这个功能一般在商业领域用的多,因为我们在每个分析后形成的大量的结果,如果使用人工处理,这个工作量要视工程的大小而定,有时很难想象其工作量。所以该功能只有真正业界的spss应用者才能体会其价值所在。并不像有些人说的没什么用。
(4)spss程序语言的应用。Spss语言和其他统计软件语言类似,简明易懂,唯一美中不足的是很少有书籍去介绍spss程序,这使得spss程序的用户解读上有些滞后,不过其好处是几乎每个对话框里都提供粘贴程序,这样方面对照着学习。Spss20.0的程序扩展性有了很多方面的加强。
a、可以使用R集成插件,也就是可以实现在spss的程序中应用R程序,这个便利性对于spss与R的用户来说同样重要,将这个开源并且发展势头很好的R “纳入”应用,这个影响是很大的,无论是对个人还是对软件公司。这样进一步可以利用更多的外部软件编写自己的算法。这个也是R的强项。
b、另外一个比较有用的是可以通过spss程序执行各种数据操作命令。
(5)spss享有盛名与其“旗舰”产品是分不开的,尤其是spss server、modeler、spss pes、Amos这些产品,极大的扩展了spss的应用范围。
Modeler的应用,在企业的数据挖掘方面和同类软件方面都具有很大的影响。另外像Amos这样的产品在学术的学科前沿的方法学上占有很重要的地位。
总结起来可以看出,spss综合性很好,俗雅共赏。如果可以把spss比做一本书的话,我愿意把他当做一本畅销书,并且是那种专业性不是很强的书。