通用统计软件DPS研制与应用
日期:2005年5月17日 作者:唐启义
[作者简介] 唐启义 DPS统计软件研发者,中国数学会均匀设计分会常务理事、浙江大学农业与生物技术学院教授,曾获国家科技进步三等奖1项,省部级科技进步奖多项。目前主要从事农林生物灾害预测预报、数学生态学以及应用统计计算机软件的研究和开发工作。
统计软件因可代替人们对科研、生产过程中的大量繁冗数据资料进行统计分析处理,目前已成为各个行业专业技术人员的必需工具。20世纪70年代以来国内外研制出了大量的统计软件,如SPSS、SAS、BMDP、Stata等。特别是SAS和SPSS两大统计软件,目前在统计软件市场占据垄断地位。与此相比,我国在通用统计软件的开发、推广应用方面与国外相比差距较大。尽管国内从20世纪70年代起先后研制了许多统计分析软件包或程序库,但它们所提供的数据分析功能都是侧重某一方面,其功能与国外大型统计软件相比差距大,且大多没有经过登记、出版和商品化,用户群小,以致于许多国内统计分析软件只是“昙花一现”。而具有自主知识产权、功能齐备、用户可接受的国产综合性统计分析软件仍然鲜见。
前几年,在国内某计算机刊物上,有人提到:“让我始终耿耿于怀的是,我们这样一个堂堂的数学古国、数学大国,至今仍然没有编制出一个像SPSS这样的统计分析软件”。当时的情形确是这样,除非你不用计算机处理数据,否则你不会不想到使用SPSS或SAS。如果你提出要开发一个通用的统计软件,他们会觉得你有毛病,因为他们对SPSS及SAS等通用统计软件佩服之极,并认为那是不可攀登的巅峰。但我们认为,我们并不想去超越那座巅峰,世界上的山峰很多,但的不一定最美。SAS、SPSS在国外的应用非常深入,但在国内使用这些大型统计软件到行家水平的并不多见,很多用户日常所用到的功能不到软件全部功能的10%。这并不是这些软件做得不好,而是国人的思维定势与西方人确有差异。因此,这就激发我们开发具自主知识产权统计软件信心。通过10多年的努力,由作者完成了具自主知识产权、功能齐备、用户界面友好的通用统计软件DPS,填补了国内大型通用统计软件的空白。该产品通过不断完善,在统计分析功能方面已接近国际先进水平,在计算机试验设计的某些算法方面已处于国际领先地位。
DPS统计软件其初期版本也是从处理农林生物科研数据及农作物病虫害灾变预测起步。但经开发者不断改进,至今已发展成为一款综合性的大型统计软件。开发者为配合用户需求,于1997年出版、2002年再版了140多万字配套专著。其应用领域已遍及包括台湾、香港在内的全国各地,以及自然科学和社会科学,如农林牧渔、医药卫生、气象、水文地质、工程计算、市场调研、社会经济,金融各个领域,拥有3000多用户。应用DPS开展科研、并在论文中引用DPS的科技文献已分布在近200种科技期刊。
与国外知名软件,如SAS、SPSS、Stata等相比,DPS除了提供能满足不同领域、不同层次的专业技术人员所需的基础统计、专业统计及高级统计等300多项统计方法外,它最显著的特点是用户界面良好,即完全采用菜单和对话框操作方式,绝大多数操作过程仅靠鼠标点击即可完成,简便易学。尤其是DPS提供用户图形界面,可在运行过程中将中间结果以图表方式显示,用户可根据系统在处理数据后反馈回来的中间结果,调整相关参数,完成数据分析工作。同时,DPS还是一个开放系统,其主窗口上部是一个类似于Excel的二维表,研究人员可以极其方便地创建DPS本身的数据文件,同时它还能够读取Excel电子表格或纯文本文件、数据库文件等多种软件生成的数据。这些特点是基于DPS人性化的设计理念,使其有利于大众化的考虑。
DPS提供的功能很多,如描述性统计、探索性分析、t检验、单因素和多因素方差分析、协方差分析、四格表分析、列联表卡方检验,Ridit分析、非参数检验、相关分析、线性回归分析、生存分析等,同时也提供了多种高级统计方法,如非线性回归、多元线性回归、Logistic回归、Cox回归,典型相关、因子分析、聚类分析、判别分析、对应分析、对数线性模型等,完全能满足科研、生产领域的专业人员处理数据的需要。此外,丰富的专业统计分析模块,如数学生态、生物测定、地理统计、遗传育种、生存分析、水文频率分析等,使得不同领域的用户用起来更加方便,快捷。另外,有些不属于经典的统计分析范畴的功能,如各种类型的线性规划、非线性规划、灰色系统方法、模糊数学方法等在DPS里面也可以找到。
DPS软件除具备齐全的统计分析功能外,还提供了包括多种类型的试验设计技术,如完全随机分组、随机区组设计、裂区设计、拉丁方设计、正交设计、正交回归设计及均匀试验设计等试验设计技术。特别是均匀设计这一由我国学者提出的在国内各个行业应用广泛试验设计技术,在DPS软件中采用新的算法,实现了当处试验理数或因子水平数大于50以上时构造大型均匀设计表的重大突破,提高了试验设计的精度和质量。
从DPS的应用咨询网站(http://www.Chinadps.net)可以了解到该软件的研发进展,DPS统计软件研发者一直在根据用户的需求,不断吸纳新的统计方法,如圆形分布统计,偏最小二乘回归,投影寻踪回归,混合分布参数估计等新的方法;并还在不断探索,吸纳更多功能,使系统更加完善,以适应各行业专业技术人员不断增长的数据统计分析的需求。
(出处:《科学中国人》)