爱萌 发表于 2009-7-15 11:27 
ruiqwy 发表于 2009-7-15 11:20 
LZ的对各个软件的评价,某些是有道理的。但是这些比喻极其不恰当,反映出其对这些软件缺乏深刻的理解,也反映出其对统计学的认识缺乏深入的理解,LZ列出的很多统计软件,有些根本无法比较,做的方向不一,风马牛不相及。
不同的软件各有特长,根据自己的需要选择相应的软件,以及不同人有不同的使用习惯。一个人使用什么软件,从某种程度上反映出统计学的水平,一般来说,EXCEL等
呵呵,只能说明你自己的SAS水平不到家吗,我们的斑竹nkwilling已经给出了自己编写的朴素贝叶斯,我自己也成功的写了SVM,和其他我自己研究的方法
微学过点DM课程的人,都知道朴素贝叶斯和SVM是DM课程最基本的两种方法,是二三十年前的东西了,很多软件都很容易实现这两种方法。以此来炫耀自己的水平,无语。。。
学统计最高境界是创新统计方法,并实现这些方法,或者实现别人新提出而尚未实现的方法。重复做别人做过了的工作,不能说没有价值,但意义已不是很大了。
无知者无畏,但有些东西贻笑大方就不好了!
学精一两个软件,融会贯通大多数软件并非难事,软件固然重要,但软件背后的统计思想更为重要!多学习,多创新,多做恭喜,此乃正事!
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
知识不是用来炫耀的,做的东西也不是用来炫耀,一切都是为了使用,我说的话是鼓励喜欢SAS同伴学习SAS,没有需要的意思.
当你说SVM是30年前的也好,当我只说那是你的理解,因为他真正的开始是从20世纪90年代. 他真正发挥威力是在生物信息学,到现在SVM还有很多东西没有研究明了,这就如线性模型一样,他的历史很长,可是到现在我们的王松贵老师还继续研究着,已经离我们而去的陈希孺老先生一生中贡献之一就是线性模型. 把知识按照年代来划分方法的新旧,这是你的标准,我没什么可说的.
做过数据挖掘的人都知道,真正有用不是你的所谓的新方法,到现在数据挖掘还是围绕6大类方法在玩. 在一个大的项目中我们分析最终的结果是KNN和SVM是最稳定, 样本10000多个,别的不能多告诉你了.这就是为什么我对简单的方法还在继续研究 -------爱萌(千古罪人)回答