我记得开始学统计学,我就一个一个公式通过EXCEL计算一遍,然后在写段SAS代码,反复验证,最后占在SAS阵营中。从6.02到 8.2,到9.1.3,到现在的sas9.2,到公司后管理sas的linux,研究了sas和linux的共用,这里面学习很多,也写了很多代码(不是proc sort),而是写svm,social network analysis当然包括我自己研究统计方法的代码,这些代码都是以sas形式被我用着,而公布出去的则是C++或R。现在主要研究sas与hadoop,hive,mahout等连接调用,关于sas与gp, mysql, oracle的连接有多种,我自己也写了自己代码,速度通过比较可以提供50%。
也在研究mahout,欢迎各位懂得java又喜欢数据挖掘一起讨论学习。