kuangsir6 发表于 2010-8-5 15:19 
ljspss 发表于 2010-8-5 15:04 
当时采集的数据是厂家采集好的,拿过来我问了下说是它们随机采样的,有点像超市排队一样,排好队了就按照排队顺序把数据记录下来。我就把前面一半221组拿出来,剩下的当做校验。不知道这算不算随机?
把所有数据按排队顺序连续编号,按单双号分成两组,再试试看。
我还有个问题,因为之前没做过统计回归,遇到的困难蛮多的。
1、怎么选取回归的因子呢?而且是非线性的。原始数据变量用v1、v2、。。。表示;回归方程y=k1*x1+k1*x2+k3*x3+...;而X1=V1*2/V2;这些因子我是连蒙带猜的。怎么选因子呢?
2、怎么评价几个回归阿方程的好和坏呢?SPSS中有调整的判断系数R^2(R的平方)来表示,还有一个Std. Error of the Estimate (SEE)SEE越小越好,R^2的接近于1,这样的回归回归方程就好?是不是还有其他指标?
3、我在回归的时候,发现因子越多,R^2越接近1,后来看了本书 说有共线问题。共线的方程式,我觉得误差很小,有点舍不得扔掉?
4、我用回归方程得到的预测值,很多组数据,和标定数据怎么比较,就说明我的回归预测是正确的呢?有时看到误差中某几个值忽的飚的很高,最大误差在10%,然而其他数据都在5%左右,是不是说我的回归方程式不够好?
5、好像采集来的数据中有错误数据,怎么踢出来?一个一个找的话,估计眼都要花。有没好办法?
6、数据中有重复测量的数据,这些数据只有超微的差别,怎么办?丢掉去一个还是留在里面。我是取了一组,其他的都丢掉了!
还请达人指点一二。之前也下了电子书,看了但是属于快餐式的,碰到问题都找不到书里哪块是讲这个内容的,所以发帖求问了!谢谢kuangsir6 的热心回答。