各位大虾:小弟算是计量分析的初学者,最近碰到了一个书(古扎拉蒂第4版那本)上讲的不是很明白的东西,是有关线性回归中参数的估计方法,为了更直观,假设是单变量线性回归,即Y=a+bX+error,观测数量假定为N组(Y,X)。用OLS回归。问题很基础。
第一个问题:
参数的估计方法,显然,是残差平方和最小的OLS方法,但是软件,或者具体的计算是怎么样的呢,我的猜想(书上讲的不是很明确,所以我只能猜想了,)是,对于(Y,X)的二维散点图,我们可以画无数条斜率和截距不同的直线,在这些直线中,只有一条直线满足最小二乘,也就是残差平方和最小,那么,这条直线就是回归结果。对于在二维散点图上的无数种可能的直线,其斜率和截距组成了各自的分布,如截距的分布和斜率的分布,再对照OLS所确定的参数在这个分布中的位置,判断其显著性水平。到这里,还有一个问题,就是如果根据OLS,回归出来的参数不显著,那么是否代表这N个观测值没有被拟合的可能?
此外,我还猜想到另外一个回归方法,就是关于自由度的。也就是说,上面我说的方法用了所有的观测点N,没有去掉任何观测点,有没有可能,就是在回归的时候,除了依据所有N个观测点画任意直线,之后去掉任意一个观测点(N种去掉1个观测点的方法),根据这N-1个观测点绘制无数条直线,形成分布。或继续去掉2个,3个。。。。直到剩下2个观测点,针对不同数量观测点进行参数估计,最终形成关于参数的分布?满足最小二乘的直线有一条还是很多条(我现在竟然都怀疑这个问题了),应该是一条8.
第二个问题,关于异方差
古扎拉蒂书上的开篇例子好像是美国收入X和消费支出Y的数据散点,抽象点说,就是那个例子中,同一个X有很多不同的Y,套用美国收入消费的例子,就是说,收入在某个水平的人,支出不一样,从而形成关于支出的条件分布,根据不同收入X,有很多条件分布,如果他们方差不同,就是异方差。然而,我们在回归的时候,很多就是一个对应一个,一个X对应一个Y,很少出现一个X有时候对应2个Y,那么就不存在条件分布,那么这样的异方差是怎么判断呢?我猜想,即使是一一对应,可以把X的条件分布定义为一段范围内的X,如[X1,X2]区间内的诸多Y的分布,看看诸多这样区间之间的方差是不是稳定。实际上是不是这样呢?
请大虾解答~谢谢~