第6章习题解答: <br>
第3章思考练习题<br>
3.1<br>
解答:多元回归模型的矩阵形式为
其中
基本假设为
在误差服从正态分布条件下有
3.3、证明:
故有
3.4,答:不能(见p74),复相关系数R的平方R2为样本决定系数,它们的大小可直观反映回归拟合的效果,样本决定系数R2越大,说明回归方程拟合原始数据y的观测值的效果越好。但是并不能代替严格的显著性检验即有可能样本决定系数大但假设检验结果并不显著。。当样本容量n较小,变量个数p较大时,F检验或t检验的自由度太小,这时尽管样本决定系数R2很大,但参数估计的效果很不稳定。特别是,当样本量与解释变量个数接近时,R2易接近于1,其中蕴含着一些虚假成分。因此,由R2的大小决定模型的优劣时还需谨慎。<br>
3.5 答:对于回归方程的显著性检验,我们用F统计量去判断假设H0:β1=β2=…=βp=0是否成立。当给定显著性水平α时,F>Fα(p,n-p-1),则拒绝假设H0,否则不拒绝H0。接受假设H0和拒绝假设H0对于回归方程来说意味着什么,这仍需慎重对待。<br>
一般来说,当接受假设H0时,一方面可能这个问题本来应该用非线性模型去描述,而我们误用线性模型描述了,使得自变量对因变量无显著影响;另一方面可能是在考虑自变量时由于我们认识上的局限性把一些影响因变量y的自变量漏掉了。<br>
当我们拒绝了假设H0时,我们也不能过于相信这个检验,认为这个回归模型已经很完美了。其实当拒绝H0时,我们只能认为这个回归模型在一定程度上说明了自变量x1,x2,…,xp与因变量y的线性关系。但这时仍不能排除我们漏掉了一些重要的自变量。<br>
3.6 答:(1)对数据进行中心化处理,其意义是:利用中心化数据进行参数估计时,比原始方法少估计一个参数,从而减少计算工作量。(2)对数据进行标准化处理,其意义是:利用标准化数据进行参数估计时,可以消除量纲或数据量级的影响,使得参数估计结果及其他统计推断过程更加合理。<br>
3.7 解:记
则有<br>