你所说的λ也就是我说的k,在仔细看看上个恢复的公式你就知道了,
"在经典多元线性回归分析中, 参数B=(B0, B1,. . . , Bm )′的最小二乘估计b=(b0,b1,. . . ,bm )′的均方误差为
E{(b-B)′(b-B)},当自变量存在多重共线关系时, 均方误差将变得很大,故从均方误差的角度看, b不是B的好估计。
减少均方误差的方法就是用岭回归估计替代最小二乘估计。设k≥0, 则称
b(k)=(X′X+kI)-1X′Y (-1是应当是逆可打不出上标)"
为什么λ(即我说的k值)的值越大vif会越小?因为岭回归的有偏估计代替了最小二乘估计,使得变量间之间减少共线性,但同时RMSE会变大,所以岭回归方程的关键是k值的选择,你的k值越大vif值会越来越小,但RMSE会变大,你要选择一个使vif<10且RMSE变化最小的一个k,然后得到的岭回归方程,可画岭迹图, 即对每个自变量xi, 绘制随k值的变化岭回归估计bi(k) 的变化曲线图。看什么时候会k值会使变量变化趋于稳定,但什么样是问题,都要根据你自己的尺度和实际情况来订,你的结果不错的,你的k值范围取的并不大,你应当画下图看看,后面取值可以变化到
"model y=x1 x2 x3/ridge= 0.0 to 0. 1 by 0. 01 0. 2 0. 3 0. 4 0. 5;
plot /ridgeplot;
"