请教一个非参数中带宽选择的问题

xingshiqi

5459

收藏 2011-12-09

有一种选择带宽的方法叫交叉验证法（cross-validation），里面有一个缺一估计量（leave-one-out），请问为什么去掉一个观测点进行估计呢？不是很理解。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

changzhenhai

2011-12-9 17:12:50

可以看出这个点的影响

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

笑意苍凉

2012-1-26 14:16:33

如果不去掉一个点的话，最优带宽h将会等于0，这样就违背了当n趋向无穷，nh趋近于0的假设了。这个计算起来要很多技巧，计算还是挺麻烦的~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

笑意苍凉

2012-2-2 14:43:49

补充一下：如果不从数学上去推，直观的去想：cross-validation的本质仍然是让误差平方和最小，误差是观测值减去估计值。假设我们考虑local constant的情形：带宽越大，包含的X_i越多，最后的估计值Y只会是一个常数（如果kernel function是uniform的），这样误差肯定很大。相反，如果我们使得带宽h变小，那么区间内的观测值越少，距离实际值也就越接近，误差也就越小。这样的话，当h无限接近于0的时候，我们的g(x)_hat就collapse到原始的least square上了。所以当h=0时候，结果反而是最好的。这样，非参数方法岂不是没有意义了~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

caoqiang06

2012-2-29 21:21:03

min CV(h)=
最小化CV,如果不去掉自己,那肯定可以选择足够小的带宽,使得x领域内的观测值只剩下yi

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群