全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
5353 5
2011-12-09
有一种选择带宽的方法叫交叉验证法(cross-validation),里面有一个缺一估计量(leave-one-out),请问为什么去掉一个观测点进行估计呢?不是很理解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-12-9 17:12:50
可以看出这个点的影响
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-1-26 14:16:33
如果不去掉一个点的话,最优带宽h将会等于0,这样就违背了当n趋向无穷,nh趋近于0的假设了。这个计算起来要很多技巧,计算还是挺麻烦的~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-2 14:43:49
补充一下:如果不从数学上去推,直观的去想:cross-validation的本质仍然是让误差平方和最小,误差是观测值减去估计值。假设我们考虑local constant的情形:带宽越大,包含的X_i越多,最后的估计值Y只会是一个常数(如果kernel function是uniform的),这样误差肯定很大。相反,如果我们使得带宽h变小,那么区间内的观测值越少,距离实际值也就越接近,误差也就越小。这样的话,当h无限接近于0的时候,我们的g(x)_hat就collapse到原始的least square上了。所以当h=0时候,结果反而是最好的。这样,非参数方法岂不是没有意义了~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-29 21:21:03
min CV(h)=
最小化CV,如果不去掉自己,那肯定可以选择足够小的带宽,使得x领域内的观测值只剩下yi
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群