全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学
4161 4
2011-03-23
要对一个统计模型进行评价,不仅要看模型对建模数据的拟合程度的好坏(因为over-fitting),还要看它在另一个独立的检验数据中预测情况的好坏。而Cross-validation 是在没有独立样本情况下(或独立样本的获得需要很高成本),对建模数据本身进行拆分,对模型的有效性进行评价的一种方法。
1、Hold-Out Validation;
2、K-Fold Cross-Validation;
3、Leave-One-Out Cross-Validation;
4、Repeated K-Fold Cross-Validation;
附件列表

cross-validation.pdf

大小:104.92 KB

只需: 1 个论坛币  马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-3-23 21:49:07
浏览了下,不是很详细,一般
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-24 17:02:56
2# zsushenye
谢谢您的购买,希望大家在统计学知识方面共同提高。
这篇文章像是个介绍性的手本,很简洁,可以说是简单。因为Cross-validation 本身就是一种计算方法,知道了就很简单,就是和知道如何电脑开机和关机一样。所以仅仅就是告诉你它是怎么算的。至于它的用途里面也介绍了,本来也就那么些个用途。就像是如何求T检验一样,非常简单的一个计算方法,至于它如何用,也就是说在什么什么情况下要用到T检验。我个人觉得这个文章就是简单,好像是中国人写的,所以理解起来还是没有什么困难的。我是最近写的一个迭代广义最小二乘算法中需要cross-validation来检验算法的稳定性和预测有效性,才发现cross-validation的作用的。其实对于大多数的统计模型都要考虑它的稳健性。像PROC MIXED好像是自己自动输出PRESS的值。PRESS就是leave one out Cross-validation计算出来的。对于接触过偏最小二乘法的同学们来说,Cross-validation 再熟悉不过了。另外像做时间序列建模时,有时候要分内样本(in-sample)和外样本(out-of-sample),外样本的功能其实就是检验内样本拟合出来的模型的有效性。这就和Cross-validation 的思想有点接近。个人觉得文章简单易懂,不复杂。因为cross-validation本身就是一个1+1=2的简单计算方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-25 11:18:59
謝謝樓主的分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-1 22:20:52
楼主能分享一下讲交叉检验的书籍么
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群