全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1728 2
2016-08-11
小弟看《数据挖掘与R语言》一书时对交叉验证有点不明白,如图:
1.PNG
第一个图中dataset里面如何解读。书中说第一个参数是含有在实验比较中所应用数据集的一个向量。每个数据集的声明形式为dataset(formula,data frame ,label),但我还不是很明白。首先为什么要有一个公式?前文已经用回归和分类树进行了分析,这里为什么没有用到之前的结果?还有后面令label=a1有没有什么重要作用?还是就只是个名字?
附件列表
2.PNG

原图尺寸 7.86 KB

2.PNG

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-13 04:51:49
先学习leave-one-out交叉验证,再学习5-fold cross-validation之后你就会明白了。pls包中有源代码做交叉验证。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-13 20:13:59
bbslover 发表于 2016-8-13 04:51
先学习leave-one-out交叉验证,再学习5-fold cross-validation之后你就会明白了。pls包中有源代码做交叉验证 ...
谢谢您
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群