全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4860 1
2014-08-06
求教各位大神~

现在需要用R生成决策树。我用了R中的rpart包,生成了一棵树,但是如何判断这棵树对数据的拟合是否准确?

一开始的思路是用十折交叉进行验证,但是具体要怎么做?从哪里看参数?能不能看到查全率和查准率?

另外,生成树后cp矩阵中,xerror是指“十折交叉验证”的误差吗?这个怎么用?

谢谢赐教~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-12-6 22:11:48
xerror是交叉验证的估计误差
xval才是10折交叉验证


对于拟合的准确性,不能判断的,因为rpart包提供了复杂度损失修剪的修剪方法,printcp会告诉分裂到每一层,cp是多少,平均相对误差是多少。

其中,cp全称为complexity parameter,指某个点的复杂度,对每一步拆分,模型的拟合优度必须提高的程度,那么,可以选择具有最小xerror的cp的办法:


## prune(fit, cp= fit$cptable[which.min(fit$cptable[,"xerror"]),"CP"])  
fit2 <- prune(fit, cp=0.01);  
rpart.plot(fit2, branch=1, branch.type=2, type=1, extra=102,  
                shadow.col="gray", box.col="green",  
                border.col="blue", split.col="red",  
                split.cex=1.2, main="Kyphosis决策树")





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群