全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5921 2
2018-01-16
parms参数中说如果选用的是“分类”的方法,参数就是分别指的是:先验概率,损失矩阵以及分类纯度;(1)cart算法里面,感觉没有什么是关于先验概率的,这个先验概率指的是什么?是二叉树分到yes和no的概率吗?
(2)其次损失矩阵,是指的cost吗?这个设置与决策树最后的分类结果又什么作用?
(3)分类纯度,是指的什么?是计算GINI系数中P吗?
这三个概念不是很清楚?看了cart算法的计算原理也不是太懂呢?

[p=192, null, left]用来设置三个参数

[p=183, null, left]:

[p=192, null, left]先验概率

[p=192, null, left]

[p=192, null, left]损失矩

[p=179, null, left]

[p=179, null, left]

[p=179, null, left]分类纯度的度量方法




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-1-16 12:00:04
fit <- rpart(Kyphosis~Age + Number + Start,  
             data=kyphosis, method="class",control=ct,  
             parms = list(prior = c(0.65,0.35), split = "information"));  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-1-16 12:25:51
该函数的帮助文档中显示,函数的理论基础来自:
Breiman L., Friedman J. H., Olshen R. A., and Stone, C. J. (1984) Classification and Regression Trees. Wadsworth.

百度上可以找到相关资源,书上有最详细准确的解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群