经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
决策树rpart()问题
楼主
番茄奏鸣曲
4359
2
收藏
2022-02-22
悬赏
40
个论坛币
已解决
我发现使用rpart()的时候,好像决策树不会按照给我放了多少variable来分tree<-rpart(Employee.Status ~.,data = dummydf ),我的variable大概有18个左右 (要求是给出性别啊,年纪啊,学历啊,这些来判断这个人在公司工作的稳定性,是否容易离职)谢谢哦
问题来了:
1. 我想知道背后的原因?
2.我怎么看最后的那个结果局就是那个树
最佳答案
owenqi
查看完整内容
1.如果你的结果是判断某人是否会离职,那就是分类树(classification tree)那你用rpart做决策默认使用的是基尼指数(gini index),当然也可以使用交叉熵(cross entropy),这两个无论选哪个都是在你所有的变量里面按照顺序选择“最重要”的变量(根据吉尼指数)。 2.没看懂你想问什么,如果根据猜测的话,你图上的那个树如果没有剪枝(pruning)的话,可以算是最后的树了。 建议你去仔细读一下决策树的原理和实现,就可以基本 ...
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
owenqi
2022-2-22 10:54:31
1.如果你的结果是判断某人是否会离职,那就是分类树(classification tree)那你用rpart做决策默认使用的是基尼指数(gini index),当然也可以使用交叉熵(cross entropy),这两个无论选哪个都是在你所有的变量里面按照顺序选择“最重要”的变量(根据吉尼指数)。
2.没看懂你想问什么,如果根据猜测的话,你图上的那个树如果没有剪枝(pruning)的话,可以算是最后的树了。
建议你去仔细读一下决策树的原理和实现,就可以基本上可以解答你本身的疑问。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
silver_gp
2022-2-22 19:04:32
决策树选择哪个attribute去分岔,取决于用这个属性去分岔是否能得到最多的infromation gain。每一个节点要决定用哪个属性以及怎么分岔时,它会测试每一个attribute进行分岔之后,哪个infromation gain是最多的,于是就决定用哪个attribute分岔。information gain就是先算出当前节点的entropy,以及分岔之后各自算entropy之和,看看比分岔前少了多少。大概流程就是这个样子。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
急问:rpart里面如何设置 类别 变量???
rpart决策树
关于R里面用rpart()来做分类决策树
请教rpart决策树的剪枝功能
请问R语言中使用Rpart做出来的分类以及画出来的图的解释
rpart包的复杂性参数问题
决策树Rpart包做决策树分析,prune剪枝时参考的SE准则和CP准则谁能详细讲一下,谢谢!
决策树rpart函数的使用
R 中关于rpart包的理解
R的rpart数据量过大时返回的是0,1 而不是0-1的概率,如果用很少的数据量就能得到概率,请问有
栏目导航
R语言论坛
互联网金融与Fintech版
行业分析报告
经管高考
爱问频道
经管文库(原现金交易版)
热门文章
表格结构数据特征与CDA数据分析师:精准适配 ...
2025全球人工智能技术应用洞察报告
奇瑞QQ焕新归来
【中国电信】2025年云计算研究白皮书
普华永道 - 中国影响力报告2025
房地产行业:2026年,年轻人应该先买车还是 ...
【24更新,自用整理!】2007-2024省级环境保护 ...
CDA数据分析脱产就业班于2026年3月7日开班! ...
表格结构数据的核心特征及具象实例解析
湖南统计年鉴2025(Excel版)
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群