经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
python论坛
利用随机森林筛选重要性变量
楼主
还没想好用户名呢
18431
2
收藏
2018-06-13
本人正在写一篇论文,想用随机森林来选择重要性变量,但楼主是个软件小白,不知道如何实现这一过程,所以到此来发布一个问答帖子,求助各位大神,希望能帮忙实现,有偿帮助也可以,但有以下要求:
一、实现方式为Python或R
二、我想做的是利用随机森林两阶段逐步回归筛选重要性变量,所以需要完成以下两个步骤:
1.选用相对重要性评价变量重要性,要求实现步骤如下:
(1)对所有变量计算随机森林重要性得分,按相对重要性得分降序排序
(2)将变量分为N组,每组变量数目相等
(3)保留最后一组变量排序及得分
(4)计算剩余变量随机森林重要性的分,按相对重要性得分降序排列,返回步骤(3),直到这几组变量均计算完成
(5)重复模拟100次,以100次的相对重要性得分均值作为变量重要性的得分,以及重要性排序评判标准
2.利用逐步回归筛选变量,实现步骤如下:
(1)根据改进后变量重要性排序确定的变量重要性得分,对原数据剔除该得分小于0的变量数据
(2)对剔除后的剩余变量再次进行随机森林变量重要性降序排列
(3)选择排序第一的变量,对变量做100次随机森林,计算a=OOB(误分率)
(4)加入排序中的下一个变量,做100次随机森林,计算b=OOB(误分率)
(5)若a<=b,删除加入的变量,转入步骤(4)
(6)否则,将b 赋值给a ,选择变量,重新计算现有变量重要性得分,降序排列
(7)若剔除最后一个变量,做100次随机森林,计算b=OOB
(8)若a<=b,保留该变量,转入步骤(4)
(9)否则剔除该变量,将b 赋值给a,转入步骤(4)
(10)直至遍历所有的变量,OOB最小结束。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
杨Yuer参上
2018-6-23 16:25:36
兄弟,你这个是完整的项目了,让别人免费给你 弄肯定是不可能的。
你还是等着哪个想赚外快的大神,愿意接你的活吧!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
ljian1718
2018-12-19 13:24:55
看到你的帖子,是不是已经做好了?如果有需要可以Q聊,有偿服务
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
随机森林模型的模型比较参数设定疑问
R语言 随机森林分类问题
关于R语言中随机森林是否会出现过拟合现象问题
基于随机森林算法的信道场景分类模型研究
随机森林算法在交通状态判别中的应用
Duncan多重比较分析可以给因子重要性排序吗
【300】论坛币,求填问卷
SPSS Modeler logistic回归出不来图 大佬帮帮忙!!
《机器学习实战》读书笔记:利用Python 3进行逐步回归实验
【学习笔记】今日分学习 随机森林集成算法 特征工程 贝叶斯
栏目导航
python论坛
经管高考
投行专版
经管文库(原现金交易版)
CPA注册会计师及其他财会考证
企业文化
热门文章
CDA数据分析脱产就业班于2026年3月7日开班! ...
参数估计:CDA数据分析师的核心推断工具,用 ...
GeoSaaS永久会员版
全国国土利用现状、耕地、园地、林地分布等 ...
脑机接口行业系列报告:Neuralink带来的启示 ...
2025年全国公交路线及站点矢量数据
通往2026 中国消费者趋势前瞻
天堂的证据(〔美〕埃本·亚历山大)
Causal Inference: what if 25年11月版
芜宣机场,增长740%!
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群