经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
python论坛
利用随机森林筛选重要性变量
楼主
还没想好用户名呢
18380
2
收藏
2018-06-13
本人正在写一篇论文,想用随机森林来选择重要性变量,但楼主是个软件小白,不知道如何实现这一过程,所以到此来发布一个问答帖子,求助各位大神,希望能帮忙实现,有偿帮助也可以,但有以下要求:
一、实现方式为Python或R
二、我想做的是利用随机森林两阶段逐步回归筛选重要性变量,所以需要完成以下两个步骤:
1.选用相对重要性评价变量重要性,要求实现步骤如下:
(1)对所有变量计算随机森林重要性得分,按相对重要性得分降序排序
(2)将变量分为N组,每组变量数目相等
(3)保留最后一组变量排序及得分
(4)计算剩余变量随机森林重要性的分,按相对重要性得分降序排列,返回步骤(3),直到这几组变量均计算完成
(5)重复模拟100次,以100次的相对重要性得分均值作为变量重要性的得分,以及重要性排序评判标准
2.利用逐步回归筛选变量,实现步骤如下:
(1)根据改进后变量重要性排序确定的变量重要性得分,对原数据剔除该得分小于0的变量数据
(2)对剔除后的剩余变量再次进行随机森林变量重要性降序排列
(3)选择排序第一的变量,对变量做100次随机森林,计算a=OOB(误分率)
(4)加入排序中的下一个变量,做100次随机森林,计算b=OOB(误分率)
(5)若a<=b,删除加入的变量,转入步骤(4)
(6)否则,将b 赋值给a ,选择变量,重新计算现有变量重要性得分,降序排列
(7)若剔除最后一个变量,做100次随机森林,计算b=OOB
(8)若a<=b,保留该变量,转入步骤(4)
(9)否则剔除该变量,将b 赋值给a,转入步骤(4)
(10)直至遍历所有的变量,OOB最小结束。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
杨Yuer参上
2018-6-23 16:25:36
兄弟,你这个是完整的项目了,让别人免费给你 弄肯定是不可能的。
你还是等着哪个想赚外快的大神,愿意接你的活吧!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
ljian1718
2018-12-19 13:24:55
看到你的帖子,是不是已经做好了?如果有需要可以Q聊,有偿服务
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
随机森林模型的模型比较参数设定疑问
R语言 随机森林分类问题
关于R语言中随机森林是否会出现过拟合现象问题
基于随机森林算法的信道场景分类模型研究
随机森林算法在交通状态判别中的应用
Duncan多重比较分析可以给因子重要性排序吗
【300】论坛币,求填问卷
SPSS Modeler logistic回归出不来图 大佬帮帮忙!!
《机器学习实战》读书笔记:利用Python 3进行逐步回归实验
【学习笔记】今日分学习 随机森林集成算法 特征工程 贝叶斯
栏目导航
python论坛
金融实务版
数据分析师(CDA)专版
真实世界经济学(含财经时事)
经管高考
数据交流中心
热门文章
当AI遇见ML:高校教师如何借助AI与机器学习 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CDA数据分析师实战:指标体系搭建的全流程方 ...
Essentials of Statistics for Research by ...
2025年AI智能体的兴起:未来展望报告(英)
祝贺奇瑞!祝贺尹同跃!
“奇瑞品质”再获权威认证
【自用整理,24更新!】2009-2024上市公司华证 ...
【24重磅,顶刊方法!】2010-2024上市公司绿色 ...
《数据要素发展报告(2025年)》---来源:中 ...
推荐文章
12月武汉站|Deepseek辅助论文写作与数据分 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群