经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
python论坛
利用随机森林筛选重要性变量
楼主
还没想好用户名呢
18550
2
收藏
2018-06-13
本人正在写一篇论文,想用随机森林来选择重要性变量,但楼主是个软件小白,不知道如何实现这一过程,所以到此来发布一个问答帖子,求助各位大神,希望能帮忙实现,有偿帮助也可以,但有以下要求:
一、实现方式为Python或R
二、我想做的是利用随机森林两阶段逐步回归筛选重要性变量,所以需要完成以下两个步骤:
1.选用相对重要性评价变量重要性,要求实现步骤如下:
(1)对所有变量计算随机森林重要性得分,按相对重要性得分降序排序
(2)将变量分为N组,每组变量数目相等
(3)保留最后一组变量排序及得分
(4)计算剩余变量随机森林重要性的分,按相对重要性得分降序排列,返回步骤(3),直到这几组变量均计算完成
(5)重复模拟100次,以100次的相对重要性得分均值作为变量重要性的得分,以及重要性排序评判标准
2.利用逐步回归筛选变量,实现步骤如下:
(1)根据改进后变量重要性排序确定的变量重要性得分,对原数据剔除该得分小于0的变量数据
(2)对剔除后的剩余变量再次进行随机森林变量重要性降序排列
(3)选择排序第一的变量,对变量做100次随机森林,计算a=OOB(误分率)
(4)加入排序中的下一个变量,做100次随机森林,计算b=OOB(误分率)
(5)若a<=b,删除加入的变量,转入步骤(4)
(6)否则,将b 赋值给a ,选择变量,重新计算现有变量重要性得分,降序排列
(7)若剔除最后一个变量,做100次随机森林,计算b=OOB
(8)若a<=b,保留该变量,转入步骤(4)
(9)否则剔除该变量,将b 赋值给a,转入步骤(4)
(10)直至遍历所有的变量,OOB最小结束。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
杨Yuer参上
2018-6-23 16:25:36
兄弟,你这个是完整的项目了,让别人免费给你 弄肯定是不可能的。
你还是等着哪个想赚外快的大神,愿意接你的活吧!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
ljian1718
2018-12-19 13:24:55
看到你的帖子,是不是已经做好了?如果有需要可以Q聊,有偿服务
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
随机森林模型的模型比较参数设定疑问
R语言 随机森林分类问题
关于R语言中随机森林是否会出现过拟合现象问题
基于随机森林算法的信道场景分类模型研究
随机森林算法在交通状态判别中的应用
Duncan多重比较分析可以给因子重要性排序吗
【300】论坛币,求填问卷
SPSS Modeler logistic回归出不来图 大佬帮帮忙!!
《机器学习实战》读书笔记:利用Python 3进行逐步回归实验
【学习笔记】今日分学习 随机森林集成算法 特征工程 贝叶斯
栏目导航
python论坛
互联网金融与Fintech版
金融学(理论版)
求助成功区
经管高考
行业分析报告
热门文章
相对于Harness这个词,我更钟情控制论:从控 ...
2026 AI趋势报告(中英)
2026全球数智化人才指数报告
比亚迪一季度净利大跌55% 六年来最大跌幅
当Stata遇上 AI 智能体:你的实证研究,正在 ...
从数据仓库到智能取数:CDA数据分析师视角下 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
A Practical Guide to Logistic Regression ...
GraphPad Prism 多因素方差分析
Expert Choice软件(ahp层次分析法软件)含序 ...
推荐文章
五一充电,学术突围!四大AI赋能王牌课程, ...
关于学术研究和论文发表的一些建议
几种免费下载文献的方法----我的文献应助经
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群