全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2299 2
2019-07-29

以下在SAS的EM中通过一个案例来说明决策树选择重要变量的过程:


整体流程图

image-20190729171250162.png

上图中从左到右分别为步骤1-4,其中步骤4是神经网络,其实不重要,重要的是前3步,第4步可以是其他节点。


选择案例数据
image-20190729171524119.png

插入Input Data Source 节点,选择SAMPSIO.HMEQ作为源数据,并点Change钩上Use complete data as sample选择全部数据用作后续操作。


设置训练、验证数据比例
image-20190729172417734.png

训练:67%,验证:33%


决策树设置
image-20190729172732498.png

打开决策树设置,唯一要更改的是上图中圈红的地方,从0改成2(备选规则存储)。


然后关闭后运行决策树,运行结束后右键查看决策树结果:


image-20190729170941079.png

在Score页面中子页面Variable Selection中可以看到变量的重要性排序。


小结

好处是先把作用不大的变量直接筛选掉,跟在这个决策树后面的节点默认会排除掉决策树中已经rejected的变量。


如果变量特别多的时候,这种方法特别有效。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-6-13 07:43:24
good09
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-6-13 07:43:46
good10
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群