全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
11136 15
2013-10-24
QQ图片20131024160442.jpg

QQ图片20131024161146.jpg
为啥 变量重要性里面变量“ 总签单金额 ”不重要(系数几乎为0)
但是决策树里面 “ 总签单金额 ”却是第一个分支?
求高手解答,先谢过
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-10-24 20:15:33
两个模型反映的关系角度不一样。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-25 09:48:44
kuangsir6 发表于 2013-10-24 20:15
两个模型反映的关系角度不一样。
请简单一点介绍两个的角度什么区别,谢谢咯
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-25 10:34:02
285743489 发表于 2013-10-25 09:48
请简单一点介绍两个的角度什么区别,谢谢咯
两个方法选择的分割属性不同。
C5.0是信息熵,CART)是最小基尼(GINI)指标。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-25 15:48:40
kuangsir6 发表于 2013-10-25 10:34
两个方法选择的分割属性不同。
C5.0是信息熵,CART)是最小基尼(GINI)指标。
高手,你好,我在Clementine里面用的只是C5.0节点,没有添加C&RT。
C5.0运行结果的“模型”里面左侧 “总签单金额”排第一,右侧的变量重要性却说“总签单金额”系数几乎=0.

你的意思是右侧的变量重要性是按照 C&RT算法---最小基尼(GINI)指标计算的?  
还有就是C5.0节点运算后,得到的影响输出结果最重要的变量是左侧的“总签单金额”还是右侧的“总付费签单数”?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-25 17:19:52
285743489 发表于 2013-10-25 15:48
高手,你好,我在Clementine里面用的只是C5.0节点,没有添加C&RT。
C5.0运行结果的“模型”里面左侧 “ ...
不是高手,是爱好者。
我现在明白你的意思了。
右侧的变量重要性是主要考虑的自变量与因变量相关的p值的大小以及相关系数的大小。
是综合的判断结论,不是单指相关系数的大小的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群