kuangsir6 发表于 2013-10-25 10:34 
两个方法选择的分割属性不同。
C5.0是信息熵,CART)是最小基尼(GINI)指标。
高手,你好,我在Clementine里面用的只是C5.0节点,没有添加C&RT。
C5.0运行结果的“模型”里面左侧 “总签单金额”排第一,右侧的变量重要性却说“总签单金额”系数几乎=0.
你的意思是右侧的变量重要性是按照 C&RT算法---最小基尼(GINI)指标计算的?
还有就是C5.0节点运算后,得到的影响输出结果最重要的变量是左侧的“总签单金额”还是右侧的“总付费签单数”?