1、我用sas EM跑完决策树后,result分为四块,左下角一块对应的是分叉的叶子,叶子后面对应的training集和validation集上面写的数字是什么意思,我这边写得全是0.0469,我猜不出它的含义。
2、使用决策树跑之前,总浓度为5%,由于数据量太大,我使用Sampling随机抽样10%后跑决策树,虽然最后一片叶子的浓度能提高到35%,但是在assessment里面观察升降图,lift根本就没有上升。同样是这个数据,如果我不使用sampling,直接对所有数据跑决策树,做出来最后一片叶子浓度是50%左右,lift响应度一下子也上升到30%,请问这个怎么解释?和过采样有关系么?
顺带问一下,决策树自己能做过采样么,还是我用了sampling它就对我的数据进行什么处理了?困惑!
谢谢高手,拜谢高手,望不吝赐教。