URSIMON 发表于 2014-4-27 22:25 
如果observation不在任何节点上,那你如何使用这样的数据做prediction呢,如果这样原有的tree对你现有的数据有 ...
观测不在叶子节点因为它是基于训练数据形成的规则。当然如果使用全样本进行训练,对于每个观测都为决策树的规则产生做出了贡献,肯定是在最后的叶子节点里。但是我们一般会挑出部分作为试验数据,在选择部分作为验证数据,用以考究模型的稳定性,这时候就会有部分的验证数据不在模型的叶子节点上。对于规则形成了,用新的数据进行判别也是可能出现这种情况的,除非试验数据的各个属性包含了所有水平,但是一般很难做到吧。我现在的数据就是做不到,也许数据量太少或是水平数太多的缘故。所以我想请教如何去解决这个事情。