各位前辈好,
向前辈们请教:如图1,是文献中的结果,也是我想要的理想决策树,这种每个结点被分成2个子结的。
而图2是我做出的结果,树特别大,而且第一层腰围(cm)就被分成了从小于73cm到大于98cm共7个结点,而实际上①我想要的可能只是想被分成大于84cm和小于84cm这两类,下面大家也看到了也有被分成三类的好几个。②而且文献当中,13个因素进入决策树模型,最后只有4个留下了,而我做的13个因素,却留下了7个,是为什么?是因为都是显著影响自变量的因素吗?。请问我应该怎么做?谢谢指教!
我使用的是CHAID法。
③我也尝试了CRT法,crt法确实只将因素分成了两类,但是它却没有剔除不重要的因素,而是进去模型几个影响因素,它就把这几个因素全部留下了,做成了决策树图。