你的10个论坛币我要了!
你的问题是自变量如何筛选,一般回归模型变量筛选有3个大类:enter,forward,backward,首先在这3类中选一类,如果你想让你的自变量全部进入模型(哪怕无统计学意义),选enter,如果想只让有意义的变量进入,选其它两项,向前呢,就是首先选入意义最大的那个变量,(这一步在构建模型的前一步已经完成了),检验模型,如果有意义,保留在模型内,然后选入剩下的那些尚未进入模型的变量中意义最大的那个进入模型,注意,这时候模型中就有两个自变量了,对不对?然后再次检验模型,如果两个自变量同时存在的条件下模型仍有意义,那么重复以上步骤,直到所有有意义的自变量都进入模型,但实际情况要复杂的多:两个自变量进入模型后,可能模型变得没有意义了,这时候就得剔除第一个变量,只剩第二个,再次检验模型,有意义的话,再选其它变量进入,都有意义自然好,如果再次出现模型变得无意义,还得剔除某个变量,然后选择其它变量,再次检验模型,这样就形成了一个可能永远无解的计算过程,好在多数时候是有解的。俺在上学的时候,老师给了一个3个自变量的回归让手算,可能是在下数学不行,整整算了6个晚上啊!
backward其实也是一样的,只是把过程倒过来,先让所有自变量进入模型,然后检验,如果模型无意义,先剔除意义最小的那个,然后就是循环计算了。
每个大类中又有几个小类,含义是lr,likelihood ration,拟然比检验;Wald,
Wald检验;Conditions,条件拟然比检验。一般用拟然比检验比较可靠,Wald检验用的较少,Conditions
就更少。这些都是纯数学问题,不必过分关心。
应该是说明白了,至于你选择那一种,看你的情况了,但选择forward(lr)的最多。注意前面说的一点,拟然比检验可能是无解的,所以对话框中有个拟合多少次后如果无解就停止的选项。据俺的经验,如果变量不是太多,一般拟合十几次后就会有结论。
给钱吧!