logistc或称logit回归,对因变量规定为二分变量(也可是多分的,但那就复杂了),但自变量则无特殊要求,分类或连续均可,但最好将连续变量“居中化”,比如年龄,如果不处理,系统自动以最小值为参照,解释起来就麻烦了,貌似这类问题是各观测都减去该变量的均数,这样就以均数为参照值了。
其实这也是回归这类方法的长处,自变量不要求是分类还是连续型的,线性回归也是如此。至于弄成0或1,更没必要了。
不过话说回来,虽然对自变量类型无要求,但还有考虑到以后解释是否方便,比如距离,如果不分类,那最后结果肯定是每增加(或减少)1公里,因变量变化多少个比数比,这很难说有意义啊。