1、sas中用logsitic做回归预测时,当数值型自变量的个数超过100个时,直接上来先让每个自变量对因变量进行逻辑回归,对于不显著的一些变量进行淘汰,之后再进行剩余变量的探索和处理等的话,会不会因为某些自变量存在缺失值或者异常值得情况,使得本来不显著的变量处理之后变得显著了?
2、如果对于剩余的数值型变量进行探索时,都需要做哪些工作? 是不是每个数值型自变量都要求服从正态分布?
3、对于数值型自变量。如果取值仅仅是一些离散的数值,例如1、2、3等时,可不可以直接当做自变量放在模型中?
4、对于字符型变量,当他作为分类变量出现在class语句以后,model后面的自变量还需不需要该字符型变量?
最近学逻辑回归,感觉有好多困惑?还望大神们不吝指教,感激不尽!!!