用logistic筛选风险因素,有事故时间段,事故发生地点,车型等自变量,求酒驾换驾的风险因素,怎么编程能从结果上看出来哪个车型风险最大呢?共有九个自变量,我的程序是:
data a;
input x1-x9 y@@;
cards;
.....
proc logistic descending;
model y=x1-x9/selection=forword sls=0.1 sle=0.1;
run;
假如车型这一变量的优比估计值是2,总不能说后一种车型酒驾换驾的几率是前一种的2倍吧,感觉好奇怪。。。
如果用哑变量的话
proc logistic descending;
model y=x1 x2 {x31 x31 x33 x34...x38} x4 x5 {x61 x62 ..x67} x8 x9/selection=forword sls=0.1 sle=0.1;
run; /这样靠谱么,x3跟x6是无序多分类的自变量,不是说要有一个参照,选定x39 x68 参照,所以没进入模型/
还是这样分着来
model y=x31 x32 ....x38/selection=forword sls=0.1 sle=0.1;
另外这个模型粗来R方等于0.002,,,对于logistic模型来说,影响有没有很大?