viking1111 发表于 2009-9-1 19:34 
我现在正研究中小企业信贷评价问题,用的是主成分下的logistics回归,用了6个主成分,累计方差贡献率80%,结果预测精度80%,健康企业预测准确率90%,可是违约企业只有30%的预测准确率;而用普通logistics回归用了18个变量,准确率90%,健康企业95%,违约企业准确率73%。实在想不通,为什么主成分会效果这么差?? 理论上,主成分的解释能力应该更高才对啊~~
看变量和数据满足两种分析方法的使用条件的哪一个?没有好坏之分的。