无聊凋零 发表于 2016-3-14 17:30 
因为之前别的公司有相似过案例,准确率达到80多,所以模型应该没问题的。数据方面也是按照一般流程那样清 ...
........................
我想表达的意思有两层: 
1. 再相似的案例也是不一样的, 而且数据真的对模型的影响很大. 在当前数据下, 一些变量对模型是显著的, 换一组数据, 之前显著的变量可能就不显著了, 并且还有可能你没考虑到的因素对响应变量影响很大. 另外在选择变量的时候, 可以尝试lasso logistics regression, 也许能够降低预测误差. 
2. 我不知道您的准确率是如何计算的? 是回带误差(对训练集预测的误差)还是交叉验证误差(对测试集预测的误差)? 如果是后者的话, 您不能使用普通逻辑回归, 这个模型对您当前的案例和数据是不适用的, 建议使用其他模型. 如果是前者的话, 这个误差对模型的预测效果来说基本没有意义......因为前者很小的话, 可能出现过拟合现象. 就是说, 过拟合的模型对你当前的数据预测效果很好, 但是来一个新数据, 预测效果可能不高. 所以推荐使用后者作为准确率的指标.
综上所述, 对于具体案例需要具体分析, 模型选择需要多尝试. 这个不行就换另外的. 在进行分类时, 逻辑回归是比较基础的模型, 建议继续尝试 KNN/SVM/神经网络/随机森林树等模型
个人观点, 不一定对