全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3121 4
2016-03-14
对数据做一个逻辑回归建模,发现只有66%的准确率和66%的击中率,因为前面做相关性检查时候发现相关性普遍不高,只选择了相关性在0.04以上的变量,之后我降低这个阀值(比如修改成0.035),让更多的变量进入到模型,发现准确率依旧没有很大改变。想问下,这时候需要怎么做才能提高准确率。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-3-14 17:02:42
无聊凋零 发表于 2016-3-14 16:29
对数据做一个逻辑回归建模,发现只有66%的准确率和66%的击中率,因为前面做相关性检查时候发现相关性普遍不 ...
换模型或者换数据吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-14 17:30:32
草衣落荻 发表于 2016-3-14 17:02
换模型或者换数据吧
因为之前别的公司有相似过案例,准确率达到80多,所以模型应该没问题的。数据方面也是按照一般流程那样清洗完后建模的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-15 10:43:05
无聊凋零 发表于 2016-3-14 17:30
因为之前别的公司有相似过案例,准确率达到80多,所以模型应该没问题的。数据方面也是按照一般流程那样清 ...
........................

我想表达的意思有两层:

1. 再相似的案例也是不一样的, 而且数据真的对模型的影响很大. 在当前数据下, 一些变量对模型是显著的, 换一组数据, 之前显著的变量可能就不显著了, 并且还有可能你没考虑到的因素对响应变量影响很大. 另外在选择变量的时候, 可以尝试lasso logistics regression, 也许能够降低预测误差.

2. 我不知道您的准确率是如何计算的? 是回带误差(对训练集预测的误差)还是交叉验证误差(对测试集预测的误差)? 如果是后者的话, 您不能使用普通逻辑回归, 这个模型对您当前的案例和数据是不适用的, 建议使用其他模型. 如果是前者的话, 这个误差对模型的预测效果来说基本没有意义......因为前者很小的话, 可能出现过拟合现象. 就是说, 过拟合的模型对你当前的数据预测效果很好, 但是来一个新数据, 预测效果可能不高. 所以推荐使用后者作为准确率的指标.

综上所述, 对于具体案例需要具体分析, 模型选择需要多尝试. 这个不行就换另外的. 在进行分类时, 逻辑回归是比较基础的模型, 建议继续尝试 KNN/SVM/神经网络/随机森林树等模型

个人观点, 不一定对
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-15 16:31:31
草衣落荻 发表于 2016-3-15 10:43
........................

我想表达的意思有两层:
感谢您的回复,现在我在尝试建立CART模型看下效果如何,再次感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群