全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2773 5
2019-02-18
悬赏 5 个论坛币 已解决
最近在研究数据挖掘,遇到实际问题,预测水量数据,自变量中有年月(时序),水表数(数值),用水分类(已处理成二分类),地区(已处理成二分类),因变量为用水量。
已经建立了多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定,超过20%误差。
请问大神们,哪些模型可以处理。或者说,我还需要做什么预处理吗。
我用的是Python直接代码的。

最佳答案

eeabcde 查看完整内容

"多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定",是不是多项式的次数取得太高产生过拟合了?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-2-18 09:28:47
"多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定",是不是多项式的次数取得太高产生过拟合了?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-20 15:51:12
eeabcde 发表于 2019-2-20 15:22
"多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定",是不是多项式的次数取得太高产生过拟合了 ...
我的拟合度在2-4次这三个里面,都维持在.95以上,拟合度都是很好的,然后预测出来的值,平均误差在5%左右,但是个别预测不理想的,误差就很高。应该是存在过拟合的情况,我用2次还存在过拟合的话,那用多项式不就没意义了吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-21 13:02:34
时间序列模型可以看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-25 09:00:57
阿扁V5 发表于 2019-2-21 13:02
时间序列模型可以看看
时间序列中,如何加入其他变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-26 14:16:39
时间序列ARIMA模型
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群