全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
7160 1
2019-02-18
悬赏 5 个论坛币 已解决
最近在研究数据挖掘,遇到实际问题,预测水量数据,自变量中有年月(时序),水表数(数值),用水分类(已处理成二分类),地区(已处理成二分类),因变量为用水量。
已经建立了多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定,超过20%误差。
请问大神们,哪些模型可以处理。或者说,我还需要做什么预处理吗。
我用的是Python直接代码的。

最佳答案

dreamhappy2012 查看完整内容

在多元线性回归模型中,自变量如果有多个且都是二分类的,直接纳入即可。如果自变量中有多类别变量,那么要处理为虚拟变量再纳入模型。如果只有一个二分类自变量,那么做t检验与做一元线性回归是一样的道理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-2-18 09:13:38
在多元线性回归模型中,自变量如果有多个且都是二分类的,直接纳入即可。如果自变量中有多类别变量,那么要处理为虚拟变量再纳入模型。如果只有一个二分类自变量,那么做t检验与做一元线性回归是一样的道理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群