全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4258 5
2017-09-03
各位老师大家好,最近在用R语言做一元线性和非线性回归模型拟合(线性、指数、幂、对数、二次多项式)。其中指数、幂和对数分别对自变量或因变量进行对数转换,然后对转换后的量进行线性拟合即可。发现,这样做得到的5种模型的R2和RMSE并不符合预期,反而有些模型R2最大,而RMSE也最大。对此,在下查阅一些资料(http://blog.minitab.com/blog/adv ... onlinear-regression)发现有些人认为非线性拟合的决定系数被称作伪决定系数,线性模型的R2才是真实可靠的R2.
所以想请教各位老师几个问题:1,经过对自变量或者因变量转换再进行线性拟合得到的R2不可以代表未转换前的非线性方程的R2,对吗?
2,如果1中所说是对的,那么如果利用AIC的值来判定五种模型中哪个最优是可行的吗?转换后方程求得的AIC值是否可以代表未转换前非线性方程的AIC?
3,通过计算其他如误差平方和、偏差等可以共同判定哪个是最有的模型,可是经过计算发现有些指标的大小并不是一一对应,即较小的误差平方和意味着较好的拟合精度,但同时对应着较大的偏差或者平均绝对误差。想请问在不同指标给出的最优模型相左时,应该怎么判定最优模型?
不知道说明白没有,欢迎大家交流讨论,谢谢大家
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-9-3 11:15:36
不知道你把因变量都作了变化之后,再计算R方有何意义
AIC的原理是最大似然函数
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-3 11:24:59
z644070039 发表于 2017-9-3 11:15
不知道你把因变量都作了变化之后,再计算R方有何意义
AIC的原理是最大似然函数
我的目的只是想比较这5种模型的拟合精度,然后挑选初最优的模型。不知道该比较哪些指标,或者以哪些指标为主?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-3 16:07:51
大头的脑袋 发表于 2017-9-3 11:24
我的目的只是想比较这5种模型的拟合精度,然后挑选初最优的模型。不知道该比较哪些指标,或者以哪些指标为 ...
一般而言,AIC/BIC这类信息指标比R方更好.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-3 19:53:41
z644070039 发表于 2017-9-3 16:07
一般而言,AIC/BIC这类信息指标比R方更好.
感谢您的回复。只是在比较五种模型时我将数据分成了验证数据集和训练数据集,建模时只使用训练数据集,然后用验证数据集验证。向AIC/BIC等只是比较构建的模型的优劣,并不涉及验证数据集,所以有什么其他指标推荐的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-3 23:41:48
大头的脑袋 发表于 2017-9-3 19:53
感谢您的回复。只是在比较五种模型时我将数据分成了验证数据集和训练数据集,建模时只使用训练数据集,然 ...
你指的回测啊,这个就有点复杂了,要根据你具体研究的问题来分析的。(另外我不是搞量投那方向的)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群