全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1853 9
2020-07-19
一个回归问题,想要求助各位
我想要看下时间和GDP之间的关系,想要预测一下2020-2025的GDP数值。我找了1978-2018年的GDP数据做了一个线性回归公式如下
fitind3<-lm(ind3~year+I(year^2),data=ecodata1)
其中:
ind3:是GDP数据
year:是年份(1978-2018)
回归结果如下
Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)  9.795e+11  4.738e+10   20.67   <2e-16 ***
year        -9.853e+08  4.743e+07  -20.77   <2e-16 ***
I(year^2)    2.478e+05  1.187e+04   20.87   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9509000 on 38 degrees of freedom
Multiple R-squared:  0.9804,        Adjusted R-squared:  0.9794
F-statistic: 949.6 on 2 and 38 DF,  p-value: < 2.2e-16

这里可以看到时间和GDP还是很显著的,R2也高

问题1:
R返回的fit.value是预测值吗?,但是为什么返回的预测值,和手算的差距很大
手算的公式如下
我数据里第一个数据就的时间1978
9.795e+11+( -9.853e+08*1978)+(2.478e+05*(1978^2))=90135200
但是模型fit.value 第一个值是18578360.1  这里为什么会相差那么大是正常的吗,求大神给我指条路,我还是个新手不胜感激

问题2:就是我想预测GDP 是否建立GDP和时间变量的线性回归的思路是正确的。

以上两个疑问请了解的大佬指点一下,哪怕回答一个问题也好,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-7-20 11:23:38
先说第二个问题。
你做的回归,当作熟悉函数的练习就好了。
回归结果只是过去年份GDP变化的拟合,尽管p值、F检验都显示具有很高的显著性,但这是过拟合,你拿任何年度差异不大的数据结果都会这样。
GDP的影响因素事实上与年份这个变量基本没什么关系,GDP取决于一个统计系统积累的年度投资、进出口、消费等诸多样本数据,如果想研究GDP的影响因素,应该是与这些变量进行回归分析和预测,而不是依据年份。
所以,你说的这个思路,方向不对。
如果你想考察GPD变化的周期性,建议还是进行时间序列分析。

再说第一个问题,你先看看手算的90135200与ecodata1中1978年的样本数据差异大不大。实际上summary(fitind3)应该不会有18578360.1这个结果,而且解一下你的回归方程就可以知道是不可能得到这个数的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-20 11:57:08
llb_321 发表于 2020-7-20 11:23
先说第二个问题。
你做的回归,当作熟悉函数的练习就好了。
回归结果只是过去年份GDP变化的拟合,尽管p值 ...
感谢您的回复
其实我一开始也觉得直接用GDP和时间回归会一些奇怪,这里这么做是因为,老师让我用趋势外推法来预测下2021-2025的GDP,我查了下趋势外推,线性回归就一种,如果我建立的是GDP~进出口额的线性回归,如预测2022年的GDP,就需要知道2022年的进出口额,但这个变量的未来也是不知道的,如此才想着用时间拟合试一下,但我觉得你说没错,这里其实任何数字都是显著的。这样做因该是有问题的。

关于第二个问题
手算的和真实数据差别也非常大,fit.value和真实值,和手算值 三个值都有很大差别  
这个方程回归出来
真实值是50000多,手算值是90000多,fit.value18000多相差非常大,我自己也用R的示例数据women看了下身高和体重的方程 手算预测值和预测值差距就0.0几应该是我方程建立思路的问题把。

再次感谢您的回答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-22 20:10:56
llmahayu 发表于 2020-7-20 11:57
感谢您的回复
其实我一开始也觉得直接用GDP和时间回归会一些奇怪,这里这么做是因为,老师让我用趋势外推 ...
GDP和时间做回归,这个都不满足经济显著性,就算你上面做出来在统计上是显著的,也没有意义。从经济上分析GDP和年份之间是没什么关系的。
做预测的话,假设你得到了2019年之前的数据,然后根据数据估计出来GDP的回归方程,就可以利用回归方程得到2020-2025年的GDP的预测值。
预测2022年的GDP,就需要知道2022年的进出口额,但这个变量的未来也是不知道的。——2022年真实GDP确实是不知道的,但你可以知道2022年GDP的预测值。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-23 12:48:15
果果莹 发表于 2020-7-22 20:10
GDP和时间做回归,这个都不满足经济显著性,就算你上面做出来在统计上是显著的,也没有意义。从经济上分析 ...
同样感谢回复
是这样假设我的回归方程是 GDP=进出口额,这个数据是2010-2019年的 那么GDP 和进出口额就是对应的关系了,这个时候我要知道我要得到2020的GDP 就一定要知道2020年的进出口额,这样我还是要预测2020年的进出口,又要用另外一个方法就感觉很麻烦。我已经改用GM 和ARIMA来预测分析了
再次感谢回复
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-23 23:19:19
你怎么知道GDP和年份是线性关系。经济都是有周期的,我觉得非线性的可能性更大。可以加入x^2项看看效果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群