刚开始学一元回归,正好实际工作中遇到问题。请老师讲解。
有如下数据,需预测2011年2月末的值或区间:
占全年比值 | 2006年 | 2007年 | 2008年 | 2009年 | 2010年 | 2011年 |
1月末 | 13.50% | 13.6% | 9.6% | 11.8% | 12.3% | 14.5% |
2月末 | 24.60% | 26.3% | 20.6% | 24.0% | 25.3% | |
做法:设1月末为X,2月末为Y,建立方程:y=c+bx
结果:
Y =9.2% +1.23*X,据此预测:y=27%。
Coefficient Std. Error t-Statistic Prob.
C 0.092050 0.036267 2.538106 0.0848
X 1.229852 0.296140 4.152942 0.0254
R-squared 0.851829 Mean dependent var 0.241600
Adjusted R-squared 0.802439 S.D. dependent var 0.021663
S.E. of regression 0.009629 Akaike info criterion -6.158926
Sum squared resid 0.000278 Schwarz criterion -6.315151
Log likelihood 17.39731 Hannan-Quinn criter. -6.578218
F-statistic 17.24693 Durbin-Watson stat 1.455247
Prob(F-statistic) 0.025377
问题如下:
1、标准差SE与可决系数R之间的关系。
因感觉本方程R不算很高,我又调整了样本数,即剔除2006年数据只用2007-2010年数据拟合方程,则R可达0.97,而SE只有0.004826.
请问老师,是否用剔除2006年后的拟合方程更适合?不但R高,而且SE低,有利进行区间预测。(在预测时,我都用2倍SE加点估计作为95%置信的区间估计,没错吧?)
是否R越高,SE越低?二者之间的关系能否证明?
2、在EVIEWS中能否直接看到区间估计的数值?
在EVIEWS中的方程中用forecast预测时,只能看到2倍SE的图,看不到具体数值,每次需要手工计算,比较麻烦。
谢谢!