源于一道作业题,老师给这么一道题“The file US-stock.txt gives the opening prices of some US-stocks on 25th February2005, and 10th November 2017, as well as the company code. Use the price on the firstdate to try to predict the price on the second date using a linear model. You may wantto consider transformations of either (or both) variables”。05年某天市场股价和他们在17年的股价数据,做线性模型。初始图是这样的,很聚集,而且我觉得这两组数据本身就跨度很大,很难预测,可能就是为了检查我们学习的成果?这里应该是使用上课讲的一元线性模型和多元线性模型。
之后我秉承着老师说做变换我就做变换,用对数收益率作为y轴,对数股价作为x轴。
感觉有大概的趋势了,就做了线性回归
lm1 <- lm(r~xx);summary(lm1)。做出来系数确实都是显著的,残差也通过了DW检验,残差和拟合值也通过了peasron 检验,就是QQ图好像不符合正态分布,然后R方也太低了,感觉就是没有关系一样。
我觉得是不是要增加变量,可是一共就这两组数据,我怎么增加变量呢?
然后R语言线性回归能不能预设残差分布呢?
我还能做些什么来更好的构建模型呢?
请大佬们指点一二,谢谢!!