在工作中碰到这样一个问题,做截面分析,然后利用同一个模型在不同截面(比如今天和昨天)得到的残差做自相关关分析,很是不解。例子如下;
为了简化问题, 只考察包含5只股票,十个交易日的样本;
考察回归模型y=a+bx
t S1 S2 S3 S4 S5
1 xy11 xy21 xy31 xy41 xy51
2 xy12 xy22 xy32 xy42 xy52
3 xy13 xy23 xy33 xy43 xy53
4 xy14 xy24 xy34 xy44 xy54
5 xy15 xy25 xy35 xy45 xy55
6 xy16 xy26 xy36 xy46 xy56
7 xy17 xy27 xy37 xy47 xy57
8 xy18 xy28 xy38 xy48 xy58
9 xy19 xy29 xy39 xy49 xy59
10 xy20 xy30 xy40 xy50 xy60
做横截面分析,则对于每一个时间点,会得出一个a系数和一个b系数
t a_co b_co
1 a1 b1
2 a2 b2
3 a3 b3
4 a4 b4
5 a5 b5
6 a6 b6
7 a7 b7
8 a8 b8
9 a9 b9
10 a10 b10
我的问题在于:
如果模型的系数是不稳定的(也就是上表中a_co,b_co的值在相邻两天并不能满足只在较小的区间内波动),则对于残差项是否相关的讨论就没有意义。(因为不是同一个模型的出来的残差,而且残差自相关是时间序列分析的范畴,不是面板数据分析的范畴)。
如果模型的系数是相对稳定的,也就是在t∈[1,10]的范围内a_co,b_co在统计学意义上不具有显著差异。则用该模型也可以拟合其中某只股票的时间序列(在t∈[1,10]),而且的出来的残差应当与截面分析的结果相一致。只有用时间序列进行分析,才能够讨论其自相关等特性。如果系数相对稳定的话, 得到的误差项一阶自相关系数高达70%,则不符合经典OLS的基本假设。
我不知道这样的一个矛盾是如何解决的?或许元作者本身的操作就是错误的?