小吭 发表于 2015-6-20 14:45 
没能理解大神的意思。。。。感谢大神给予帮助,可否再详细说明一下?
呃。。。我不是金融方向的,只是最近比较感兴趣,于是来到这儿。所以一时半会儿想不到可以用什么金融的例子来解释。不过,可以从高中数学的向量部分做一下类比。比如,一组数据我们可以将其看成一个向量,每一个分量就是每一个数。高中课本上应该引入了点乘/内积/点积的概念(不知道各地教材是不是都讲了。。。),同时还给了一个公式,即两个向量的夹角的余弦值等于两个向量的点积除以两个向量的模/长度之积。类比过来,covariance相当于点积,而correlation相当于这里的“两个向量的夹角的余弦值”。为什么这么说?看一下covariance和correlation的定义不难发现,这里的向量其实是把数据的每个点都减去该组数据的平均值。为什么要减去平均值呢?个人理解是:减去平均值后,每个数据点的大小就没有绝对意义了,而表征的是偏离平均值的程度,因此更有统计上的意义。这样处理后的数据/向量我们可以视为“反映数据偏离平均值程度“的向量,这样我们考察这个向量的长度(其实是长度的平方),它反映了数据总体偏离平均值程度也就不奇怪了,这个就是SST(Total Sum of Squares),为了看每个数据/自由度的偏离情况,我们除以数据的个数(也就是向量的维数)/自由度的数目,进而得到方差也就好理解了。
扯了这么多,回过头来看correlation和covariance。covariance就是两组数据“反映数据偏离平均值程度“的向量的点积,因此covariance包含了两组数据的互相关联的信息。但是事情没完,点积是正比于两个向量的长度的乘积的,换句话说点积大不一定表示两个向量的“关联”大,而有可能是两个向量本身很长!所以一定要把两个向量的长度的乘积除掉才能真正得到两个向量夹角的余弦值,也就得到了两组数据的correlation的大小,而把数据的绝对发散度的影响扣除掉了。好吧,说了这么多,布吉岛类比点积+夹角余弦与covariance+correlation对lz你有木有帮助。如果要进一步解释考虑一组随时间变化的数据不同时间点的correlation,也就是传说中的autocorrelation function(ACF)的话,只需要把不同时刻的数据看成两组数据即可。但是如果你要问窝为什么要引入ACF或者诸如correlation之类的概念的话,窝恐怕只能给你讲光学了,什么干涉啊之类的(原谅窝一个物理狗。。。实在是经济、金融知识匮乏。。。),所以建议lz还是反复体会一下从向量/线性代数/几何这方面切入去思考吧~