原始数据结构如下,研究区间为2005年到2009年,数据可能不完整,共两组:
实验组 | | |
id | year | v |
000001 | 2005 | |
000001 | 2006 | |
000001 | 2007 | |
000001 | 2008 | |
000001 | 2009 | |
000002 | 2006 | |
000002 | 2007 | |
000002 | 2008 | |
000002 | 2009 |
|
控制组 | | |
id | year | v |
000009 | 2006 | |
000009 | 2007 | |
000009 | 2008 | |
000009 | 2009 | |
000023 | 2005 | |
000023 | 2006 | |
000023 | 2007 | |
000023 | 2008 | |
000023 | 2009 | |
000334 | 2005 | |
000334 | 2006 | |
000334 | 2007 | |
000334 | 2008 | |
最终目的是要用实验组的每只股票都和控制组的每只股票 根据时间来计算两个变量V的差的平方的均值 得到一个数,上边的例子最终结果就会得到6个数,请问咋分组和匹配?