原始数据结构如下,研究区间为2005年到2009年,数据可能不完整,共两组:
| 实验组 |  |  | 
| id | year | v | 
| 000001 | 2005 |  | 
| 000001 | 2006 |  | 
| 000001 | 2007 |  | 
| 000001 | 2008 |  | 
| 000001 | 2009 |  | 
| 000002 | 2006 |  | 
| 000002 | 2007 |  | 
| 000002 | 2008 |  | 
| 000002 | 2009 | 
 | 
| 控制组 |  |  | 
| id | year | v | 
| 000009 | 2006 |  | 
| 000009 | 2007 |  | 
| 000009 | 2008 |  | 
| 000009 | 2009 |  | 
| 000023 | 2005 |  | 
| 000023 | 2006 |  | 
| 000023 | 2007 |  | 
| 000023 | 2008 |  | 
| 000023 | 2009 |  | 
| 000334 | 2005 |  | 
| 000334 | 2006 |  | 
| 000334 | 2007 |  | 
| 000334 | 2008 |  | 
最终目的是要用实验组的每只股票都和控制组的每只股票  根据时间来计算两个变量V的差的平方的均值 得到一个数,上边的例子最终结果就会得到6个数,请问咋分组和匹配?