数据结构如下:研究区间为05年到08年,数据可能有缺失。现假设实验组只有两只股票,控制组三只股票,需要实验组的每只股票和控制组三只股票分别匹配,计算一个均值,也就是变量v做差的平方再除以时间,以实验组第一只000001为例,与控制组000003匹配时,只有三年的数据,因此计算变量v的均值时只需要除以3,以此类推。如何编程能得到所有的均值,也就是6个值。希望大家能够帮忙解答下~万分感谢!
| 实验组 | | |
id | year | v |
000001 | 2006 | 0.7 |
000001 | 2007 | 0.9 |
000001 | 2008 | 1.2 |
000002 | 2005 | 0.6 |
000002 | 2006 | 0.4 |
000002 | 2007 | 0.9 |
000002 | 2008 | 1.5 |
| 控制组 | | |
id | year | v |
000003 | 2005 | 0.6 |
000003 | 2006 | 1.3 |
000003 | 2007 | 0.8 |
000003 | 2008 | 0.5 |
000004 | 2005 | 0.7 |
000004 | 2006 | 0.9 |
000004 | 2007 | 0.6 |
000004 | 2008 | 0.4 |
000005 | 2006 | 0.9 |
000005 | 2007 | 1.5 |
000005 | 2008 | 1.2 |