小弟最近刚开始学习stata,遇到了一些问题,无奈向各位大大们求助。
我想做按年度的每支股票在的超额收益率ar=ri-rm
并且能
每年提出对数化后
该年该股票的超额收益率ln(ar)的标准差和均值
最后再添加哑变量 crash=1 if ln(ar)<mean(lanar)-3.09stdev(lnar).
可是从Csmr上拉下来的数据是每只股票的序列一个接着一个排下去的,j例:
ID | week | ri | rm |
1 | 2001-1 | 1 | 2 |
1 | 2001-2 | 2 | 1 |
1 | 2002-1 | 3 | 4 |
1 | 2002-2 | 4 | 3 |
1 | 2003-1 | 5 | 5 |
2 | 2001-1 | 6 | |
2 | 2001-2 | 7 | |
2 | 2002-1 | 8 | |
2 | 2002-2 | 9 | |
1.我想让每个id的ri-rm得到Ar,可是rm只有第个id有数据。有没有方法可以按照id来分别减,或者可以批量复制rm?
2.假设取得ar序列后,如何能够得到
按年度的某股票ln(ar)的均值及标准差,并且创建新变量boundry=mean(lanar)-3.09stdev(lnar)?得到结果大概是这样的:
ID | week | ri | boundry |
1 | 2001-1 | 1 | -0.68496 |
1 | 2001-2 | 2 | -0.68496 |
1 | 2002-1 | 3 | 1.31504 |
1 | 2002-2 | 4 | 1.31504 |
1 | 2003-1 | 5 | 3.31504 |
2 | 2001-1 | 6 | 4.31504 |
2 | 2001-2 | 7 | 4.31504 |
2 | 2002-1 | 8 | 6.31504 |
2 | 2002-2 | 9 | 6.31504 |
先拜谢大家了