在平常写论文、报告的时候经常要用到月度平均数据,但是有的时候我们手头上仅有的是日期数据,这就产生一个问题,如何生成月度平均数据?
当然了,如果是少量的算算就可以了,但是如果是大量的依靠EXCEl等软件操作起来就复杂了,利用STATA10可以分两步来解决这个问题,首先生成月度平均数,然后将重复的数据剔除掉,就可以得到月度平均数序列。具体操作如下:
假设时间序列变量为:yyyy mm dd code p
首先,生成月度平均数,操作代码为
sort yyyy mm code
就是按照 yyyy mm code 排序
然后,敲入命令 by yyyy mm code : egen mean_p=mean(p)
就是取月度平均数,但是此时由于时间是按照日期来排列的,月度数据就有很多个,这个时候要剔除掉重复的,怎么来实现呢?
最后一步,输入duplicates drop yyyy mm, force
这样得按照yyyy mm 组合的唯一性删除掉了重复的数据,得到即是月度数据,并且唯一!