楼主是菜鸟级SAS user,想问一下如何删除2001年-2011年间财务报表发布不完整或者间断了的公司数据。我从CSMAR上下载了2001年-2011年上市公司的资产负债表数据,变量code里存放的是股票代码,date里存放的是资产负债表发布的日期。
表格是先按照代码升序排列在按照时间升序排列的,其中有的公司每季度都发布财务报表所以一年有四个数据,有的公司半年才发布一次财务报表,所以一年中只有两个数据。而且有的公司存续期前晚于2001年或者在2011年之前就不再公布财务报表了,这类就是楼主想要删除的公司数据。
楼主想到的筛选方法是:
先按照日期变量date(2001-12-31 2002-12-31 2003-12-31——2011-12-31)将数据表拆分为11个子数据表;
然后用观测值最少的数据表作为参照,保留其余10个表中与参照表的公司代码code观测值相同的数据。
不知道完整的程序应该如何实现啊?源数据已经转换为balance数据集了的。求指导!