请教各位前辈:
有很多个firm,每个公司都有很多年,每个公司分别属于特定的industry
sort by industry 之后 怎么随机每个公司取一个firm-year呢?然后构成新的table(因为每个公司有很多年的数据,sort之后取一年就行了)
并count每个industry有多少公司。
谢谢大家了!
---------------------------------------------------
就是样本里面有很多公司,每个公司又有很多年的数据,同时各个公司属于特定的行业
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
333         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994
样本类似长这个样子的  SIC是行业代码
目标:
首先sort by SIC,这样的话就变成:
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
289         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
A 和 D属于一个行业 B和C属于一个行业,但是公司A和D都有很多个obversation 
现在要做的是:
怎么把随机选择一个firm-year,也即每个公司只留下一个obversation?