有05,06,07三年的分析师对上市公司盈利预测样本,每一个样本包括上市公司、分析师、盈利预测、上市公司年报数据blabla很多变量。
因为想研究05,06,07三年间发生事件的对盈利预测的影响,需要排除掉三年中新进入以及退出企业的影响,因此要取三年企业的交集。
譬如05年有ABCDEFG企业;06年进入HIJK企业,FG企业退出;07年进入LMN企业,DE企业退出,则三年都有的企业是ABC。
因为样本取的是企业的盈利预测,每个企业可能不只一条预测结果,上市公司号这个变量并不唯一。
想问有没有合适的处理方法。
表达上不知道还有没有什么问题?请教各位大大!
PS:一个信管的同学用R帮我做出来一次了,但是因为数据是dta格式的,通过EXCEL中转变量的类型好多都变了,所以还是来问问各位高手,有没有什么办法能够在stata里就实现这种合并的。
在此多谢大家,祝论文顺利!

[loveliness]