做关于公司出口的持续时间的分析,要用到生存分析,stata里进行生存分析所要求的格式跟我的原始数据差别很大。。所以有个重要的步骤就是数据的转化,如图
原始数据是蓝色圈起来的,我整理成了矩阵的形式,1表示在这一年存在出口行为;
现在我想把数据整理成右边红笔圈起来的形式:如果公司连续出口n年,那么它的出口时间Time就是n,如果中间中断以后继续出口,那么要重新作为一条新的数据记录下来——例如F吧,它中断了两次,所以前两次的记录一样Time都是2,而第三次是1,第四次也是1;Start——Time是这次持续出口事件的开始年份;var11是一个标记,表明这条数据是这个公司的第几次持续出口事件,例如F前两次是1,后两次是2和3,这样统计一下以后我再用一个duplicate去掉重复的应该就完成了。。
本菜鸟表示已经搞了三天了死活弄不出来。。。我知道你们什么都会,求大神们拯救。。