wdlbcj 发表于 2021-5-24 16:03 
1. 企业在2004年成立,一般在2002 2003为缺失值 因为没有数据;
2. cloglog 是补对数-对数模型 一般用于稀 ...
那么若利用微观企业数据进行的生存分析中,因变量是企业危险率函数,并且定义:企业退出为在 t年存在但 t+1 年不存在且不再重复进入的行为。那么企业发生事件,设定 failure 变量取值为 1,否则取值为 0;就是这里我一直没弄清楚,解释变量是相关影响企业生存的变量,为面板数据形式,但是因变量,企业发生失败事件,设定 failure 变量取值为 1,否则取值为 0,我不知道这个该怎么和解释变量的面板形式统一起来?这个问题对我个人来说很重要,恳请各位大佬有时间可以帮助我一下!
我例举了一个例子:样本期为(1998-2002),那么一个可能的原始数据表为(其中time是t_end-t_start,此处单位为年),对于1号01年后退出,是个完全数据,发生了退出事件;对于2号,到研究截止(02)仍然没有退出,因此标记为0:
id t_start t_end time failure
1 99 01 3 1
2 98 02 4 0
.............
但这个如何和解释变量的面板格式结合呢?