全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
6836 15
2021-05-24
各位大佬,因为我的研究内容也包括了企业生存方面的问题,但自己学习相关知识和阅读文献后,还是对实证中生存分析(面板数据)有些疑惑。根据 [size=10.2857pt]Namini ( [size=10.2857pt]2013) 的研究方法企业生存时间主要是指某一企业从在数据库中出现至退出所经历的时间业在 [size=10.2857pt]t 年存在[size=10.2857pt]、[size=10.2857pt]t [size=10.2857pt]+ 1 年从数据库中消失则可以视为退出[size=10.2857pt]。[size=10.2857pt]我想问问,例如整个样本数据(2002-2013)为面板数据,那么对于企业退出的识别,退出当年状态取为1,其余年份为0。如果是这样的话,例如某个企业是2004年成立,2013年退出,那么2013年可视为发生事件,为退出年份,取值为1,2004-2012年为0,那么在2002-2003年这个变量该怎么处理,是作为缺失值还是也取值为0?这个一直挺疑惑的。不知道在2002-2003年怎么赋值?
[size=10.2857pt]相关文献中用到的实证模型主要是cloglog模型,我自己看资料对于这块的实证资料较少,不知道stata怎么使用cloglog分析的相关命令,help cloglog看的好像是截面数据。。。。。。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-5-24 16:03:50
1. 企业在2004年成立,一般在2002 2003为缺失值 因为没有数据;
2. cloglog 是补对数-对数模型 一般用于稀有事件分析当中。这里可能的背景是出现企业破产的事件很少,如果常规的分析可能会存在偏误,所以采用这种模型来修正
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-5-24 19:52:37
wdlbcj 发表于 2021-5-24 16:03
1. 企业在2004年成立,一般在2002 2003为缺失值 因为没有数据;
2. cloglog 是补对数-对数模型 一般用于稀 ...
那么若利用微观企业数据进行的生存分析中,因变量是企业危险率函数,并且定义:企业退出为在 t年存在但 t+1 年不存在且不再重复进入的行为。那么企业发生事件,设定 failure 变量取值为 1,否则取值为 0;就是这里我一直没弄清楚,解释变量是相关影响企业生存的变量,为面板数据形式,但是因变量,企业发生失败事件,设定 failure 变量取值为 1,否则取值为 0,我不知道这个该怎么和解释变量的面板形式统一起来?这个问题对我个人来说很重要,恳请各位大佬有时间可以帮助我一下!
     我例举了一个例子:样本期为(1998-2002),那么一个可能的原始数据表为(其中time是t_end-t_start,此处单位为年),对于1号01年后退出,是个完全数据,发生了退出事件;对于2号,到研究截止(02)仍然没有退出,因此标记为0:
id t_start t_end time failure
1     99     01      3   1
2     98     02     4    0

.............
但这个如何和解释变量的面板格式结合呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-5-24 20:33:45
感觉你这里的格式 不是面板数据啊? 你这个示例看起来是一个 id1 从99-01 存活了3年;id2 98-02 存活了4年 现在依然存活。 这不像是一个面板数据的格式
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-5-24 21:20:33
wdlbcj 发表于 2021-5-24 20:33
感觉你这里的格式 不是面板数据啊? 你这个示例看起来是一个 id1 从99-01 存活了3年;id2 98-02 存活了4年 ...
对于id1、2的标识确实不是面板数据,原始的面板数据如下(非平衡面板,其中est_year 为成立年份,year为数据库该企业存在的区间,X1、X2为一些企业层面数据):
id  year  est_year  X1   X2
1    99        99      ...    ...
1    00        99      ...    ...
1    01        99      ...    ...
2    98        98      ...    ...
2    99        98      ...    ...
2    00        98      ...    ...
2    01        98      ...    ...
2    02        98      ...    ...
而我之前列示的是我个人对企业生存时间的理解,样本期(1998-2002),考虑到左删失的问题,选取的样本是1998-2002新成立的样本。出但现在数据为面板数据,不知道要如何取设定因变量?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-5-25 08:53:37
wdlbcj 发表于 2021-5-24 20:33
感觉你这里的格式 不是面板数据啊? 你这个示例看起来是一个 id1 从99-01 存活了3年;id2 98-02 存活了4年 ...
原始面板格式如下:(其中est_year是id成立年,year为id存在的相应年份,X1为一些企业层面的变量)
id year  est_year   X1  
1    99     99        ....
1    00     99        ....
1    01     99        ....
2    98     98        ....
2    99     98        ....
2    00     98        ....
2    01     98        ....
2    02     98        ....
考虑到左删失问题,所选取的样本是从98-02年新成立的企业.我上面列示出来的是想说id1存活了3年,id2存活了4年。但是我现在没有明白这样的一个数据形式(相关解释变量为企业层面的面板型数据,因变量不知道该如何设定?)还请指教!前面我没有讲清楚是我的问题,在此请见谅!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群