我想研究A政策对违约事件数的影响,因为大多数企业在大多数季度违约次数都是0,有的会是1次,2次或者3次等,所以,这符合零膨胀模型的特点。但是在时间选取上现在不确定,因为我们国家2014年第一个季度才开始有债券违约发生,以前并没有,那么我的因变量在2014年第一季度以前全部取零值,以后则大部分取零值,少数取非零值。
我想问:我样本是只选2014年以后合适,还是涵盖上2014年以前的一段样本?比如从2010年或2013年开始。
第一种考虑是:2014年以前,违约事件次数全是0,做因变量可能无意义;
第二种考虑是:可能恰好是A政策在2014年变动才引起了企业违约,从0到有违约,因此应该涵盖以前的一段时间。
请有经验的老师们帮我看看这个问题,到底该从哪个节点选样本?
特别感谢!