全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
2173 2
2015-01-03
连老师,您好!
请问我是用的中国工业企业数据库,但是一个关键变量在2004年缺失(不是工业增加值,工业增加值我知道怎么弥补),请问遇到这种情况下该怎么办?
我看有些文章是直接删除2004年数据进行回归(例如我在一个权威期刊《经济学(季刊)》上面看到由于缺失2004年出口交货值,那个作者就直接删除2004年数据),请问这样可以么?投稿的话会不会被抓着把柄?这种情况下业界通用的处理办法又是什么呢?

谢谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-14 09:11:48
       显然,这是不得以的处理方式。我认为具体的处理方法以及不同的处理方法的利弊要看你所研究的问题。
如果只是做截面差异比较,换言之,只是做简单的 FE 或 RE 估计,模型中没有涉及动态关系(例如,没有使用动态面板模型),则删除 2004 的数据不会对研究结论产生实质性的影响。
    然而,如果模型中有些变量使用的是对数形式,或者模型中包含了增长率之类的变量,则删除一年就会带来麻烦,因此,此时增长率的计算会出现问题。
    另一种处理方法就是使用插值或补漏的方式把 2004 的数据补充进来,但除非万不得已,这是一个最差的选择。毕竟,无论是采用何种方式补充 2004 的数据,我们都是基于现有信息集合来补充的,数据中并没有增加新的信息,但补漏的方法不当时,结果反而可能更加糟糕。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-14 10:34:48
arlionn 发表于 2015-1-14 09:11
显然,这是不得以的处理方式。我认为具体的处理方法以及不同的处理方法的利弊要看你所研究的问题。
...
为什么“模型中有些变量使用的是对数形式,或者模型中包含了增长率之类的变量,则删除一年就会带来麻烦”?第一,如果包含了增长率,那就跨一年计算2003和2005年的增长率,也不是有很大问题吧?第二,为什么对数形式也会带来麻烦?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群