全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
1355 4
2013-05-15

目前练习采用两期的企业面板数据,被解释变量y中存在大量的零值,占到总样本的近90%。在回归中特别需要注意哪些问题?

对于那些在两期y值均为零的样本,其在模型识别中是否真正发挥作用?是否需要将其删除?

谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-5-17 18:21:11
不知你是什么样的数据?Y 的含义是什么?那些为 0 的观察值是如何产生的?其一,原始数据就是这样;其二,你把缺漏值都替换成了 0?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-17 18:49:35
其为研发投入数据,可以假定大量的零为真实的零。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-19 21:52:33
也不必然,因为有些公司可能为了防止竞争对手知道自己的研发情况而故意不披露研发支出。
对于 Y 有缺失值,但 X 并没有缺漏值的情况,可以考虑采用 heckman selection model,stata 命令为
help heckman
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-20 01:49:47
谢谢。我的被解释变量 y (研发投入)没有缺漏值,应该不能使用heckman
除非是人为地将一些零值变为缺漏值?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群