全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4908 8
2020-04-13
计量小白,最近在写论文
在使用logit回归面板数据,我数据里有1w多个数据,但回归中的observation只剩下6000多个
stata显示是这样:

note: multiple positive outcomes within groups encountered.
note: 1,630 groups (12,447 obs) dropped because of all positive or
      all negative outcomes.


想问下研究中一般要怎么处理这种情况呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-4-13 22:07:04
你描述的不是很详细。显示你分组了?猜测自变量有缺失值还是因变量只有一个值?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-13 23:07:55
席慧慧 发表于 2020-4-13 22:07
你描述的不是很详细。显示你分组了?猜测自变量有缺失值还是因变量只有一个值?
我控制了企业和年份的固定效应进行logit回归 xtset id year

sum 因变量是:
amount_whe~r |     19,206    .1315214    .3379785          0          1


但回归结果中观测值只有六千
xi:xtlogt y x i.year,fe结果如下

note: _I籍贯_21 omitted because of collinearity
note: multiple positive outcomes within groups encountered.
note: 1,630 groups (12,447 obs) dropped because of all positive or
      all negative outcomes.
note: _I籍贯_11 omitted because of no within-group variance.


Conditional fixed-effects logistic regression   Number of obs     =      6,678
Group variable: firmid                          Number of groups  =        616

                                                Obs per group:
                                                              min =          2
                                                              avg =       10.8
                                                              max =         13

                                                LR chi2(49)       =     651.60
Log likelihood  = -2597.3896                    Prob > chi2       =     0.0000



请问下怎么样解决固定效应logit回归中大量观测值损失呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-14 15:33:31
解释如下:你的因变量是01变量,以 firmid  分组之后,有1,630 组中因变量要么只有0,要么只有1,所以就把这些组删掉了。除非你以 firmid  为分组,每组中都有0/1两个值,才不会删除样本~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-16 02:41:18
席慧慧 发表于 2020-4-14 15:33
解释如下:你的因变量是01变量,以 firmid  分组之后,有1,630 组中因变量要么只有0,要么只有1,所以就把这 ...
我懂啦,谢谢您
还像问一下,这样大量样本丢失会对回归造成很严重的伤害吗~有没有什么方法处理呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-19 15:52:39
理论上,样本量多少是有影响的,样本是用来代表总体情况的,样本量越大越接近总体。但是实际上,运用几百个样本做回归的也不少呢,你的数据删除之后还有6000多,其实数据量已经不少啦,可以继续做的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群