方文龙 发表于 2021-1-17 10:29 
您好,结果如下
本人才疏学浅,以下仅为个人观点,不一定对啊,仅供参考。
F=(ESS/K)/(RSS/(n-k-1))
ESS表示
回归平方和(Explained Sum of Squares)是y的估计值-y的平均值的离差平方和
RSS表示残差平方和(Reidual Sum of Square)
平方和/自由度=均方,回归均方MSR=RSS / (k-1)、误差均方MSR=RSS /(n-k-1)
如果F或其置信区间等于0的话,可能是ESS非常小或RSS非常大导致的,即要么y的估计值十分接近y的平均值,此时为过度拟合状态,该估计可舍弃;要么估计精度很差使得残差非常大,此时估计结果同样可舍弃。
综上,三门槛的结果有问题,舍弃即可)。在结果选用时,可解释“因三门槛模型所得F值及其置信区间均为0,该结果为无效估计,舍弃,选择双门槛模型。”
如果一定还想再试试三门槛模型,那就只能对数据做缩尾处理、改变指标计算方法或者增减变量,再看看结果的情况。
本质上,门槛模型回归应该依然使用的是OLS估计法,如果你有(0,1)被解释变量,那应该使用MLE估计法,根据分布选择Logit还是Probit。使用OLS估计(0,1)被解释变量,结果就是LPM模型。
从开发门槛模型的初衷或者现阶段技术和程序水平而言,仍旧主要针对数值型被解释变量,似乎并没有针对(0,1)被解释变量;故而以门槛模型估计(0,1)被解释变量会带来一些意想不到的不良结果。
Paul Allison发文指出,Logit (Probit同理)优于 LPM的主要原因包括:(1)LPM 可能会产生无效的概率预测值,而 Logit 不会。由于 LPM 的被解释变量是 1 和 0,在进行线性回归时,最终得到的概率预测值可能大于 1 或小于 0,然而这是无效的概率预测值。(2)第二,对于二分类的情况,Logit 的系数及估计值将比 LPM 更稳定;LPM 不是真实的产生二分结果的机制。(3)第三,Logit 模型受解释变量间相互作用影响小,参数更加稳定。
综上, 不建议将数值型的被解释变量转化为(0,1)定性变量,以来会导致信息量的巨大损失,二来在计量上不好估计。
如果你的数据确定是平衡面板,建议使用
王永群的xthreg.ado,这个经过Stata认证过,意想不到的bug会少一些。注意,因为我没有探索过的原因,在相同条件下,王永群的xthreg.ado和连玉君的xtthres.ado的估计结果可能会有差异。