非线性2SLS(Two-Stage Least Squares)方法在Logistic回归中的应用确实是一个比较复杂的主题,尤其是在管理科学和经济学文献中被提及时。你提到的文章使用了非线性拟合作为工具变量的2SLS回归来处理内生性问题,具体操作步骤如下:
### 第一阶段:工具变量的选择与Logistic回归
- **选择工具变量**:文章选择了两个工具变量(是否央企和是否有中央政府更替),这两个变量应该满足相关性和排他性的条件。即它们必须与Promotion有关系但不直接与CEO薪酬(Compensation)有关,以此来保证因果识别的有效性。
- **Logistic回归**:在这个阶段,以Promotion为因变量,使用公司业绩、财务特征、CEO特征以及上述两个工具变量作为自变量进行Logistic回归。Logistic回归适用于处理二分类结果的预测问题,在这里用来估计Promotion的概率。
### 第二阶段:2SLS回归
- **拟合值的使用**:第一阶段得到的是Promotion关于各自变量的预测概率,这个预测概率被视为Promotion的一个非线性“拟合”值。在第二阶段,将这个预测值用作工具变量(而不是原始的Promotion)进行2SLS回归。
- **执行2SLS**:以CEO薪酬Compensation为因变量,使用第一阶段得到的Promotion预测值作为替代Promotion本身的新自变量,同时加入交互项和其他控制变量。这样做的目的是为了减少Promotion内生性带来的偏差问题,因为在理想情况下,工具变量(即Promotion的预测概率)应该只通过影响Promotion来间接影响Compensation。
### 原理
这种方法背后的主要原理是使用工具变量回归来解决潜在的内生性问题。在传统的2SLS框架中,我们假设自变量与误差项不相关;但在实际情况中(如Promotion可能受到未观测到的因素影响),这种假设往往不能成立。通过引入工具变量,并利用其与自变量的相关性和与结果无关的特性,非线性2SLS试图提供一个更准确、无偏的因果关系估计。
这种方法在实证研究中的应用要求研究人员对理论模型有深刻的理解,确保选择的工具变量既相关又排他,同时能够正确地执行和解释多阶段回归分析。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用