内生性问题的处理,遵循几个步骤,第一,模型确实存在内生性问题(不然就是无病用药)。第二,确认模型存在内生性后,从现有文献已有的成果找到适合的工具变量,模仿大佬的话术,第一步从理论上讲,(1)选用的工具变量与内生变量存在相关性;(2)尚未有证据表明选取的工具变量与随机扰动项(随机扰动项存在影响Y的其他因素/影响Y)存在相关性。第二步,从统计分析上讲,(1)是否存在内生性检验(2)不存在弱工具变量 (3)不存在过度识别检验。这是回答了您,第一个问题,如何找IV。第二个问题,您说解释变量为虚拟变量时是否能用工具变量法的问题,首先,您要理解,工具变量的用处在于得到一个干净的净效应。比如谢德仁教授发表在管理世界的文章《控股股东股权质押是潜在的地雷吗》(2016(05)),谢教授的解释变量是虚拟变量(pld_dum,t年末控股股东是否存在股权质押,存在1,否则0)。其中在解决遗漏变量偏差的内生性问题时,谢教授认为行业平均质押水平和省份的平均质押水平会影响控股股东是否存在股权质押行为,所以,谢教授采用了这两个工具变量,利用2sls解决内生性问题。(引用连玉君教授的话术:两阶段最小二乘估计法 (2SLS) 可以将多个工具变量整合为一个最优的工具变量,这样就可以应用到 IV 估计式中)。因我的学术水平有限,以上是一些浅显的个人见解,希望对您有帮助,若是讲得不正确,还望您谅解。学术大佬们,希望有不对的,可能得到您的指导,并请求轻喷,感谢,祝好。欢迎交流3209753548