现在的教科书讲计量基本原理,特别是高斯马尔可夫定理时,从一元回归引入是对的。
但在实际应用时,只有一个解释变量的回归,在绝大多数情况下,都有内生性问题,因此才需要从一元拓展到多元。即使多元回归,仍然存在内生性问题。
说句抬杠或者不严谨的话,在基于中国数据的研究中,可能除了性别外,其他变量都多多少少存在内生性问题,只不过有的模型设置下,遗漏变量有的是可观测的,有的是客观不可测,有的是不可观不可测。
另外,核心解释变量和控制变量的地位作用也不一样。如果educ是核心解释变量,就一定存在内生性;而如果educ做控制变量,就未必存在内生性,因为控制变量是保证核心解释变量和随机误差项无关这个条件,而控制变量和随机误差项相不相关并不重要;这就是控制变量的作用。