实证过程:被解释变量+解释变量
截面数据回归(pool estimation)==1被解释变量--房价;2解释变量---移民占比和移民占比变化;3逐步加入控制变量;
解决遗漏变量问题--同时导致移民变化和房价变化的因素(解决办法--差分,去除城市固定效应)--被解释变量为房价增长率;跨期问题
重点解决核心解释变量的问题:
影响机制1--移民占比通过影响需求影响房价,如果移民占比反映了需求机制,当控制各种需求因素后,移民比重不再单独影响房价;(验证得出移民的确反映需求)(解决办法---适用城市移民占比代替移民占比)
异质性分析---移民结构的影响--城市间移民与普通移民之间存在差异,城市间移民受到制度约束少,但购房概率大,对房价影响大;城乡间移民受到户籍制度约束大,购房概率小,对房价影响小;
异质性分析--移民收入水平的差异性,移民收入水平越高,移民带来的住房需求相对更大,住房价格和房价收入比更高;移民收入水平越低,移民带来的住房需求相对更小,住房价格更小;(解决办法,移民占比*移民平均收入水平交互项)
预期的作用--解决办法--用2005年移民占比替换2000年移民占比,如果该指标仍然显著,说明及时控制了由移民带来的实际住房需求之后,市场上仍然在根据过去的信息来购房,包含了实际需求之外的预期机制;意味着移民占比半酣了潜在购房这对移民推动房价上涨的预期;
移民占比变化的信息里面,包含了移民推动房价上升的预期;
联立性偏误问题===用解释变量的滞后值解释被解释变量,本身一定程度上缓解了该问题;
内生性问题:
1移民增加了住房需求,在供给缺乏弹性条件下,移民会推高房价(+);2高房价意味着生活成本,从而抑制移民的到来(——);两者间可能存在双向因果关系,况且两者间的影响方向是相反的,容易造成OLS回归低估;(解决办法---工具变量--1974年的1月份的气温);
相关性检验:理论上,气温只能通过移民影响房价,而自身不能直接影响房价(与x高度相关,与y无关)
有效性检验:气温与其他控制变量不存在高度共线性(打掉通过其他路径的可能性)
1打掉经济活动视角(投资);2打掉通过地理位置的可能性;3打掉通过影响投资和产业布局影响房价的可能性;(1阶段回归结果)
2两阶段回归(2SLS)