4.3  模型可以导出更合理的度量方法
城市和区域经济学关注的一个核心问题是经济活动的集聚,有不少实证研究需要度量每个行业的集聚程度。早期的研究使用的度量方法多是临时现抓的(ad hoc),譬如在区域的水平上计算每个行业的赫芬达尔—赫希曼指数(Herfindahl-Hirschman Index),用于衡量集聚程度。可是这样的算法缺乏深入的思考,和集聚的理论没有关联,有不少缺点。打个比方说,一个岛国只有两个大小一样的岛屿,A和B;甲行业有三个企业,每个企业有1000个雇员,其中有两个企业坐落在岛A、一个在岛B;乙行业有3000个企业,每个企业有一个雇员,其中有2000个企业坐落在岛A、1000个在岛B。如果用传统的度量方法,简单地看从业人员的分布,这两个行业的集聚程度类似,都有三分之二的雇员在岛A。可是我们不难想象,甲行业的结果有可能是随机的,并不一定表明岛A有更适宜的条件;而乙行业就不同了,几乎可以肯定有某种原因导致更多的企业出现在岛A。Ellison和Glaeser (1999) 通过一个模型导出集聚的程度应该如何度量更合理,能够剔除类似于上面这个例子中企业规模的影响;他们用新发明的度量方法重新来看美国各个行业的集聚程度。这个方法在后来的实证研究中被广泛地采用(例如Rosenthal和Strange, 2001)。
种族隔离是多个社会科学领域长期关注的问题,城市和区域经济学者一直致力于居住隔离的研究。早在1980年代,社会科学研究中用过的各类度量隔离程度的方法已经不下二十种(Massey和Denton, 1988),几乎都是研究者临时拟定的,没有任何理论基础。Echenique和Fryer (2007) 提出了一个新的度量方法。他们采用了数学家常用的公理化的方式,首先给出了一个度量隔离程度的方法需要具备的三个特点:(1) 更频繁的同种族交往意味着隔离程度的增加;(2) 隔离程度只跟个人层面的同种族交往的比率有关而与城市的大小无关;(3) 每个人的隔离程度都和他所交往的人的隔离程度线性相关。作者接着通过模型推导证明了,这三个条件决定了一个唯一的隔离指数。他们考察这个新的指数与此前常用指数的相关程度,并用这个新指数研究学校里朋友关系网的种族隔离程度以及城市里种族间的居住隔离程度。
 
4.4  模型能指导回归分析中函数关系的设定
我们如果在实证研究中做回归分析,经常要做函数关系的假设:确定哪些变量应该包括在要估计的函数里、它们之间是什么样的函数关系。理论模型经常对函数关系的设定有指导意义。譬如Arzaghi和Henderson (2008),他们以纽约的麦迪逊大道为例来测量集聚效应。麦迪逊大道常被用作美国广告业的代名词,是个广告业公司林立的地方。因为信息对广告业至关重要,靠近同业的公司在这个行业想来应该特别有利,所以作者选择这个行业来研究。他们对一个地方(Census tract) 一段时间内新生的广告公司数目进行回归分析。右边变量包括该地点商业企业总和,以及0-250米、250-500米、500-750米、750-1000米、1000-1250米范围内的广告公司数量,用以估算整体和同业的集聚效应。除了这些右边变量之外,作者只用了一个控制变量,就是地租。这是因为,作者假定新公司的诞生是利润高的表现,而理论模型里的利润明显是受地租影响的,所以地租必须作为控制变量出现在要估计的函数里。其它要素价格当然也影响利润,可是那些价格不太可能在很小的范围内有差别,就没有必要控制了。事实上,Arzaghi和Henderson (2008) 这个研究的重要发现之一是集聚收益大部分反映在地租上而不是在工资里,对此前用工资函数度量集聚收益的通行做法提出了质疑。
Glaeser et al. (1992) 也是一个例子。他们对城市里各行业就业人数的长期增长做回归分析,看三个不同的城市增长理论哪一个更有解释力。右边变量里用了专业化、竞争度、多样化三个指标来检验三个理论的不同含义。可是除了初始年代的就业量还需要加哪些控制变量呢?作者们用了初始年代行业内的工资水平。这是因为,他们写了一个简单的模型,发现就业增长是生产率增长和工资增长的函数,而专业化、竞争度、多样化三个指标都是通过生产率影响就业的,所以就需要在回归中加入工资一类的控制变量。
值得指出的是,这两个例子里的回归方程式应该包括哪些控制变量,如果脱离开模型去做取舍,都不是很容易决断的。而一旦在模型的框架下去思考,就发现作者们的选择是理所当然的。
 
4.5  模型能帮助澄清因果关系的传导机制
这里要举的几个例子,都是着重于识别因果关系的文章。正如Holmes (2010)所说的,这类研究试图通过“自然实验”来构造工具变量,生成外生的扰动,解决内生性的问题,从而估计一个变量对另一个变量的因果效应。因果识别做得巧妙的文章,估计出的因果效应较可信,但是无论多么巧妙的工具变量,都难以告诉我们因果效应是通过什么渠道起的作用。讲清楚究竟有哪些可能的渠道,归根到底还是个理论问题,这就给模型的使用提供了机会。
Boustan (2010) 研究美国的“白人群飞”(white flight)问题。二战以后,美国(特别是北方的)城市里有大量的白人家庭搬到郊区去住,一种说法认为白人对少数族裔抱有偏见甚至存在歧视、不愿意和少数族裔住在一个街区,他们搬到郊区去主要是为了躲避少数族裔占比越来越高的城市中心区。Boustan (2010)想考察一下这样的说法站不站得住脚。她利用南方郡县的自然条件来推测迁出农业的黑人总量,然后根据历史上的移民走向来推算迁入每个北方城市的黑人数量,进而看这个外生扰动是否影响白人家庭向郊区的搬迁。作者写了一个简单的居住地选择模型,假设家庭的效用取决于城里的黑人比例、便利条件和房价。从效用函数就马上可以看出,黑人家庭的迁入不但可以通过种族偏好,也可以通过推高房价影响白人家庭的搬迁。正因为如此,Boustan (2010)用相当多的篇幅来探讨“白人群飞”是否跟房价的变化有关。这个例子告诉我们,哪怕是一个极简单的模型,也有助于我们认清可能存在的因果效应传导机制。
Greenstone et al. (2010) 也是一篇在因果关系识别方面有所创新的文章。像中国的地方ZF一样,美国的州县也常常从事招商引资的活动,有时甚至不惜巨额的补贴和税收减免来吸引大企业。首要原因当然是因为引来的企业直接创造就业和 (未来的) 税收,同时也是因为相信大企业的落户会对地方的其它企业有影响,带来所谓的“集聚溢出” (agglomeration spillovers) 效应。可是准确度量这个溢出效应的大小是相当困难的,主要是因为大企业可能会选择经济条件前景好的地方,所以该企业落户以后别的企业的良好表现可能是本来也会发生的。为了解决这个问题,Greenstone et al. (2010) 集中考察一些大型的“百万元级工厂” (“million dollar plants”), 其中每一个企业在选址期间都发生了多个地方争夺同一企业的现象。作者们就用争夺战中排名第二的地方作为对照组,跟这些大企业最终落户的地方对比来估算溢出效应。他们在进行数据分析之前,先用一个模型讲清落户的大企业会通过三种不同的渠道影响原有企业:一是增加原有企业的全要素生产率,即通常所说的知识溢出效应;二是推高用工成本;三是推高地价。后两者对原有企业的利润是负向的影响。正因为如此,看全要素生产率的变化是对溢出效应的直接检验。而看新企业数量的变化则是间接的、更严苛的检验;也就是说,如果大企业落户以后初创企业数量在增加,就意味着生产率方面的溢出效应大到足以弥补生产要素涨价的负向影响。依托于这样的模型,每一步的回归分析对应于哪一个机制的作用就可以表述得井井有条。
像这样的例子还有很多。 但凡一个以因果识别为重点的实证研究,都需要探讨因果效应的机制。用模型来把各种可能的机制说清楚,是常用的做法。实证研究人员写模型的过程,就是一个深入思考传导机制的过程。
 
4.6  模型能给估计出来的系数赋予经济学上的含义
用商品价格对商品特征进行回归的做法,在实证经济学里由来已久。直到Rosen (1974) 给出一个模型,从消费者和供应商双方的优化行为中导出价格和特征的均衡关系,才算给特征回归 (hedonic regression) 提供了一个严谨的理论基础。后来Rosen (1979)和他的学生Roback (1982)又用类似的分析手段解释城市特征的隐性价格,成为城市经济学里很有名的Rosen-Roback分析框架,被认为是整个学科的理论支柱之一(Glaeser,  2007)。Roback (1982)从空间均衡的两个基本条件出发,假设在没有城际迁移成本的情况下规模收益不变的厂商无论在何处都挣得零利润、偏好相同的工人无论住在哪里都有同样的效用,以此导出一组颇具启发意义的结果。她的一个结论可以表示如下:
 
其中p*s代表消费者对城市特征的边际支付意愿,y是房产消费量,p是单位房产价格,w是工资水平。譬如s可以是空气质量, dp/ds和dw/ds可以用城市水平上的回归估计出来,y可以直接从数据中算得,三个数值合在一起,就能算出人们愿意付多少钱使得空气质量提高一点。这么一个简单的模型,一下子让三个本来只有统计意义的估值有了经济学上的含义。Chay和Greenstone (2005)利用美国空气清洁法案造成的外生扰动,以断点回归的方法估计空气质量对房价(和工资)的影响。他们正是借助于Roback的模型结果,来理解他们得到的参数的经济学意义。
再以我自己参与过的一项研究为例 (Brueckner et al., 2017)。我们有中国很多城市土地出让的数据,里面有出让前规划的容积率限制、出让价格、以及一些其它的相关信息。我们完全可以做这样一个题目:容积率影响地价吗?然后做如下的回归分析:
 
γ是地价,FAR是容积率(floor-to-area ratio),是一组控制变量。我们当然可以做一些因果关系识别方面的努力,譬如把临近的地块归入同一个组群并控制组群的固定效应,即通过对比组群内的地块来降低地块特征缺失可能造成的估计偏误。实际上我们确实做了这样的回归分析,但是在报告回归结果之前先写了一个模型。用S*代表没有管制情况下开发商自定的最优容积率,Sbar代表ZF规定的容积率,那么S*/Sbar可以看作是管制严苛程度的指标,这个比率越高则管制得越严。因为现实中只有管制的情况存在,所以这个比率是无法观察到的。我们用一个简单的模型证明了,S*/Sbar这个比率越高,地价对容积率的弹性就越大。(这个关系很好理解,管制越严,放松一点管制对开发商的利润影响越大,他们就愿意出更高的价钱买地。)也就是说,地价对容积率的弹性也可以用来衡量管制的严苛程度,而依照方程(2)估计出来的系数β正是地价对容积率的弹性。如果我们不写这个模型,β能告诉我们容积率如何影响地价,只是一个有统计学意义的系数;而有了这个模型,同样的β就可以解释为管制的严苛程度,变成一个有经济学意义的概念了。也是因为这个模型,让一个原本只有研究土地或研究中国的几个小领域的学者会关心的回归分析,变成了关于管制严苛程度的这样一个有跨领域意义的题目。
作为这一节的小结,我在这里想强调几点。第一,虽然我在讲解模型的每一个作用时用了不同的例子,这并不意味着一个模型在一篇论文里只能起到一个作用。事实上,一个模型经常在一项实证研究里起到多个作用。譬如说,一个模型完全有可能既有助于阐述一项研究的重要性,又能对回归方程的设定起指导作用。
第二,模型越简单越好。非结构性分析的目的不是估计模型的参数,使用模型总是为了讲清某个道理,而模型的建立就必须为这个目标服务。一般来说,能用简单的模型讲清楚的道理,就不应该用复杂的模型;能用一期的、静态的模型演示的变量关系,就不需要多期的、动态的模型;能用两要素的生产函数演示的替代关系,就没必要用多要素的模型。当然有时候我们需要检查由简化的模型导出的结果是否具有一般性,即便在这种时候,有很多学者也会选择在论文正文中只给出简单的模型,而把拓展部分放在附录里,以便减轻读者的负担。
第三,模型不但能帮助我们加深对某些问题的理解,更能帮助我们问出截然不同的问题。对于做实证研究的学者来说,写模型的过程就是从经济学的视角对研究对象加深理解的过程。我们一旦开始尝试从模型的角度思考问题,就必须直面每个相关决策者的偏好和约束,就必须去探索各种均衡条件下的结果,就必须要做到逻辑上的自洽。最终即便不需要把一个正式的模型写进论文,这样的思维练习也有助于增强研究的深度和严谨性。我曾经看到年轻同事的工作论文里对机制的讨论是不符合经济学逻辑的、甚至是自相矛盾的,这跟平时经常脱离、模型天马行空讨论问题的习惯应该是有关的。但愿上面这些例子足以说明,如果我们总是做不用模型的实证研究,那么我们所能提出的问题也是有限的。
5. 模型与结构性的实证研究
5.1  结构性的回归分析
结构性的回归分析总是要估计模型的参数,从定义上来说,这类实证研究一定会用到模型。这类研究估计的往往是“深度参数”,即那些相对稳定的、不随环境和时间变化的、决定个人和企业行为的参数,譬如消费者效用函数里的参数、企业生产函数里的参数、消费者的时间贴现因子、风险偏好系数等等。估计这些参数,往往是为了做反事实分析(counterfactual analysis),假设一个与事实相反的状态(某个事件发生了或没有发生、某个政策实施了或废止了),看看模型推测的结果是什么样的,与观察到的事实做比较,从而得出事件或政策的影响。
正是因为可以做反事实分析,结构性的回归能够帮助我们量化尚未发生的事件或政策的影响。相对于简化型估计,这是结构性估计的优势之一。举个例子来说,我们用双重差分或者随机实验的办法,估计了每一条新的公共汽车线路能减少的开私家车上班的人数。假设我们在因果识别方面做得无懈可击,得到的参数非常有说服力,那么再开通一条公汽线路会有何种影响,我们就比较有把握。可是如果我们要开通一条全新的地铁线路呢?从研究已有的公汽线路的作用得到的结果能用吗?毕竟地铁的速度、舒适程度、停靠站频率都跟公汽有很大差别。这种情况下就能显示出结构性回归的优势了,我们用一个实例来说明。
1970年代初,旧金山地区在建设一个全新的地铁系统(Bay Area Rapid Transit,BART)。政策制定者们自然想知道建成以后会有多少人上下班改乘地铁。官方雇佣的咨询机构用宏观的通勤流量做了估算,预计BART开通之后会分流15%的上下班出行人数。加州大学伯克利分校的经济学教授Daniel McFadden也研究了这个问题。他假设每个人有这样一个效用函数:
 
一位具有个人特征Zn的通勤人员如果选择了具有特征Xi 的通勤模式i,那么他的效用包括一个确定的部分X'iβ+Z'nγ 和一个随机的部分εin。这个随机的部分可以看作是研究人员观测不到的个人特征和通勤方式特征的影响。如果我们假定εin服从IID的Gumbel (type I extreme value)分布,而且每个人都追求效用最大化,那么一个人选择通勤方式的概率有如下的解析表达式:
 
这样就可以通过最大似然法来估计效用函数的参数和。McFadden和他的助手对700多位湾区的通勤人员做了问卷调查,并用所得的数据估计出效用函数。因为每个通勤方式都被看作多个特征的组合(包括等车时间、乘车时间、换乘次数、等等),即便还没开通的地铁也可以被看作这些特征的组合,只不过有不同的特征值而已,可以通过效用函数计算它能带来的效用。用这样的方法,McFadden的团队预测将会有6.3%的通勤人员乘坐BART。地铁开通后调查发现的实际比例是多少呢?6.2%。 方程(3)和(4)便是我们今天熟知的Logit模型,它不但一直是运输经济学领域常用的模型,而且被推广到很多其它的经济学领域(Small et al., 2005; Train, 2009)。