Polluting Industries and Agricultural Productivity: Evidence from Mining in Ghana. Economic Journal. 2016, 126: 1980-2011.
Fernando M. Aragon and Juan P. Rud
欠发达地区在发展现代工业时通常只考虑其为当地带来的经济利益,而忽略了现代工业所产生的负外部性对当地传统行业的不利影响。本文以加纳在世纪之交前后采金行业的高速发展为例,估计出金矿开采所产生的污染导致矿区周边农业生产率下降40%。若以货币价值衡量,农业行业的经济损失甚至可能高于采金行业创造的直接利润。
加纳的采金行业从上世纪90年代开始快速发展。主要的矿区大多规模较大并使用现代的采掘设备。采矿产生的主要污染物包括重型机械的燃烧排放,以及采掘加工过程中生成的氰化物、重金属污染物和酸性矿水。同时,新兴矿区大多位于土壤肥沃的农业生产区。由于当地农业生产用水主要依赖于自然降水,采矿导致的地表水污染对农作物的影响有限。而以氮氧化物及其二次污染物为代表的空气污染物是造成矿区周边农业生产率下降的主要原因。
基于经济学理论,作者建立了一个具有“消费-生产二重性”的农户模型(详见第10和11期【经典文献】)。在该模型中,作者假设不同农户与生产要素市场的连接能力是不同的。这一假设刻画了当地生产要素市场的不完全性(imperfect input markets)。基于该模型,作者推论,采金行业的发展可以从两个方面影响矿区周边的农业生产:一是从行业层面影响农业生产的要素投入,二是通过污染物对作物健康的影响降低农业生产率。作者同时指出,农户间本身无法被观测到的生产率差异会影响实证模型估计的一致性(consistency),而理论模型的另一个推论为解决这一问题提供了思路:利用农户的要素禀赋作为工具变量处理潜在的内生性问题。
作者所使用的实证模型属于“二阶差分”(difference-in-difference)的框架之下。但有别于一般的“二阶差分”估计,本文为因果识别(identification)提供动力的数据变化(variation)来自于金矿的产量,即提供外生变异的变量是连续而非离散的(即continuous treatment)。作者以三种不同的估计方法处理潜在的内生性问题:一是通过引入描述农户特征的控制变量,二是直接以土地和劳动力禀赋变量作为工具变量得到点估计(point estimate),三是使用农户规模等不完美工具变量(imperfect IV)进行范围识别(partial identification)。使用这三种方法得到的估计结果是一致的。
基于进一步的回归分析,作者指出,污染对农业生产率的影响主要来自于对作物健康的直接损害,而非通过影响种植者的劳动产出率实现。离金矿越近,污染的负面影响越大;当距离超过20公里后,负面影响在统计意义不再具有显著性。需要指出的是,由于没有对具体污染物的直接观测,本文在实证环节实质是使用了金矿产量作为污染的代理变量(proxy)。为了验证基于金矿产量变化的估计结果确实反映了污染物造成的负面影响,作者补充了一个基于卫星图像的二氧化氮截面数据,以证明该污染物分布与各个金矿在空间上的强相关性。
贝叶斯工具变量模型的建立及其在观察性研究中的应用
向春
【摘要】:研究背景: 观察性研究可依托已有的疾病监测平台和医疗资源,在样本量、研究时长、成本等方面均具有优势,同时观察性研究未对研究对象进行严格的筛选,研究群体更接近真实情况,使研究结果更具有实际指导意义。但观察性研究未对研究对象进行随机化,从而容易受到多种混杂因素的影响。传统的回归、分层、多因素分析及新近的倾向性评分法、边缘结构模型等方法都仅能均衡已测量混杂因素引起的偏倚,而工具变量分析则是一种均衡未知混杂因素引起偏倚的重要方法。基于贝叶斯理论的统计学方法能够将先验信息与样本信息相结合进行统计推断,先验信息来源于对既往研究结果的提炼,因而加强了针对同一主题研究间的联系,实现了对既往研究结果的继承与创新。贝叶斯理论与工具变量分析方法相结合能够同时发挥两种方法的优点,但现有研究中关于贝叶斯工具变量分析方法的研究极少,探索贝叶斯工具变量分析在观察性研究中的可行性和适用条件不仅能够完善工具变量分析理论体系,同时也有重要的实用价值。 研究目的: 本研究针对传统工具变量分析方法无法利用既往研究结果和对估计参数分布有着严格假定的不足,构建基于贝叶斯理论的工具变量分析模型,并对构建模型的分析结果进行验证和评价,探索贝叶斯工具变量分析在观察性研究中的可行性和适用条件,并将所建立的模型应用到真实的调查研究中,检验效果,推广应用。 研究方法: 通过对国内外工具变量分析方法基本理论及应用方面的相关文献进行系统回顾,根据暴露/处理和结局变量的不同类型选择最常用的工具变量分析方法作为本研究中的传统工具变量分析方法。以传统工具变量分析方法为模型基础,设定估计参数的先验分布及初始值,采用MCMC抽样的方法,获得估计参数的后验分布,建立贝叶斯工具变量分析模型。在不同条件下全面比较传统工具变量分析方法和贝叶斯工具变量分析方法估计结果的准确性和精确性,得到针对不同数据类型的最优估计方法。将得到的最优估计方法应用到卫生服务调查实例研究中,用以均衡未测量混杂因素引起的偏倚。 研究结果: 研究模拟了暴露/处理和结局变量均为连续型变量、暴露/处理和结局变量均为二分类变量和暴露/处理为连续型、结局变量为二分类变量三种流行病学研究中最常见的数据类型,并在不同暴露/处理和结局变量相关关系、不同工具变量强度、不同混杂因素强度下比较了传统和贝叶斯工具变量分析方法的偏倚、均方根误差、置信区间宽度及覆盖率。 当遗漏了混杂因素在模型之外时,继续使用传统的方法来估计暴露/处理的效应值,估计结果将发生极大的偏倚,而工具变量分析能有效的减小偏倚。针对不同暴露/处理和结局变量的类型,基于不同模型的工具变量分析方法的结果差异很大。具体来讲,当暴露/处理和结局变量均为连续型变量时,两阶段最小二乘法是所有估计方法中,偏倚最小和最稳定的估计方法;当暴露/处理和结局变量均为二分类变量时,线性预测值替换模型是所有方法中偏倚最小、结果最稳定的;当暴露/处理为连续型、结局变量为二分类变量时,线性残差纳入模型是偏倚最小的,也是最稳定的。当以合适的模型为基础时,传统和贝叶斯工具变量分析结果较为接近,二者均不受暴露/处理和结局变量相关关系的影响,但受工具变量强度和遗漏混杂因素强度的影响,工具变量强度越强结果偏倚越小、置信区间越窄,遗漏混杂因素越强结果偏倚越大。贝叶斯工具变量分析往往置信区间略宽而置信区间覆盖率略高,在强工具变量条件下,贝叶斯工变量分析方法表现略优于传统方法。 实例分析中单因素工具变量分析与传统多因素分析结果较为接近,验证了构建的模型对遗漏混杂因素的均衡作用,多因素工具变量分析证实了体育锻炼对老年人健康的促进作用。 研究结论: 根据流行病学研究中暴露/处理和结局变量数据类型的不同,选择合适的工具变量分析方法能有有效的减小偏倚。以合适的模型为基础,贝叶斯工具变量分析方法适用于流行病学研究中的各种条件,在强工具变量条件下,贝叶斯工具变量分析方法略优于传统工具变量分析方法。贝叶斯工具变量分析方法在小样本研究和不完美工具变量条件下的表现尚需要进一步研究。 体育锻炼对上海市老年人群的身心健康有着良好的促进作用,后续的研究应当采用更全面的健康量表并充分考虑锻炼频率、时间和强度的影响,从而制定科学的锻炼策略。
【学位授予单位】:第二军医大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:R195