全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2896 1
2018-11-01
640.webp (1).jpg 实证研究中的语言逻辑与数理逻辑

陈硕

摘 要: 文 章 作 者 是 Designing Social Inquiry: Scientific Inference in Qualitative Research 的中文简体版译者。作者在文章中试图对学者在实证研究中经常遇到的 语言逻辑和数理逻辑这两个概念进行初步的讨论。这两个概念并不是直接来自 于原书内容,而是文章作者在学习及翻译过程中获得的最重要启发。语言逻辑 往往采用文字表达方式阐述因果关系,而数理逻辑则依赖于更加严谨的公式推 导或研究设计。语言逻辑同时为没有受过社会科学训练的普通公众及专业学者 所使用,前者更多依赖于常识及经验,在多数情况下无法准确判断因果关系; 后者则构成日常学术交流的主要组成部分。对于后者使用的语言逻辑,文章认 为通过因果思维或研究设计将其转化为数理逻辑是决定实证研究者研究水平的重要因素。

关键词: 社会科学 因果推论 语言逻辑 数理逻辑


作为 Designing Social Inquiry: Scientific Inference in Qualitative Research 的中文简 体版译者,我非常荣幸能够在这本书出版 20 周年之际将她介绍给国内的读者。 该书 ( 以三位作者姓氏首字母及出版时间构成的简称 KKV1994 也许在学界更具 知名度) 由普林斯顿大学出版社在 1994 年出版。KKV1994 在出版后就成为众 多欧美高校经济学、政治科学及社会学等学科本科及研究生方法课程的指定参 考书,也是当今最具影响力的社会科学方法论著作。这本书是我在香港科技大 学社会科学部硕士阶段的必修课 《社会科学方法论》 的指定教材,也是我读的 第一本方法论著作,对此我感到非常幸运。就内容来说,三位作者加里·金 ( Gary King) 、罗伯特·基欧汉 ( Robert Keohane) 和悉尼·维巴 ( Sidney Verba) 在第一章便明确指出该书的写作目标是 “向读者系统地介绍如何在社会科学领 域开展研究”。而对于研究实施的两个方法: 定量传统及定性传统,作者认为它们 “之间的差别仅仅是风格和方法论上的不同......所依赖的逻辑都是相同的”, “即怎样提出研究问题、开展学术研究并进行有效的描述及因果推论”。不论采用何种方法,评价其研究过程是否科学的主要标准都要看其是否满足: 1 以推论为研究目的; 2 采用公开的研究程序; 3结论是不确定的; 4 研究的内容是关于方法的。

围绕上述这些观点,本书剩余部分从两个方向展开: 第一个方向将研究过程分为描述性推论 ( 第 2 章) 及因果性推论 ( 第 3 章) 两个步骤,其中前者是 研究的起点并构成后者的基础。在作者看来,这两个步骤均存在推论的过程: 描述性推论涉及如何由样本推及整体,而因果推论则试图发现不同因素间真实 的因果关系。本书第 2 及第 3 章提供了这两个推论的定义及推论规则。第二个 方向为主题研究,作者向读者提供处理研究中经常遇到的特定问题的对策。这 些问题包括: 如何确定观测对象 ( 第 4 章) 、如何增加观察值数量 ( 第 6 章) 及 如何避免某些特定问题 ( 测量误差、遗漏变量、无关变量及内生性等,见第 5 章) 。就如何确定观察对象来说,作者指出在大多数定性研究中随机选择样本方 法具有一定局限性,在这种情况下有目的地选择样本也许更为可取。围绕有目 的取样,作者提供了 5 种可供读者参考的操作方案。就研究中需要避免的问题来说,测量误差、遗漏变量、无关变量及内生性问题要么导致推论效率降低, 要么导致更严重的有偏推论。这些问题在定量研究中尤为突出,需要读者重视。 辅之以具体的例子,作者阐述这些问题造成的上述后果并提供了对策。而最后 一章讨论的增加样本数量则是定量及定性学者面临的共同问题,如何在现有限 制下尽量拓展样本数以提高推论效率的方法会在这一章给出。

我把这本书的中译书名定为 《社会科学中的研究设计》 的目的也正是为了 消除定量及定性研究方法间的隔阂。不管是定量还是定性背景,我确信每位读 者都可以从这本书中汲取所需的养分。对我而言,本书的学习及翻译过程带给 我最重要的财富是让我具备了用因果思维的能力,特别是语言逻辑和实证逻辑 之间的切换。语言逻辑主要采用文字或者口语表达出来的因果效用,主要由两 个群体所使用: 没有受过社会科学方法论训练过的公众依据习惯、阅历及常识 判断出来的描述及因果推论以及受过专业训练的学者在学术活动时采用的交流 方式。这些学术活动即包括学者日常的交流、学术研讨会上的提问与质疑,也 包括学术期刊审稿意见用语; 而数理逻辑则是受过训练的定量研究者利用实证 工具,包括公式表达或研究设计对语言逻辑进行严谨表述及应对过程。这两个 逻辑正是原书作者整合定性和定量研究思路的努力给我带来的直接启发。我认 为语言逻辑和数理逻辑贯穿了实证学者研究生涯的全部过程。而快速地实现这两种逻辑间的转化不光需要大量的学术阅读,更需要有针对性的训练。

在本文的以下部分,我将首先阐述常识在很多情况下对判断因果效用帮助不大; 其次,在更多情况下,没有常识能够帮助研究者界定出因果关系。此时, 对因果效用的识别,特别是大小的考察需要依赖数理逻辑。我将结合测量偏误、 互为因果及遗漏变量这三个研究者经常遇到的问题加以阐述。众所周知,这三 个问题将导致内生性问题: 最小二乘估计 ( OLS) 估计结果不一致。不一致的 结果是最严重的估计偏差问题: 偏差并不会随着样本量趋于无穷大而消失。在 这种情况下,研究者无法根据 OLS 估计系数并结合偏差方向来推测真实效应, 从中得到的政策含义也将具有误导性; 最后,我会指出基于因果推论思维的语 言逻辑是构成学者学术生活的重要组成部分。在这种情况下,实现两种逻辑间 的转化是决定实证研究者研究水平的重要因素。对于该结论,我将结合自己研 究中遇到的一个具体事例加以阐述。

一、常识并不可靠

基于语言逻辑的常识、习惯或阅历的确能够帮助我们判断一部分关系中的 因果方向,但有些情况下它们并不可靠。一个典型例子是财富和幸福的关系。 常识往往认为财富能够带来幸福。实际上,二者间的关系是受到诸多个体特质 的同时影响: 勤劳、人格、健康状况、自控及自信等。正是这些没有被常识所 考虑的因素同时驱动着个体获得财富并维持幸福感 ( Diener & Fujita,1995) 。将 该遗漏变量纳入考察范围之后,现有研究已经发现在满足基本需要后的财富增长 带来的幸福感是微乎其微的 ( Roberts,2011) 。这个例子就说明,常识要不就是在诉 说一个根本不存在因果效应的关系,要不就是极大高估了金钱对幸福的作用。

二、没有常识可以依靠

在其他绝大多数情况下,对特定关系是否存在真实因果效应可能完全没有 常识可依靠的。测量偏误及互为因果问题就是这样的例子。语言逻辑无法帮助 研究者廓清因果效应。此时,基于公式推导的数理逻辑能够展示 OLS 估计系数 存在的偏差情况。

测量偏误简单说来就是由于某些原因造成变量的测量值和真实值之间存在 差异。造成偏误的原因有很多,比如测量技术局限、原始资料局限、数据录入 人员的不小心或受访人的故意虚报。当存在这个问题时,如何判断对因果推论 的影响及寻找相应的解决手段就至关重要了。如果测量偏误随机存在的,比如 数据录入人员的粗心,我们一般将这种测量误差称之为经典测量误差,它将导 致该变量作用的低估。这里我们用收入对消费影响的例子加以演示。假设二者 间关系的 OLS 表达式如下:

640.webp (2).jpg

其中 y_1 是个体的消费,而 x^*_1i 是收入,u_i (1)是其他可能影响消费水平但是没有被模型捕获的因素,假设是随机分布的。为了简单,我们也假设收入一消费关系不存在其他影响估计结果一致性的问题,此时:

640.webp (3).jpg

其中 x1 是收入的真实值,e1 是真实值和录入值之间的差异,也就是测量偏 误。在录入原始问卷过程中,由于数据录入人员的粗心导致一些收入观察值的 录入错误。如果我们认为这种不小心的分布是随机的。那么,真实值和录入值 就均独立于 e1 ,写作:

640.webp (4).jpg

640.webp (5).jpg

640.webp (6).jpg

640.webp (7).jpg

另外一个无法依赖于常识判断估计结果偏差方向的例子是同时性问题。同 时性问题指的是解释变量和被解释变量互相影响,也被称之为互为因果问题。 该问题的一个典型例子是警察或者司法支出与犯罪之间的关系: 一方面,警察 的增加可以增加威慑、提高破案时间进而减少犯罪 ( Levitt,1997,2002) 。此 时,二者之间是负向相关。另一方面,一个地区犯罪率的增加也会导致政府招 募更多的警察及提高司法支出。此时,二者之间呈现出正向关系。虽然从逻辑 上两个因果方向都能自圆其说,但其背后的政策取向截然不同。如果是前者, 降低犯罪的有效应对措施就是增加警察及司法支出; 后者则意味着警察和司法 支出的增加成了犯罪增加的结果,而非原因。造成这个地区犯罪猖獗的根源可 能是不平等、社会福利、受教育水平及外来人口等深层次因素。此时政府一味 提高司法支出不仅不会导致犯罪的下降而且造成了公共财政资金利用的低效。

那么互为因果问题的存在为什么会导致 OLS 估计结果不一致呢? 回答这个 问题同样需要借助数理逻辑。司法支出和犯罪之间相互影响关系可以写作如下 OLS 方程组:

640.webp (8).jpg

假设 y1 是犯罪率,y2 是司法支出,z1 是影响犯罪率的其他因素,而 z2 是影 响司法支出的其他因素。u1 和 u2 均符合 OLS 的基本假设。此时有:

640.webp (9).jpg

640.webp (10).jpg

我们知道一致地估计司法支出对犯罪的作用需要的假设是 y2 和 u1 相互独立, 即 Cov ( y2 ,u1 ) = 0 ( 可参见: Wooldridge,2012) 。但除非 α2 = 0,二者之间无法 实现独立。而 α2 = 0 恰恰意味着犯罪并不影响司法支出: 互为因果不存在。

从研究设计上,互为因果问题是最为棘手的内生性问题。目前较为流行的 处理方式也是工具变量方法。我在 2012 年发表在 《经济学 ( 季刊) 》 上的论文 《转型期中国的犯罪治理政策: 堵还是疏?》 中试图实证检验中国司法支出的效 率。由于上文提到的司法支出和犯罪之间相互影响,我在文中使用省政法委书 记党龄作为司法支出的工具: 政治资历和获得的资源成正比,同时犯罪率不会 反向影响其政治资历。基于工具变量方法,该文发现司法支出对犯罪率没有显著影响。相比之下,不断增长的犯罪率很大程度上是转型期多种社会经济特征所致。此外,在一些情况下虽然常识可以判断因果方向但并不能告诉方向的大小。

科学的严谨性促使研究者在方向的基础上进一步估计出作用大小,后者在社会 科学中尤为重要。实现对大小的估计只能依赖于数理逻辑。以下将以教育回报 为例阐述该观点。每个人都知道教育对个体收入的回报为正,但经验无法回答 每增加一年教育时限到底会增加百分之多少的收入。可能很多人不理解社会科 学家对小数点后几位数字的大小争论不休的意义何在。设想一下如果事关数以 千亿元的教育支出,小数点后面数字就不再那么无关紧要的。对教育回报大小 的估计是劳动经济学数十年来关注的经典研究问题之一,该学科为了回答该问 题进行的研究设计及方法论上的创新也极大地推动了其他社会科学领域的发展。

对教育回报作用识别遇到的最棘手问题是遗漏变量,此时遗漏的这个变量 便是能力。一般来说,高能力个体同时具有较长的教育年限及较高的收入。那 么观察到的教育作用就在一定程度上提取了能力的作用,如果忽视该变量将导 致对教育程度作用的高估。显而易见,基于高估的系数制定的教育支出预算必 然导致巨大的公共财政浪费。在能力变量的干扰下,即使没有社会科学训练的 人也不难理解为何教育程度会被高估。但语言逻辑表达出来的高估只有通过数 理逻辑展示出来才能在更一般的意义上理解遗漏变量问题对因果推论的影响。 我们假设教育和收入关系的 OLS 表达式如下:

640.webp (11).jpg

640.webp (12).jpg

640.webp (13).jpg


附件列表
640.webp (16).jpg

原图尺寸 116.87 KB

640.webp (16).jpg

640.webp (15).jpg

原图尺寸 68.46 KB

640.webp (15).jpg

640.webp (14).jpg

原图尺寸 206.13 KB

640.webp (14).jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-6-14 14:56:31
看看看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群