全部版块 我的主页
论坛 经济学论坛 三区 微观经济学 经济金融数学专区
3037 1
2008-07-09
陈力恒
二零零八年七月九日
凡模型皆错,然有些有用
- George Box
   在那细雨朦胧烟雾弥漫的夜里,你深爱的情人跟你说他想跟你分手。虽然天没闪电,但你心如雷劈。你不服。你追问他。他说:「我今天的离去是为了你的将来。」你可甘心?他说:「你是好人但我不可跟你在一起。」你可甘心?他说:「我们前世是冤家所以今世多争吵。」你可甘心?日常生活常遇到因果,有些看似想 当然,有些看似无关联。本文提倡的统计因果是解释世界的可靠有用工具。统计因果,即运用统计方法研究事件的关系,透过统计分析关系的强弱,我们可以清楚知道可靠程度。下文先述世间含糊的因果理论,再探讨现代科学所依赖的因果:统计因果。简述统计因果的三个条件后,较详细地讨论关系,接着的议题为因果模型。

  宗教、算命或风水命理的因果往往不明显、虚无缥缈。例如,基督教认为人有原罪。为何?因为亚当和夏娃吃了禁果。试想,假如我说,恐龙绝种是由于我今天吃了叉鹅饭,又如,我今天吃了酸辣汤面所以世界会有末日,富理性思维的人会相信吗?基督徒辩称,《圣经》是神圣的所以内容皆为直理。但何为神圣?其实神圣 一词甚空泛。所谓空泛,即使用范围没有任何界限,当某宗教词穷时便会以一些空泛的词汇「解释」,实为蒙蔽[1]。 有宗教训言「今天的因是明天的果」,似有句意阙如之嫌。要知道,意思清楚明确的词,都可堆砌成没意义的句子。你知道「今天的因子是明天的苹果」是什么意思吗?你知道「如果花草所以无花果」是什么意思吗?追问之下,那宗教或会解说「你今世做了坏事来世会有报应」。但他们仍然没有解释「今世做了坏事」跟「来世 有报应」有什么直接明显的关联。张海澎[2]曾 举一例如下,算命先生说在你在某年某月某日生,星系处于某位置,所以影响你的命运,这其实是转移问题,为何星系位置会影响你的命运呢?算命先生只在牵强附会。Paul Kurtz 在评议超心理学是否科学时道:「谈论科学时我们探究近似律法的陈述:即,若甲,则乙;每当甲在场,乙很可能发生。看看超心理学的发现,我们连乙会否发生也不能确定[3]。」伪科学的因果往往含糊或颠倒。

  现代科学理论的因果关系有别于上段所述的。艾耶尔以为我们相信当代科学的方法皆因其在实践上的成功[4]。现代科学所揭示的因果,远比宗教、算命或风水命理可靠。所谓可靠,并不等于必然。David Kenny 谈论相关和因果时表明,没有必然,只有或然;科学家不应该说「真」和「证明」,但要常常记住这些词[5]。Kenny 之言针对科学,包括自然科学和社会科学,我看数学和逻辑应作别论。因果和概率的关系,维根斯坦说得简洁:「若甲遵循自乙,命题乙给予命题甲的概率为一。逻辑结论的必然是概率的限制事例[6]。」而不可能的事件概率为零。﹝留意反之不心然,概率为零不能推出不可能[7]。﹞而一与零之间,就是理性信念程度。概率数值越接近一信念越强,越接近零信念越弱。借艾耶尔的话,说某观察削弱了命题的概率,不啻称我们越来越不想将那命题作为认可假说并供日后参考[8]。﹝留意学界对概率解释不一,如频率派和贝叶斯派,然这些不在本文研讨之列。﹞尽管科学理论不是必然,但很可靠。粗略而言,逻辑和纯数学最可靠,应用数学和自然科学次之,社会科学紧随,伪科学和非科学不大可靠。李天命[9]曾作更仔细的排名:
    最可靠:逻辑、数学
    非常可靠:物理学、化学
    相当可靠:生物学、医学
    不大可靠或大不可靠或未达相当可靠程度:心理学、经济学、管理学、社会学、教育学、所谓的「文化研究」

  现在看看科学论述的因果关系。Kenny [10]称科学家普遍接受三个条件:
    一、时间先后
    二、关系
    三、非伪造性

  先谈第一点,假如甲引致乙,那甲在时间上要先于乙发生。「由于人类将会受到大审判,所以我们现在怎样怎样」之类的言论就不符合这点。第二,假如甲引致乙,甲和乙要存有关系。测试甲和乙有没有关系,可以用一些统计测试。透过统计测试,我们可以知道关系有多大,这是确实客观的数据。信神者称,神是善的由于 牠引致善物[11]。神和善物有何关系?信神者没有表明。而科学理论涉及的关系,是要有统计测试支持的。第三,假如甲引致乙,不可有受控的第三者丙引致甲和乙而令甲和乙的关系消失[12]。

  简述了科学因果的三个条件,我们详细探讨第二点:关系。统计学中,我们称两个没有关系的事件为独立﹝statistically independent﹞。假如我们知道两者有关系,还可以用协方差﹝covariance﹞或相关系数﹝correlation﹞来表示关系的强弱。若 两事件独立,协方差为零。﹝反之不心然。﹞这些数值有助我们了解事件的关系,即甲和乙有没有关系、关系有多大,但不能显示因果﹝是甲引致乙还是乙引致甲﹞。关连性﹝statistical association﹞可能有助解释因果。Mark Woodward [13]举了一个简单例子:当一群人参加了一个晚宴,当中一些人宴后患病。假若每位患病者都吃了同一种食物而病,所有没吃那食物的人都安好无痒,那末该食物跟病明显有关连性。然而,确立关连性只是确立因果的必要,而绝非充足条件[14]。假如有第三者丙,而丙影响甲和乙的关系,我们还有交络﹝confounding﹞和相互作用﹝interaction﹞等等的课题讨论,看官有兴趣可参看 Woodward 那本《流行病学──研究设计和资料分析》。

  数学模型是解释世界的有用工具。统计模型透过分析收集所得的确实数据,从而作出推测。达尔文的表亲高尔顿﹝Francis Galton﹞是回归分析的开山大师。他曾研究父母跟孩子高度的关系,发现个子高跟个子低的父母的孩子的高度,看似回复那群人的算术平均数。这是现代回归模型的先驱[15]。我们谈因果,可看看因果模型﹝casual modelling﹞。Kenny [16]列 举三点解释社会科学宜用因果模型。其一,多数研究员含蓄或直率地﹝implicitly or explicitly﹞建构模型,正式的发展方法可协助研究员。其二,因果模型有助发展、修改和伸展出自测量和坚固的理论。其三,因果模型予社会科学家较强的基础准则从而解决社会问题。Kenny [17]亦列举三个因果模型的限制。其一,研究和资料必要建基于坚牢的仔细观察。其二,理论的中心概念或操纵主题通常不是因果法则,而是图像、概念和结构。其三,因果模型容易引起滥用。欲深入研究者可看看 Kenny 那本《相关与因果》。

  通过统计分析,我们可以清楚知道推测结果有多可靠,如我们可以说九成五确信我们的推断。宗教、算命或风水命理的推断呢?我希望有一成可信。严谨的学术,宜以统计因果附助。





翻译实难,自知拙译甚劣,尽量附原文供读者参考。

[1] 张海澎:《分析逻辑──理性思维的基石》﹝香港:青年书屋,2004 年 6 月初版﹞,页 34。

[2] 同上书,页 41。

[3] 原文为:We say in science that we search for conditional lawlike statements: namely, that if a, then b; whenever a is present, b will most likely occur. Yet in viewing the findings of parapsychology, the situation seems to be that we are not even certain that b occurs. 见 Paul Kurtz, Is Parapsychology a Science? in Kendrick Frazier (ed.) Paranormal Borderlands of Science. Buffalo, New York: Prometheus Books, 1981, p.13.

[4] 原文为:We trust the methods of contemporary science because they have been successful in practice. 见 A.J. Ayer, Languages, Truth and Logic. London: Penguin Books, 2001, p.101.

[5] 原文为:There is no certainty, only a probability. 和 the scientist should never speak the words truth or proof but always keep in them in mind. 见 David A. Kenny, Correlation and Causality. (Revised ed.) 2004. http://davidakenny.net/doc/cc_v1.pdf, p.1-2.

[6] 原文为:If p follows from q, the proposition q gives to the proposition p the probability 1. The certainty of logical conclusion is a limiting case of probability. 转引自 Karl Popper, The Logic of Scientific Discovery. London and New York: Routledge, 2002, p.136.

[7]  原文为:Probability Zero Does Not Mean Impossible. 见 Morris H. DeGroot and Mark J. Schervish, Probability and Statistics. (3rd international ed.) Addison-Wesley, 2002, p.17.

[8] 原文为:to say of an observation that it diminishes the probability of a proposition is to say that it decreases our willingness to included the proposition in the system of accepted hypotheses which serve us as guides to the future. 同注 4,p.100.

[9] 李天命:《哲道行者》﹝香港:明报出版社,2005 年 7 月 3 版﹞,页 135。

[10] 原文为:Three commonly accepted conditions must hold for a scientist to clam that X casues Y: 1. time precedence 2. relationship 3. nonspuriousness. 同注 5,p.3.

[11] 原文为:God is good because he is the cause of things that are good. 见 Brain Davies, An Introduction to the Philosophy of Religion. (2nd ed.) Oxford, New York: Oxford University Press, 1993, p.21.

[12] 原文为:For a relationship between X and Y to be nonspurious, there must not be a Z that causes both X and Y such that the relationship between X and Y vanishes once Z is controlled. 同注 5,p.4-5.

[13] Mark Woodward, Epidemiology: Study Design and Data Analysis. Boca Ration, London, New York, Washington, D.C.: Chapman & Hall/CRC, 1999, p.14-15.

[14] 原文为:The establishment of an association is a necessary, but certainly not a sufficient, condition to establish causation. 同注 13,p.17.

[15] Michael H. Kutner, Christopher J. Nachtsheim, John Neter and William Li, Applied Linear Statistical Models. (5th international ed.) McGrwa-Hill Higher Education, 2005, p.5.

[16] 同注 5,p.6.

[17] 同注 5,p.8-9.


http://chanlikhangnick.googlepages.com/writing20080709.htm
http://theprincipia.blogspot.com/2008/07/9-writing.html
http://theprincipia.blogspot.com/2008/07/9-writing.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-10-30 01:02:56
有电子版的书没?   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群