朱家祥教授散文读后感
(我的博客:http://danielyoung.blog.sohu.com/ )
这里的散文就是指非学术文章,或者是非技术性的分析。读后感也不是什么长篇大论,而是一点小体会。
1, 对朱教授“简单的机率运算”自己动手算了一算。
A=要吸烟 B=肺癌
已知:P(A)=0.376 P(B)=2.2/10000 P(A|B)=0.7
求解:P(B|A),
解:
P(B|A)=P(A|B)*P(B)/P(A)=0.7*2.2/10000/0.376=0.00041也即是说已知一人吸烟,在不考虑其它因素的条件下,那么他得肺癌的可能性为0.041%。注意这同70%的区别有多大。
2, 想起原来看过的一则新闻,自己还就此写过博客。新闻大概是讲:某种非法网站与少年犯罪的问题。该节目的大致逻辑是:青少年因为浏览改种类型的非法网站,于是产生犯罪。因此,我们应该关闭该类网站。关于犯罪与网站之间因果关系的证据在于记者采访少管所,发现几乎所有的少年犯都浏览过改种类型的网站。政府依法关闭这种类型的网站,我们当然坚决拥护。但是这则新闻报道却有着与吸烟-致癌这一论述的相似问题。首先我们要注意,节目中提供的是哪一类概率。如果我们像吸烟-致癌一例中一样,令A=浏览某种网站 B=犯罪的话,那么节目中只提供了P(A|B),也即我们已知一个人是少年犯,那么他浏览某种网站的概率。注意该报道中丝毫也没有讲到我们实际上真正关心的问题P(B|A)——已知一少年浏览过该类型网站,那么他犯罪的概率是多大。而我们自己也算不出,因为根本就没有提供P(A),也即所有少年中,究竟有多少人浏览过该类网站。第二,该报道 也存在非随机取样的问题。在WOOLDRIDGE计量经济学导论第17章中专门讲到了取样的问题。非随机取样,如果能满足外生取样的条件,那么估计量也可能是无偏的,或者是一致的。但是这里的选样,只选取少年犯作为样本,这里的选样标准显然和扰动项相关,这里的估计肯定是有偏的。第三,这里明显的存在遗漏变量偏误。我们只以浏览网站与否这一个解释变量来解释是否犯罪,这样的回归几乎肯定存在遗漏变量偏误。其实,从WOOLDRIDGE的犯罪计量学的简单介绍中,我们都可以看到,犯罪率的解释变量通常有,如定罪率、失业率等等。我们就少年犯罪可以想象到的还可能包括,辍学率等等。这些变量不控制,根本无法得出因果推断。
3, 立场与论证的区别。注意朱教授是赞成环保和戒烟的,但是反对他们的论证。这两者之间并不矛盾。当然,从这里或许我们也看到如何用所学知识去批判性的思维,拒绝媒体的洗脑。朱教授的这两篇文章并不深奥,但却很有意义。