曹聪
1955年,美国宾州大学结构语言学博士尤金·加菲尔德(Eugene Garfield)第一次在《科学》杂志(Science)上提出了“引文索引”的设想,即提供一种文献计量学的工具来帮助科学家识别感兴趣的文献。随后,加菲尔德于1960年创办了科学情报研究所(Institute for Scientific Information),尽管叫做研究所,其实是一家私人公司。它于1964年开始出版SCI。
SCI的出现是引文分析的需要
SCI是应引文分析(citation analysis)的需要而出现的。说白了,引文分析就是统计一篇论文发表后被多少其他论文引用。
然而,引文分析产生了始料未及的结果,其应用范围不断被扩大和延伸,不但被广泛用于评价科学研究的影响和质量,而且用于确立科学家的学术重要性或在学术界的声誉。
引文衡量的究竟是科学研究的影响还是质量?这是一个颇有争议的问题。加菲尔德和他同事欧文·谢(Irving Sher)曾将那些公认做出过高质量工作的科学家的论文平均引文数,与那些尚未取得这种认可的科学家的论文平均引文数做过比较,结果发现,1962年和1963年的诺贝尔物理学、化学、生理学或医学奖得主在获奖之前的论文引文数大大超过其他科学家。这便是用引文分析预测诺贝尔科学奖得主之滥觞。
引文分析也成了各类学术排行榜的一个重要指标,比如,美国国家研究理事会(National Research Council)在衡量美国大学博士专业质量或声誉时,就用它作为所在系教授的研究质量指标之一。笔者的导师、科学社会学家乔纳森·科尔(Jonathan R. Cole)曾任哥大教务长多年,审核过400多例终身教职的案例。据他回忆,其中三分之一案例提供了引文数。但他们其实并不清楚引文数究竟衡量的是什么。
SCI引入科学评价不是社会学家的错
尽管对如何使用SCI莫衷一是,引文分析的许多合理的方面也备受怀疑,信不信由你,这个现在用来决定科学家和学术机构命运的产品,最初是由科学社会学家,说得更确切是由乔纳森·科尔和他的哥哥斯蒂芬·科尔(Stephen Cole),也就是科尔兄弟引入科学评价的。1973年,芝加哥大学出版社出版了他们的专著《科学的社会分层》(Social Stratification in Science),就是基于他们对美国物理学家的论文引文分析之上的。
事情要回溯到1957年,默顿(Robert K. Merton)教授以《科学发现的优先权》为题,在美国社会学会年会上作会长演讲。默顿1938年以《17世纪英格兰的科学、技术与社会》的论文从哈佛大学获得社会学博士,其后虽然也发表过《科学与社会次序》、《民主次序下的科学技术》等论文,但在其后的十多年间,他没有再碰这个题目。此次演讲标志着他再次将科学作为一种社会体制来研究。
从1965年秋季开始的十多年间, NSF支持默顿在哥大社会学系开设科学社会学研究生课程。第一批学生包括后来以研究科学为主要对象的社会学家科尔兄弟。
科尔兄弟的兴趣在于:科学家的知名度是由什么决定的?在确定知名度方面,科学出版的数量和质量哪个更重要?
耶鲁大学的科学史家普莱斯(Derek J. de Price)的《小科学,大科学》在考察科学的发展时,选择了一系列指标来衡量科学的产出和各学科领域的知识增长率。他假设,科学增长符合“逻辑增长曲线”——科学文献中的很大一部分是由一小部分科学家所贡献,从而引入了科学家群体的引文和大样本等指标。显然,普莱斯是将这些指标作为“因变量”来解释科学增长的。
而科尔兄弟则更对科学家的学术生涯、创造力和所受到的社会承认等社会学问题感兴趣,尤其想弄明白科学的创造力为什么会有差异,科学上的奖励是否主要是由质量来确定的。也就是说,他们试图将科学产出看作“解释变量”。
就在寻找解释创造力差异的稳定指标时,他们了解到,加菲尔德已经编成了1961年和1964年两年的SCI。于是,他们把SCI拿来做重要的研究工具。尽管加菲尔德是哥大毕业生,而且哥大的科学社会学家们在SCI刚问世时使用SCI的数据,无形中是支持SCI、为SCI做广告,但是,他向科尔兄弟提供数据,只给折扣,从来没有免费过。
科尔兄弟收集了在1959~1963年间授予两个博士学位以上的86个美国大学物理系的物理学家的名单,一共2079人,并从《美国科学人名录》中收集这些物理学家的学术生平,从《科学索引》(Science Abstract)中找出他们的文章数,从SCI中收集他们的论文引文数。随后,科尔兄弟根据这些物理学家的年龄、所在学校、产出和获得奖励等分层,随机挑选出120名物理学家。最后,科尔兄弟向2079名物理学家发问卷,向他们了解是否熟悉这120名物理学家的工作或者听说过他们的名字。
科尔兄弟试图用这些物理学家所在系的知名度、科学创造力的水平、研究的质量、是否获得过特殊荣誉、年龄和其他有可能导致科学家获得承认的变量之间的关系,来解释这120名物理学家得到承认的差异。他们指出,仅仅用论文数来衡量科学产出会产生误导,因为这么做忽视了论文“质量”这个关键变量,他们第一次提出用科学家论文的引文数来衡量其研究的质量和影响。
引文分析的注意事项
科尔兄弟选用每个物理学家引用最高的3篇论文的引文数,以此为质量指标。由于物理学的贡献往往不是由一篇论文所决定的,他们使用一年内发表的论文数。引文数经过加权才有意义,即给引用以前发表的论文的引文数以较大的权重。在比较不同时期的工作时,他们对引文数作标准化处理。他们还剔除了自引。
科尔兄弟特别提到,不能跨学科、跨领域来比较个别科学家的引文数。即使在同一学科,由于领域的大小不同,而科学家的领域又通常较难确定,尤其是当一个科学家的工作横跨多个领域时,比较他们的引文数也是没有意义的。即使在同一个领域,引文数的多少也不见得能说明科学家工作的影响大小和质量高低。
用引文多少来衡量国家科技创新力就更无异于“天方夜谭”!
SCI在中国被误用
无论是加菲尔德编撰SCI,还是科尔兄弟运用SCI来衡量科学家工作的质量和影响,他们关注的都是引文(citation)。而中国仅仅强调SCI论文,即在SCI收入的期刊上发表的论文,与SCI有关系,但论文和引文是两码事。
根据SCI论文来奖励科学家、根据SCI论文多少来为学术机构排名,都不是SCI的本意。
SCI的创新之处在于引文数,论文数只有在计算影响因子时才有用。而引文数又是一个统计值,即使用于科学工作的评价,它也不是无远弗届的,有其局限性。
在中国,是SCI论文、不是SCI成了“解释变量”,决定了科学家能否得到晋升和奖励、研究生能否获得学位等。问题在于,这么做,违反了SCI期刊论文数不是质量指标、SCI不能用来评价科学家个人的研究工作、不能用来评价不同领域的科学家等原则。
SCI论文在中国充其量类似于普莱斯研究中的“因变量”,而导致中国SCI论文数急剧增长的“解释变量”不仅包括研究开发经费的增长、研究生的扩招,还包括对SCI论文的“崇拜”,正是这最后一个因素,导致中国科学论文增长而研究质量并没有随之水涨船高。尽管数量的扩张有可能最终带来质量的上升,但是,由于评价工作没有注重质量,质量是否会提高还是未知数。
在笔者看来,中国科学界的当务之急,不仅在于重新认识SCI在科学评价中的作用,而且有必要进行仔细的经验研究,弄清楚中国科学的质量和影响,从而找准在世界科学界的真正地位。
(作者系美国纽约州立大学莱文国际关系和商务研究生院高级研究员)
(《科学新闻》2009年第17期)