科学计量学家鲁索(Ronald Rousseau)和其团队在国家工程院子刊《信息与电子工程前沿》英文版FITEE 2015年4月期上发表论著,阐述有向网络和无向网络中Gefura测度的非归一化和归一化形式 (Unnormalized and normalized forms of gefura measures indirected and undirected networks)。由于研究方向相近,本博有幸先期学习此文,体会到作者提出桥接(Gefura)测度的原创历程,特借科学网博客向大家推介。
在描述复杂网络连接相关文献中,一些重要研究成果不断深化人们对网络特性的理解,进而提出新的测度和模型。Guns和Rousseau一文清晰列出这些文献,从Gould和Fernandez(1989)的节点中介(Brokerage),到Freeman(1977,1991)以及Wasserman和Faust (1994)的中心连接性(Betweenness Centrality);从Flom et al. (2004)Q-测度(Q-Measures),到本文引入的桥接测度(Gefura Measures)来量化这些连接特性。从这些文献分析,可以看出一些重要量化指标的建立,随后衍生出一些著名的网络度量计算模型如Brandes(2001)算法以及Girvan和Newman(2002)算法,等等。文中 来自希腊语原词Γεφυρα,是桥梁的意思,所以Gefura Measures是否可以翻译为桥接测度。
由于复杂网络往往是多元异构、层次分明,节点表达某种基本元素,由这些节点组成的群组又表达某种高层次类属元素。某些网络节点属于预先定义的群组,这些内在关系并非全部都是未知的。而经典理论中的网络中心性测度并未考虑到这类结构的特性,难能反映这些具体变化。鲁索团队提出桥接(Gefura)测度的意义就在于,贴切地使用“基本”测度归一化来描述节点元素的连接特性,再用“结构”测度归一化来表征群组的连接特性。将无向网络视为对称有向网络,所得结论对于无向网络同样成立。而测度的归一化,以便对不同尺度或类型的网络连接性测度具有可比性。文中特别说明了如何修正Brandes(2001)算法,具体计算网络中介节点的桥接测度,使得文章更具可读性和实用性。在科学计量学中的文献网络分析时,这些节点可以是文章或作者,而群组可以是某期刊或会议,桥接测度的计算,使得文献分析中文章或作者对团队间连接作用更加清晰了。特别是使用“基本”和“结构”桥接测度,可以研究区分文献的本土和国际引用,凸显文献真实价值,实用意义可观。图一显示该文出版稿截图,全文和相关文献请见FITEE在线现刊。
图一《信息与电子工程前沿》2015年4月期鲁索团队文章截图
学术界的任何新思想、理念,具体到新指标和新模型都需要经得住时间的检验。鲁索教授和团队通过在FITEE发表学术文章,正式提出桥接测度,这种创新精神可圈可点,值得称赞。实际上,从Q-测度到桥接测度的演变,经历了较长的历史进程,是鲁索团队十年来在此方向不懈探索的科研成果集成。Q-测度局限于描述节点在两个群组间的连接性,而Guns和Rousseau在2009年的文献中放松了这一局限,扩展到任意有限数群组,并提出此测度的“全局”和“局部”概念的区别。在科学网刘玉仙博主参与的一些工作中,进一步梳理了该类测度的数学定义、归一化、权重设置以及在共同作者(co-authorship)间关系研究等方面的应用(2010-2015)。鉴于Q-测度在实际应用中的局限性,鲁索团队认为有必要专门提出桥接测度,使其具备严密规范和普遍应用意义。
在Guns和Rousseau文中计算局部桥接测度时,用三种方式描述不同的节点连接关系:桥出节点(outward bridge)、桥入节点(inward bridge)和互相桥接结点(both outward and inward bridges)。这种表达方式,使得桥接测度的定义公式表达十分简洁和准确。本博团队在研究微博的粉丝模型(Follow Model, Sandes et al., 2012,Weigang et al.,2014)时,提出了用fout(.)函数描述关注(followee)、fin(.)描述粉丝(follower)和fr(.)描述互粉(both friends)用户之间的关系。研究粉丝模型的初衷是为在线社交网络提出用户关系逻辑模型,寻找快速信息查询算法。如果把粉丝模型与桥接测度两者的优势结合起来,会进一步提高对微博研究的深度和广度。
其实,在浩瀚的复杂网络中,展示个体特点,发现群体形成,研究这些群体的演变,指出全体群组间的连接关键节点和可变特性,是一个有趣和重要的课题。通俗点讲吧,以国内引进人才为例。如果某些人才引进得当,他/她会把原来团队的科研资源带到新的团队,形成多个群体的连接,促进多个团队的学术交往和研究发展,桥接测度则可用以描述他/她的影响因素和学术价值。
科学网武夷山老师曾在博客里介绍了鲁索教授编制的文献计量学发展大事年表,指出在鲁索的这个大事年表上,2005年之后尚未出现本领域的重大成果。本博衷心希望桥接(Gefura)测度一文能够引起关注,得到国内外同行认可,进而广泛应用,成为文献计量学等相关领域的一项重要成果。同时,该测度毕竟局限于静态网络,对于动态条件下节点与群组的连接度演变以及计算效率等方面,仍需要进一步探讨,为后来者留下深入研究空间。这方面,周涛博主前不久介绍程灿等的文章:网络路由传输策略的研究进展,从另外角度探讨网络路由,亦即动态连接问题,殊途同归,值得借鉴。
值得提出的是,此文的发表体现了《信息与电子工程前沿》(Frontiers ofInformation Technology & Electronic Engineering) 编辑部在促进国内期刊国际化中的的努力。将国内本土科技成果推出去,把国际著名学者的成果引进来,已成为他们办好国际型期刊的日常工作。在该刊在2015年年初由浙大校刊(C)改为工程院子刊后,2月号刊起就被Web of Science按新刊名称收录。从另一方面来说,鲁索教授和团队的研究成果和写作技巧,对科技人员的课题研究和指导学生,都有借鉴意义。我们实验室的学生们为了能深刻理解桥接测度等网络指标,特别调试了Guns和Rousseau文章列出的Brandes修正算法,与本团队开发的粉丝模型结合,进行案例分析,体会颇深。
感谢科学网博主、FITEE期刊执行编辑翟自洋老师对本博文提出的参考意见。例如本文刚开始并没翻译Gefura一词,只是把洋码子列出来。但翟老师建议还是翻译成汉字好一些,如桥梁链接。文中就借此思路,简译为桥接,希望能准确表达出原著的真实意义。由于语言限制等原因,本博文并没征求Guns和Rousseau两位老师的意见,借此谨表对作者的谢意。
http://blog.sciencenet.cn/blog-652078-879702.html