Eric D. Kolaczyk Gábor Csárdi 著 李杨 译
版次印次 2016年6月第1版 定 价 54.00元
借统计利器探索网络世界
第1 章 引言
1.1 为什么研究网络?......................................................................... 1
1.2 网络分析的类型............................................................................ 2
1.2.1 网络可视化与特征化............................................................ 3
1.2.2 网络建模与推断.................................................................... 5
1.2.3 网络过程............................................................................... 6
1.3 为什么使用R 进行网络分析? ..................................................... 7
1.4 关于本书....................................................................................... 8
1.5 关于本书的R 语言代码................................................................ 9
第2 章操作网络数据................................................................................ 11
第3 章网络数据可视化............................................................................. 30
第4 章网络图特征的描述性分析............................................................... 45
第5 章网络图的数学模型......................................................................... 74
第6 章网络图的统计模型......................................................................... 92
第7 章网络拓扑结构推断......................................................................... 120
第8 章网络图上的过程建模与预测............................................................ 147
第9 章网络流数据分析............................................................................. 176
第10 章动态网络..................................................................................... 196
参考文献..................................................................................................... 217
索引............................................................................................................ 229
彩图节选..................................................................................................... 235
译者序
我们正身处一个网络时代。全球的生产贸易网络深刻改变了我们的物质生活,互联网的普及则让我们身处信息洪流之中。当网络成为我们生活的一部分,我们也成为了网络的一部分。面对相互关联的海量网络数据,置身其中的我们如何认识这个世界?
在这样的背景下,网络科学近年来迅速崛起,横跨数学、物理学、生物学、计算机、社会学、传播学等领域,成了定量研究中的“显学”。通过将复杂系统抽象为节点、边以及它们的属性,网络科学为解析系统特征、建立系统模型和研究系统的动态过程提供了一套简洁优美的方法。研究者掌握了网络科学的思考方式和分析工具之后,通常可以站在一个更为全局的视角审视问题,让多个交叉学科的研究进展为我所用。尽管市场上已经有不少优秀的网络科学著作,我们相信本书仍会给读者带来惊喜。由于网络科学研究者的学科背景不同,多数网络科学著作往往带有强烈的学科视角特色,例如统计物理背景的著作强调网络整体性质的形成机制,社会学背景的著作强调结构指标和社会学理论框架,而计算机背景的著作则强调数据存储、算法实现等。本书及其前身Statistical Analysis of Network Data 从统计学的视角切入,归纳不同学科网络研究中的通用任务,并采用严格的统计学术语进行了表述,这在同类书籍中尚属少见。本书的6至10 章尤其精彩,其中介绍的网络统计模型很多是近五年的研究进展,对网络研究有兴趣的研究生和科研人员可以借此快速了解研究前沿。我们建议读者深入阅读书中的参考文献,以掌握使用统计工具分析网络数据的思路,并理解数据分析方法所隐含的理论假设。
另一方面,本书在讲述统计网络分析时使用了R 语言,主要以igraph和statnet 系列扩展包作为主力分析工具。原书的第二作者正是igraph 扩展包的创建者。相比其他网络分析平台,R 语言自身提供了强大的统计分析功能,所涉及的网络分析扩展包抽象程度更高、封装功能更多,有效节约了研究者构造网络数据结构和算法的时间,使得研究者可以集中精力考虑核心的研究问题。全书采用案例方式讲解统计理论,并提供了相应的分析代码,读者可以仿照书中内容快速上手开始自己的研究。
本书在翻译时力求准确、生动,但由于译者水平和经验有限,翻译不当之处在所难免。为了更好地为各位读者服务,本书在GitHub 建立了对应的翻译页面https://github.com/ complexly/ sand-translation。若您在阅读过程中发现了任何问题,欢迎在GitHub 提交issue 进行交流,或者发送邮件至book@complexly.me,我们将及时把书籍的勘误信息更新在翻译页面上。
李杨
2016 年5 月于清华园
前言
网络和网络分析无疑是近年来定量科学进展最大的领域之一。虽然作为领域起源的社会网络分析可以追溯至20 世纪30 年代,图论研究可以上溯几个世纪,但“网络科学”领域的迅速崛起与普及只是近10 到15 年的事情。通过我们熟悉的互联网、社交网络、病毒营销等途径,网络已经渗透到日常生活的方方面面,而不仅仅是一个研究领域或者一种研究方法了。
数据的度量与分析是网络研究的重要组成部分。因此,在实际应用、研究方法以及理论发展方面,网络分析都很需要或简或繁的各类统计方法。与其他统计学分支一样,网络分析同时包括描述性和推断性的统计方法。使用这些方法可以完成与网络有关的各种任务,包括基本的网络结构可视化与特征化,对网络拓扑的采样、建模与推断,以及对网络上的静态和动态过程进行建模和预测。
本书的写作目的是为网络数据的统计分析提供一种使用R 语言的、简单易得的入门课程。因此,本书既不是涉及的各种R 扩展包的使用手册,也不打算介绍所涉及主题的详尽概念和技术基础。相反,我们希望在这两者之间寻找一个平衡,并且在最佳阅读体验的基础上,采用(希望是!)最简洁的程度来组织文字。相应地,我们预计本书会被以下人群使用:(1)希望开展网络数据统计分析的统计学者,无论是作为研究方向还是与他人合作,且希望继续使用R 作为分析工具;(2)来自类似定量领域(如计算机科学、统计物理、经济学等)的复杂网络研究者,无论对统计是否熟悉,希望较快掌握R语言中的网络数据统计分析方法;(3)应用领域的实践者,希望涉足与某些特定应用相关的网络分析方法。
总的来说,本书是为定量领域、有网络数据统计分析需求的研究生和科研人员撰写的,但熟悉R 语言的高年级本科生也可以轻松地学习本书的大部分内容。我们预计当前对本书感兴趣的人群不仅包括统计学的读者,还有来自计算生物学、计算机科学与机器学习、经济学、神经科学、计量金融学、信号处理、统计物理以及定量社会科学的研究人员。