全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2259 0
2022-04-26
数据科学家的一项常见任务是识别给定数据集中的集群。这个想法是简单地找到与外人相比,彼此之间有更多联系或相似性的对象组。在网络研究中,我们使用聚类来识别大量连接中的社区。


通常,力导向布局算法组织网络图,使模式在视觉上易于理解,但它不能识别和标记集群。此外,在大型网络地图中,高水平的细节压倒了我们的感官。为了能够精确地检查其模式,我们需要对网络中包含的数据进行定量视图。虽然机器学习中有多种数据聚类方法,但 Louvain Modularity 算法特别适用于大型数据网络。它检测以相对高密度的关系为特征的紧密结合的组。在视觉领域之外,您可以使用 Louvain 聚类算法将数百万节点的在线社交网络划分到不同的机器上。



一旦检测到网络集群,就可以为已识别的节点组赋予不同的颜色和名称,这样它们就可以清楚地区分,并共同提供更大网络的摘要。我们可以根据其节点的共性或在分组中找到的最中心节点来标记一个集群。

在 Graph Commons 中,您可以使用分析栏在数据网络上使用聚类。您首先单击“运行聚类”按钮,然后设置算法应识别多少粒度聚类的分辨率。找到集群后,将根据集群中连接最多的节点自动标记它们。但是,我们强烈建议您自己重命名这些社区,以突出这些社区在您的上下文中指定的内容。最后,您可以查看属于某个集群的所有节点的列表并将其下载为 CSV 文件。

网络地图上的集群标签

在 Graph Commons 中,您会注意到集群标签也直观地放置在地图上。您可以移动它们并更改它们的大小,以使网络更具可读性。

当您将鼠标悬停在集群标签上时,它将突出显示,这样您就可以清楚地看到它的边界以及它所在的位置。地图上的集群标签提供了一个复杂网络的概览,否则很难从视觉上掌握。

集群之间的桥梁

在复杂网络的集群中,我们经常看到除了它们的相邻节点之外,很少有节点与其他集群建立连接,这些节点的连接只是本地的,位于其直接集群中。那些在多个集群之间桥接连接的节点具有很高的中介中心性。在网络布局算法的帮助下,两个或多个集群之间的这种桥接节点变得清晰可见。

如果我们正在分析一个社交网络,这些桥接人很适合成为信息经纪人,因为他们可以访问在其他集群中流动的信息。他们是将八卦从一组人传给另一组人的人。他们能够结合在多个群体中发现的各种知识和想法。另一方面,桥接节点更有可能成为单点故障。如果一个桥梁人消失了,那些以前相连的社区就会断开。


      相关帖子DA内容精选
  • 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群