关系,几何和
人工智能
人工智能的功能,它必须能够使用高度结构化的数据类型进行计算,例如人类所处理的数据类型。这意味着AI必须能够处理有关对象之间的关系的信息,这些信息被有效地编码为图形,即这些节点之间的节点和边缘的集合,以及附加到节点和边缘的属性。
一个简单的例子是图像,其中考虑形状像正方形网格的图,其中像素值是附加到网格中特定节点的属性。作者继续描述了他们开发的用于使用图结构化数据进行计算的框架,尤其描述了如何构建用于这种计算的
神经网络。
在这项工作中嵌入了以下问题:
图从何而来?
这个问题认识到一个事实,即大多数数据的性质都是“感官的”,即,它是通过测量数值并将其值记录为高维空间中的矢量坐标而获得的,因此没有配备任何明确的基础图形结构。
因此,为了在研究此类数据中获得类似人的智力,有必要根据感官数据构建图形或关系结构,并且执行此类构建是人类智力中的关键要素。
这篇文章的目的是描述一种用于精确执行此任务的方法,并描述如何从此类方法的输出直接构建神经网络。我们可以将方法总结如下。
关键要素是 捕获感知数据的一组要素 或传感器上的几何 或 度量。
第二个关键要素是用子集覆盖 一组特征的要素 。通常选择覆盖物以在适当的意义上与几何形状良好相关。
几何图形和相关的覆盖物一起用于根据定义数据的要素构造图形结构。
它们还用于构建卷积神经网络中使用的合并结构的类似物,从而使学习可以基于各种分辨率。
有兴趣的读者应咨询 拓扑数据为基础的分析途径深入学习 和 拓扑途径
深度学习 ,其中结构进行了详细的讨论。
我们非常同意DeepMind / Google论文 中表达的观点, 即他们的工作拒绝“手工设计”和“端到端”学习方法之间的错误选择,而是主张认识到这些方法是互补的并且应该这样对待。接下来的事情是,我们应该开发各种各样的工具和方法,以实现神经网络的手工工程。在DeepMind /谷歌论文中描述的方法是在该方向迈出的一步,因为是在纸上 基于TDA-途径深度学习 和 拓扑途径深度学习。
我们还观察到,这种方法的好处不仅仅在于提高神经网络计算的准确性和速度。一旦采用DeepMind / Google论文的观点,人们将能够创建实现人机交互思想的算法。特别是,它们将更加透明,以便人们可以了解其内部功能,还可以提供更复杂的“人类可读”输出,人类可以与之交互。关于神经网络拓扑结构的阐述和解释的本文 构成了朝这个方向迈出的一步。
最后,我们观察到,要完全实现这一愿景,不仅使计算方案易于阅读,而且对输入数据也很重要。如果没有更好地了解数据中的内容,Battaglia及其同事描述的改进将仅使我们成为完全实现人工智能的一部分。拓扑方法提供了用于理解数据集的定性和关系方面的工具,并且应在理解分析它们的算法中使用。
几何图形
对于图像,属性(像素)集上的图形结构是正方形网格的图形结构,其中包括一些对角线连接。
我们的第一个观察结果是,网格实际上包含在连续的几何对象(即平面)中。飞机的重要性在于,它配备了距离的概念,即 指标 在数学意义上(见Reisel的工作 在这里)。选择该组顶点以使其在平面中通过正方形分布得很好,以使正方形中的每个点都靠近其中一个顶点。此外,可以从远处推断图中的连接。这是因为如果我们让 [R 表示从一个顶点的距离其最近的邻居(这是独立的顶点什么,因为我们布局的规律性的选择),如果他们的距离<√2然后两个顶点相连[R 。
因此,该图取决于:
(a)选择平面的子集和
(b)平面上的距离概念
该观察值的价值在于,我们通常具有配备度量的一组属性或特征。本文研究了一些有趣的示例 ,其中对自然图像中补丁的统计行为进行了研究。研究结果之一是,存在一个重要特征,可测量贴片在特定角度θ方向上的“角度偏爱” 。当我们改变 θ时,我们得到了一组特征,这些特征在几何上布置在一个圆上,可以离散化并转换为下面左侧的图形。更详细的分析显示了一组两参数的特征,这些特征以称为“克莱因瓶”的几何对象的形式布置 ,并在下面的右侧显示相关的图形结构。
可以为3D成像和视频成像找到类似的几何形状。博览会论文中的工作 建议在更大的空间中容纳Klein瓶,这将适用于更大比例的特征和更多抽象的对象。
纯数据驱动的图形构造
上一节中的构造依赖于有关功能的先验知识或特定传感技术的详细数据分析研究。为了拥有一种更通用的方法而又不进行复杂的
数据分析,必须要有一种能够在特征集上快速产生有用的图形结构的方法。存在这种方法,并且在TDA纸 和 拓扑 纸中都有 介绍。
假设我们有一个数据矩阵,其中行是样本或观察值,列是要素或属性。然后,这些列是向量,并且可能会为它们配备各种距离概念,包括高维欧几里得距离(也许适用于平均居中和归一化的列),相关性,角度或汉明距离(如果值为布尔值)。通常有很多选择。通过选择距离阈值,我们可以构建一个图,其节点是各个要素。如果阈值较小,则该图将比我们选择较大阈值时稀疏。因此,在这一点上,我们有了一种根据感官数据构造图形的方法。此外,在两个特征通过一条边连接的意义上,该图描述了特征之间的相似性关系,
这种构造当然是有意义的,并且可以概括为图像完成的构造。但是,它产生的图在意义上与我们的特征具有相同数量的节点时是很大的。从某些节点可能具有大量连接的意义上来说,它们也可能是密集的,从计算的角度来看,这是不理想的。我们将通过压缩图结构的形式来解决这个问题。
为了理解这种构造,我们将讨论图像深度学习管道的另一方面,即池化层。我们将其描述如下。
“合并”是指合并像素子集的值,特别是较小的正方形。下图描述了这种情况,其中我们用9个较小的子栅格(每个栅格一个接两个)覆盖了像素网格。
池化的想法是创建一个新的图,这次是三乘三,每个子网格都有一个节点。有趣的一点是,只能根据子网格的相交来描述新图的创建。具体地,当且仅当子网格具有至少一个共同的像素时,与两个子网格相对应的节点通过一条边缘连接。该观察值的价值在于,只要我们可以生成类似于子网格覆盖此正方形的覆盖层,则该准则可以推广到特征空间上几何图形的一般情况。我们指的子网格的集合作为一个 覆盖 一组像素的,其中由一组覆盖 X ,我们指的是家庭的子集的 ü 的 X 这样X的每个元素 都包含在U 覆盖的某个成员中 。
拓扑数据分析提供了一种使用称为Mapper的方法来生产此类覆盖物的系统方法,该方法在 TDA 和 Topology 论文中进行了介绍。
这种结构的输出将是图的家庭 ,? 1 ... ,? [R 具有以下属性。
每个图形中的每个顶点都对应一系列特征。
对应于顶点的集合很小,或位于要素集上指定的度量中。
每个图是 低维的 ,这意味着一个集团中的顶点数是有界的。
该组的对应顶点特征的大小成长为我们摆脱? 1 至 ? [R 。换句话说,这些图形变得越来越代表该组特征。
这种构造产生了一种系统的方式来产生可从数据矩阵获得的感觉数据的图形表示。事实证明,可以直接从这种表示形式转到神经网络体系结构。
实际上,甚至可以想象使用Mapper在输入层之后的层的激活值上逐步生成覆盖。偶尔重新计算覆盖层,因此图形结构将允许网络在训练过程中调整其图形结构。
构造神经网络
上面给出的圆形结构可以为神经网络体系结构提供一些非常简单的几何结构。例如,在上述环形网络的情况下,这种构造的图片如下。
类似的构造可用于克莱因瓶的几何形状和其他形状。
从上面的纯数据驱动的构造中构造神经网络也非常简单。由于每个图对应于一组从数据矩阵特征中的每个节点上,我们可以声明在?一个节点ν [R 是由有向边连接到节点 瓦特 在? R + 1 当且仅当对应于该集合ν和与w对应的集合 至少包含一个共同的特征。此将描述用于与?的节点简单的前馈网络的连接图案? 作为设定在神经元 - [R个层。下面给出了此构造的简单版本的图片。
概要
我们提供了一种将图论信息分配给感官或连续数据的方法。它取决于以距离函数的形式对数据集的特征集进行几何信息分配。基于拓扑的数学原理(形状的研究)的许多构造都可用于此任务。该方法应产生以下结果:
改进了算法的透明度,因为现在神经元集以易于理解的几何图案进行组织。特别是,通过神经元的激活值对几何结构进行着色将使网络的功能更加清晰。
还基于功能集的拓扑模型的着色,改善了输出的可解释性。这种着色通常会产生基于特征组而不是单个特征的对数据行为的简化理解,如Ayasdi博客“用于统计推断和人工解释的机器智能”所示。
由于拓扑模型的构造具有处理要素组的节点,因此可以预期,使用此类模型将有助于减少此类模型中经常发生的过度拟合。初步实验表明,这确实发生了。
可以对有助于进行拓扑数据分析的结构进行分类,并且其拓扑属性可能具有有趣且有用的解释。例如,已经显示出CNN的空间过滤器将它们自己排列成简单的圆圈,并且这些指示了网络对未见数据进行概括的能力。另外,CNN的激活图的持久同源性可用于检测对抗性实例。
1