全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1741 0
2020-12-03
拓扑数据分析
拓扑是研究形状概念的纯数学分支。在大型,复杂和高维数据集的背景下,拓扑结构承担两项主要任务,即形状的度量和形状的表示。可以测量数据中与形状相关的属性,并创建保留特征的数据集压缩表示,这些特征反映了数据集中各点之间的关系。该表示形式为拓扑网络或组合图。在研究高维和复杂数据集时,组合表示提供了数据的压缩表示,其中保留了有关数据点之间的几何关系的信息。而且,这些表示形式是检查数据的有用且简单的方法,并了解表征各个亚组的主要变量。拓扑分析的三个属性包括:坐标不变性,变形不变性和压缩表示。
拓扑数据分析(TDA)允许您通过拓扑网络与结构化和非结构化数据进行交互并表示结构化和非结构化数据。拓扑网络提供了数据集中所有点的地图,因此附近的点比远处的点更相似,并阐明了数据集的结构,而无需查询数据或仅对变量的子集执行任何代数分析。本质上,可以通过分析保留所有具有相似度的所有细微特征和数据点的数据集的压缩表示来发现数据的真正含义。
拓扑网络是机器学习的框架。拓扑网络通过将相似的数据点分组为节点来表示数据,如果对应的集合具有相同的数据点,则通过边缘将这些节点连接起来。因为每个节点代表多个数据点,所以网络给出了极高维数据的压缩版本。拓扑网络使个人可以轻松检查机器学习输出并了解复杂数据集的“形状”。
拓扑方法提供了一种快速的方法来理解数据的结构并从数据中获取知识。拓扑可用于开发识别形状的方法,可通过一套称为“同源性”的工具或用于称为“持久性同源性”的“点云”来完成,当处理大量数据时,点云处理非常高效,因为一个人使用的是在通过点云,所有点都具有相同的组件(它们是要素属性的类似物),并且组件的数据类型相同,这使得处理点不能一一对应,但大块,而无需检查它们的数据结构是否存在任何差异。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群