图形数据库:概述
概念 图形数据库追溯到Leonhard Euler。欧拉是18 日谁做数学中几个重要发现,如微积分世纪瑞士数学家。在1736年解决“柯尼斯堡七桥”问题时,欧拉为图论奠定了基础。(他也很有趣地大喊大叫隐藏的数字 什么时候 欧拉法 进行了讨论。)
解决时 “柯尼斯堡问题,欧拉忽略了路线的选择,声称在每个地块内的路线都是无关紧要的。相反,他的重点是过桥的顺序。随着重点的转移,他用更抽象的术语重新设置了问题,并为图论奠定了基础。他用抽象顶点(在图数据库中称为节点)代替了陆地。每个桥成为一个抽象的连接或“边缘”,该边缘表示由该桥连接的两个顶点(或陆地质量)之间的关系。他产生的数学结构称为图。
在现代世界中, 图数据库本质上是节点和边的集合。每个节点都包含对实体或对象(例如人,企业或汽车)的描述,每个边均代表对节点之间关系的描述。
例如,互联网企业必须使用 GDPR与客户群打交道时的政策。可以使用互联网业务作为节点,以客户为节点,以GDPR作为连接边,或与客户之间的关系来表示与客户打交道时的策略。节点之间的关系可以表示为单向关系。可以在图上表示“ Internet business-GDPR policy-customer”,其边缘将Internet业务节点连接到客户节点。
图数据库的使用
图数据库的灵活性及其对关系的关注是解释最近在Google中受欢迎程度飙升的两个关键因素 图形数据库。从现有数据中产生见解的需求支持了一种数据库技术,该技术将关系信息放在了高度优先的位置。
奇怪的是,传统的关系数据库管理系统(RDBMS)处理数据关系的能力很差。他们使用的僵化模式很难更改连接或添加新的业务需求。另一方面,图形数据库可以有效地存储数据关系,但也很灵活。它们允许轻松扩展数据模型,并可以根据不断变化的业务需求进行调整。因此,图形数据库通常用于:
客户360
推荐和个性化
资产管理
欺诈识别
社交网络
图形数据库已成为从社交媒体源中挖掘数据的流行工具。当处理涉及复杂关系的数据时,它们也很有用,例如根据“购买此商品的客户还看过了……”来识别和创建推荐。
当目标是获得有关业务关系的见解时,图形数据库是一个不错的选择。图形数据库可以洞悉客户兴趣并帮助为某些客户创建消息。这些系统可以帮助企业创建准确,全面的客户资料。当应用程序的数据模型需要支持时,图形数据库特别有用:
“多对多”关系
关系的高价值
大规模低延迟
异构数据
何时不使用图形数据库
在某些情况下,图形数据库不太适合。关系不重要的交易数据就是一个例子。诸如姓名和相关电话号码之类的简单列表(固定和表格数据)不需要存储在图形数据库中-关系数据库会更好。复杂的命令(例如“列出所有收入在20至40岁之间的收入超过$ 200K的客户”)不应在图形数据库上执行,因为它们无法响应“多面性”命令。
当扫描大量数据或使用未知的起点时,图形数据库并非为获得最佳性能而设计。如果查询正在扫描表以查找匹配项或正在寻找适合常规类别的数据,则图形解决方案不是最适合该任务的解决方案。图形数据库的设计和构建旨在通过使用起始数据点来查找关系。它们不能用于在没有特定起点的情况下搜索整个图形。
BLOB 和 CLOB在图形数据库中不能很好地工作。虽然图数据库擅长维护不同小数据实体之间的关系,但它们并非旨在将多个属性存储在一个节点上。虽然查询可以非常快速地从一个实体移动到另一个实体,但是从每个实体提取细节需要花费时间。
图形存储
图形数据处理系统可以使用多种存储机制。当存储是专门为类似图形的数据设计的时,它称为本机图数据库。使用本机图形存储的图形数据库在该过程的每个步骤中都针对图形进行了优化。这确保了通过连接的节点和关系可以有效地存储数据。
非本机图数据库使用其他系统存储数据。例如,有些使用关系引擎,将图形化数据存储在表中。其他人则使用宽列存储-一种NoSQL数据库。由于其设计,这些数据库将有关关系的信息保存在远离其关联节点的位置。这种非本机方法会导致处理速度变慢,因为存储层不是为图关联而设计的。其他系统使用键值存储或面向文档的数据库,将它们归为NoSQL系统类别。
不同类型的数据库图
一般而言,图形解决方案提供了最有效的分析数据的方法,当寻找可能的(隐藏的或明显的)连接时,这些数据是高度连接的。图形可以为某些数据提供更自然的视角。图形通常用作查找数据趋势的一种简便方法,因为数据以符号形式显示而不是以数字形式显示为表格。与数据表相比,图形允许更轻松地显示和解释复杂的数据。
不同种类的图形包括:
社会图:关注人与人之间的联系。这种类型的图是直观的并且被广泛使用。众所周知的“六度分离”概念可以与社交图进行映射。Twitter和Facebook使用社交图。
目的图:表达推理和动机,表达意图。
消费图:此图在零售行业中使用率很高,并跟踪每个客户的消费。也称为付款图。
兴趣图:映射个人兴趣,通常与社交图一起使用。
移动图:使用移动数据来创建各种图形和图表。
属性图:有向多重图。可以将对象附加到属性图的每个节点和边缘。它可以使用共享相同源节点和目标节点的多个平行边。平行边的使用可以帮助表达多个关系。
知识图: 谷歌以其
知识图谱而闻名,并利用其从多种资源中获取的信息来增强其搜索引擎的结果。信息会在搜索结果旁边显示给用户一个信息框。当Google Assistant和Google Home回答口头问题时,通常会使用知识图信息。虎图 和 Neo4j 还提供知识图。
有各种各样的数据图可用,并根据需要开发新的数据图。图形和图表有助于识别未知趋势并做出明智的决策。现代技术促进了可视化和呈现模式和趋势的新方法的爆炸式增长。图可用于表达有用信息的方式多种多样,仅受想象力的限制。TigerGraph的营销副总裁Gaurav Deshpande在最近的一次采访中表示DATAVERSITY?采访:
“只要有客户问我,我都会非常简单。当您听到“图”一词时,图等于关系。因此,每当您尝试进行关系分析时,都应该使用图形数据库。鉴于我们所有人,无论是作为人还是作为组织,还是作为实体,彼此之间的联系越来越紧密。随着时间的流逝,图数据库将变得越来越重要和重要。”
图数据库和AI
由于其设计, 知识图捕获并存储与人员,事物,过程,应用程序和数据以及将它们联系在一起的关系有关的信息。他们还提供了支持这种关系优势的证据。这些关系提供了上下文,这对于培训非常有帮助
人工智能。
知识图在操作方便性方面与数据仓库和数据湖不同。数据仓库对于静态业务洞察力项目很有用,但是知识图可以实时提供强大的洞察力,例如实时建议,知识共享和欺诈检测。这些特性使图形数据库和知识图成为训练人工智能时
深度学习技术的理想工具。在他的文章中展望Graph Technologies的2019年,丹·麦克雷里(Dan McCreary)写道:
“我试图告诉周围的每个人,基于图的规则引擎与深度学习算法生成的推理规则之间没有明确的二进制划分。深度学习规则更大,更难解释。为了拥有可解释的AI,我们需要将两个图形规则引擎与
机器学习系统结合在一起。做得很好的供应商具有明显的优势。”

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!