2020/02/03
《
知识图谱:方法、实践与应用》读书笔记
《No.03》第2章 知识图谱表示与建模(2.1~2.2)
2. 知识图谱表示与建模
2.1. 什么是知识表示:
2.1.1. MIT AI实验室的R.Davis定义了知识表示的五大用途或特点
2.1.1.1. 客观事物的机器标示(A KR is a Surrogate),即知识表示首先需要定义客观实体的机器指代或指称。
2.1.1.2. 一组本体约定和概念模型(A KR is a Set of Ontological Commitments),即知识表示还需要定义用于描述客观事物的概念和类别体系。
2.1.1.3. 支持推理的表示基础(A KR is a Theory of Intelligent Reasoning),即知识表示还需要提供机器推理的模型与方法。
2.1.1.4. 用于高效计算的数据结构(A KR is a medium for Efficient Computation),即知识表示也是一种用于高效计算的数据结构。
2.1.1.5. 人可理解的机器语言(A KR is a Medium of Human Expression),即知识表示还必须接近于人的认知,是人可理解的机器语言。
2.1.2. 知识图谱时代的知识表示方法已经发生了很大的变化
2.1.2.1. 现代知识图谱受到规模化扩展的影响,通常采用以三元组为基础的较为简单实用的知识表示方法,并弱化了对强逻辑表示的要求;
2.1.2.2. 另一方面,由于知识图谱是很多搜索、问答和大数据分析系统的重要数据基础,基于向量的知识图谱表示使得这些数据更易于和深度学习模型集成,使得基于向量的知识图谱表示越来越受到重视。
2.2.
人工智能早期的知识表示方法
2.2.1. 一阶谓词逻辑
2.2.1.1. (或简称一阶逻辑)(First Order Logic)是公理系统的标准形式逻辑
2.2.1.2. 在一阶逻辑里,可以用谓词和变量表示知识
2.2.1.3. 一阶谓词逻辑优点
2.2.1.3.1. 结构性。能把事物的属性以及事物间的各种语义联想显式地表示出来。
2.2.1.3.2. 严密性。有形式化的语法和语义,以及相关的推理规则。
2.2.1.3.3. 可实现性。可以转换为计算机内部形式,以便用算法实现。
2.2.1.4. 一阶谓词逻辑缺点
2.2.1.4.1. 有限的可用性。一阶逻辑的逻辑归结只是半可判定性的。
2.2.1.4.2. 无法表示不确定性知识。
2.2.2. 霍恩子句和霍恩逻辑
2.2.2.1. 霍恩逻辑(Horn Logic)是一阶逻辑的子集。
2.2.2.2. 基于霍恩逻辑的知识库是一个霍恩规则的集合
2.2.3. 语义网络
2.2.3.1. 语义网络又称联想网络,它在形式上是一个带标识的有向图。
2.2.3.2. 图中“节点”用以表示各种事物、概念、情况、状态等。
2.2.4. 框架
2.2.4.1. 框架是一种描述对象(事物、事件或概念等)属性的数据结构。
2.2.4.2. 在框架理论中,类是知识表示的基本单位。每个类有一些槽,每个槽又可分为若干“侧面”。一个槽用于表示描述对象的一个属性,而一个侧面用语表示槽属性的一个方面,槽和侧面都可以有属性值,分别称为槽值和侧面值。
2.2.5. 描述逻辑
2.2.5.1. 描述逻辑是一阶逻辑的一个可判定子集
2.2.5.2. 描述逻辑可以被看成是利用一阶逻辑对语义网络和框架进行形式化后的产物。