2020/02/01
《
知识图谱:方法、实践与应用》读书笔记
《No.01》第1章 知识图谱概述(1.1~1.4)
1. 知识图谱概述
1.1. 什么是知识图谱
1.1.1. 知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。
1.1.2. 知识图谱由”节点”和”边”组成。
1.1.2.1. “节点”可以是实体的属性或抽样的概念。
1.1.2.2. “边”可以是实体的属性或实体之间的关系。
1.1.3. 最初想法: 是想把基于文本链接的万维网转化为基于实体链接的]语义网。
1.1.4. 知识图谱旨在从数据中识别、发现和推断事物与概念之间的复杂关系,是事物关系的可计算模型
1.1.5. 知识图谱涉及的技术: 知识建模、关系抽取、图存储、关系推理、实体融合等。
1.1.6. 知识图谱的应用: 知识表示、图数据库、自然语言处理、
机器学习等。
1.2. 知识图谱的发展历史
1.2.1. 知识图谱是下列这些技术互相影响和继承发展的结果
1.2.1.1. 语义网络
1.2.1.2. 知识表示
1.2.1.3. 本体论
1.2.1.4. Semantic Web(语意网络)
1.2.1.5. 自然语言处理等
1.2.2. Semantic Web是传统
人工智能与Web融合发展的结果
1.2.3. 知识图谱是Semantic Web的一种简化后的商业实现
1.3. 知识图谱的价值
1.3.1. 辅助搜索: 知识图谱可使得搜索引擎可以直接对事物进行索引和搜索。
1.3.2. 辅助问答: 人机问答交互中,背后都有海量知识图谱作为支撑。
1.3.3. 辅助大
数据分析: 用于增强数据之间的关联;用于文本中抽取实体和关系;辅助实体文本中的实体消岐(Entity Disambiguation)、指代消解和文本理解等。
1.3.4. 辅助语言理解
1.3.5. 辅助设备互连: 协助机器之间的对话。
1.4. 国内外典型的知识图谱项目
1.4.1. 早期的知识库项目
1.4.1.1. Cyc知识库: 由术语(Term)和断言(Assertion)组成。
1.4.1.2. WordNet: 最著名的词典知识库。由普林斯顿大学从1985年开始开发。
1.4.1.3. ConceptNet: 源于MIT媒体实验室的OMCS项目。
1.4.2. 互联网时代的知识图谱
1.4.2.1. Freebase: 是一个开放共享的、协同构建的大规模链接数据库。
1.4.2.2. DBpedia: 数据库版本的Wikipedia
1.4.2.3. Schema.org是从2011年开始,由Bing、Google、Yahoo等公司共同支持的语义网项目。
1.4.2.4. Wikidata: 构建一个免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库。
1.4.2.5. BabelNet: 类似WordNet的多语言词典知识库。
1.4.2.6. NELL: 卡梅隆大学开发的知识库。
1.4.2.7. Yago: 德国马普研究所研制的链接数据库。
1.4.2.8. Microsoft ConceptGraph是以概念层次体系为衷心的知识图谱。
1.4.3. 中文开放知识图谱
1.4.3.1. OpenKG: 一个面向中文域开放知识图谱的社区项目。促进中文领域知识图谱数据的开放与互联。
1.4.3.2. OpenBase.AI是OpenKG实现的类似于Wikidata的开放知识图谱众包平台。
1.4.4. 垂直领域知识图谱:电商领域知识图谱、医疗领域知识图谱、金融领域知识图谱。