全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1646 1
2020-08-31
本体和语义注释。第1部分:什么是本体
本体和语义注释。第1部分:什么是本体
在大量信息中,机器和人类研究人员都需要工具来导航和处理它。将数据结构化和形式化为层次结构(例如树)可能会建立有效的机器处理所需的数据之间的关系,并使信息对于数据分析人员更具可读性。
但是,在更复杂的领域中,例如在自然语言处理中,概念之间的关系超出了简单的层次结构,并形成了类似于同义词库的网络。对于此类情况,研究人员将本体用作需要在域中共享信息的专家的常用词汇。
本体的应用
本体首先被定义为“领域中术语的明确形式规范及其之间的关系”(Gruber 1993),更具体地说,是“共享概念化的形式,显式规范”(Studer等人,1998)并被使用。在Noy和McGuinness(Noy and McGuinness 2001)所指定的许多应用中,包括以下应用:
?分析领域知识。
本体是提供有关用户需求的感兴趣领域的全面描述的工具
?在人员或软件代理之间共享对信息结构的共识。
例如,当医疗信息在多个不同的网站上发布时,就会看到这种情况。如果这些网站共享它们全部使用的术语的相同基础本体,则计算机代理可以从这些不同的站点提取和聚合信息,并使用它来回答用户查询或作为其他应用程序的输入数据。
?重用领域知识。
如果我们要构建一个大型的本体,我们可以集成一些现有的本体,这些本体描述整个大域的各个部分。相反,我们可以重用通用本体来描述我们感兴趣的领域。
?使域假设明确,??可以在有关域的知识发生变化时轻松地更改这些假设。
对代码中的世界进行硬编码的假设不仅难以发现和理解,而且难以更改,特别是对于没有编程专业知识的人。此外,明确的领域知识规范可以帮助学习者适应领域。
?将领域知识与运营知识区分开。
我们可以描述根据所需规范从其组件配置产品的任务,并实现一个独立于产品和组件本身进行此配置的程序。
本体结构
为了适当地使用,本体需要促进人与机器之间的通信(请参阅本体中指定的术语),或者甚至是人与机器之间的通信(Guarino 2009)。
本体的这种功能支撑着它的结构,因为本体作为对话语领域的正式描述取决于类,有时也称为概念。
例如,一类书籍代表所有书籍。特定书籍是此类的实例。桌上的等待您关注的机器学习书是编程手册类的一个实例。
另外,一个类可以具有 表示比超类更具体的概念的子 类。例如,我们可以将所有书籍的类别分为小说和非小说。或者,我们可以将所有书籍的类别分为成人和儿童书籍。
描述该概念的各种特征和属性的每个类概念的属性称为槽(有时是角色或属性)。
插槽 描述了类和实例的属性:傲慢与偏见是一种历史浪漫史;它由作者简·奥斯丁(Jane Austin)撰写。 在此示例中,我们有两个描述这本书的位置:位置类型具有Romans值,位置类型具有Jane Austin值。在班级,我们可以说班级Book的实例将具有描述其类型,文学趋势,作者等的位置。
插槽限制称为构面(Facets)或角色限制(Noy&
McGuinness 2001)。
图1.本体结构(图片取自OWL 2 Web本体语言基于RDF的语义(第二版)
本体与一组单独的类实例一起构成了知识库。实际上,在本体结束和知识库开始之间存在一条界限。
本体属性
在构建和使用本体时,请务必记住,本体是图,而不是树,并且它们之间的关系可能是多向的:
?插槽可能具有多个方面来描述变量的类型,值的数量和其他属性;
?类之间的关系可能有多种类型,例如“是-一个”,“一部分”,“位于-处于”等。
?一个班级可能有多个家长;
?实例可以具有多个类别
在接下来的部分中,我们将探讨更多实际问题,并分享一些从头开始构建自己的本体的实用技巧。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-9-1 11:34:12
领域中术语的明确形式规范及其之间的关系
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群