基于扩展特征向量空间模型的多源数据融合

442

收藏 2018-02-12

摘要：本体资源的扩充是自然语言处理的关键问题之一。传统的从单一数据源获取的信息其覆盖率较低，亟需建立一个整体的数据管理平台，对数据资源分类存储与整理。为此提出了AVP数据平台，构建AVP平台所面临的重要问题是多源数据的融合，即将不同来源的网站数据进行语义角色标注，对歧义词条进行识别判断，并最终归并到以义项为基本单位的数据仓库中；为解决多源数据融合的语义角色标注问题，给出了一种自动语义判歧方法。其基本思想是利用词条中的属性值对作为特征模板，并借助于属性值的共现概率，应用扩展向量空间模型对词条进行歧义识别。通过大量的实验对比可知，该系统在各方面均取得优异的成绩，所提出的算法能够很好地解决多源数据融合中的语义判歧问题。

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群