摘要:针对人物关系抽取中的效率与准确性问题进行了研究,提出一种基于信息增益的轻量级Web人物社会关系提取方法。它通过计算初始关系元组的关系描述词的信息增益值进而确定元组上下文位置并据此创建相应的关系抽取模板,最后利用模板实现了Web的人物关系自动提取。针对中文语义上存在相似性的问题,引入了基于《同义词词林》与基于知网的人物关系描述词扩展方法。对于某一句子内包含多个人物实体且存在多种人物关系的情况,提出了一种基于模板上下文信息增益值模糊匹配的方法来抽取符合特定人物关系的人物实体。实验结果证明该方法的平均准确率为89.92%,平均召回率为84.64%。基于信息增益的Web社交网络人物关系抽取方法能有效地完成实时语料中的关系抽取任务。
原文链接:http://www.cqvip.com//QK/93231X/201608/669521373.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)