基于义原同现频率的汉语词义排歧方法

1221

收藏 2017-10-25

摘要：词义排岐是自然语言处理的重点和难点问题之一.基于语料库的统计方法已被广泛地应用于词义排岐.大多数的统计方法都受到数据稀疏的困扰,对于词义排岐而言,由于有大量同义词的存在,数据稀疏问题变得更为严重.充分利用"知网”这个知识源的特性,提出了一种基于义原同现频率的词义排岐方法,在很大程度上克服了数据稀疏问题.此外,该方法还避免了繁重的人工标注语料的过程,通过在一个约10万字的语料库上获得义原同现频率矩阵,并以此作为词义排岐的依据.实验表明,该方法对词义排岐具有较高的正确率.

原文链接:http://www.cqvip.com//QK/94913X/200107/5288561.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群