摘要:词义排岐是自然语言处理的重点和难点问题之一.基于语料库的统计方法已被广泛地应用于词义排岐.大多数的统计方法都受到数据稀疏的困扰,对于词义排岐而言,由于有大量同义词的存在,数据稀疏问题变得更为严重.充分利用"知网”这个知识源的特性,提出了一种基于义原同现频率的词义排岐方法,在很大程度上克服了数据稀疏问题.此外,该方法还避免了繁重的人工标注语料的过程,通过在一个约10万字的语料库上获得义原同现频率矩阵,并以此作为词义排岐的依据.实验表明,该方法对词义排岐具有较高的正确率.
原文链接:http://www.cqvip.com//QK/94913X/200107/5288561.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)