摘要:提出了一种基于句子级对齐的双语语料库的英汉词对齐方法.它建立在句对的集合表示形式的基础上,通过最小求交模型实现词对齐.使用倒排索引表和集合运算实现高效的最小求交算法.在对齐过程中引入高频干扰词表以提高召回率.实验结果表明,该方法优于使用共现互信息的词对齐和使用双语词典的词对齐方法.
原文链接:http://www.cqvip.com//QK/95659X/200407/10340115.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)