摘要:无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。歧义字段切分是中文自动分词研究中的一个“拦路虎”。在分析基于规则和基于上下文的歧义字段切分策略基础上,提出了一种改进的上下文相关歧义字段切分算法。并根据汉语中特殊的语法现象,给出了切分算法的辅助策略来对待切分字符串进行预处理。不仅提高了分词的精度,还加快了分词的速度。
原文链接:http://www.cqvip.com//QK/97941X/200605/21647013.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)