哈萨克语“v＋n＋n”格式的歧义消解

577

收藏 2018-01-22

摘要：通过研究大量包含歧义的短语实例，分析计算机处理过程中遇到的短语结构边界判定的歧义问题。针对“v＋n＋n”这种常见的歧义格式，采用条件随机场模型进行消歧。结合哈萨克语的语言特点，提出基于哈萨克语词尾的类别及位置信息来构建特征模板的方法。以新疆日报（哈语版）2008年30天的数据统计为实验语料，加入消歧策略后名词短语和动词短语的识别准确率分别达到87.23%和97.46%；召回率分别达到80.12%和95.80%。实验结果表明，将提取出的特征引入到条件随机场模型后，系统的准确率、召回率和F值均有所提高。

原文链接:http://www.cqvip.com//QK/95200X/201412/663245823.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群