摘要:知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外.树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中.我们的汉语统计句法分析模型从3个方面融合潜在的丰富语言知识:1)重新标注树库中的非递归名词短语和非递归动词短语;2)设计新的中心词映射表;3)引进上下文配置框架以更具体地描述二元依存结构.由于融合了以上三种潜在语言知识,模型的F1值提高了2.37%,完全匹配正确率提高了5.36%.
原文链接:http://www.cqvip.com/Main/Detail.aspx?id=15596502
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)