摘要:半世纪以来自然语言处理(NLP)研究取得两点重要认识和三大重要成果,即认识到:(1)对于句法分析,基于单一标记的短语结构规则是不充分的;(2)短语结构规则在真实文本中的分布呈现严重扭曲.换言之,有限数目的短语结构规则不能覆盖大规模语料中的语法现象.这与原先的预期大相径庭.NLP技术的发展在很大程度上受到这两个事实的影响.从这个意义上说,本领域中称得上里程碑式的成果是:(1)复杂特征集和合一语法;(2)语言学研究中的词汇主义;(3)语料库方法和统计语言模型.大规模语言知识的开发和自动获取是NLP技术的瓶颈问题.因此,语料库建设和统计学理论将成为该领域中的关键课题.
原文链接:http://www.cqvip.com/Main/Detail.aspx?id=10979021
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)