摘要:新词/短语的识别是自然语言处理、信息检索和机器翻译等领域的一项基础研究.该文分析了已有短语抽取技术,并结合汉语特点,提出了基于概率统计技术和规则方法相结合的概念抽取方法.该方法包括高效的"二元语法"统计模型、统计算法、统计选词策略、丰富的规则知识和规则过滤算法.实验证明该方法适用于从大规模语料库中自动高效地发现新词/短语.
原文链接:http://www.cqvip.com//QK/95200X/200420/10800697.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)