摘要:分类是近年来自然语言处理领域的一个研究热点.在分析了传统的分类模型后,文中提出了用N元语言模型作为中文文本分类模型.该模型不以传统的"词袋"(bag of words)方法表示文档,而将文档视为词的随机观察序列.根据该方法,设计并实现一个基于词的2元语言模型分类器.通过N元语言模型与传统分类模型(向量空间模型和Naive Bayes模型)的实验对比,结果表明:N元模型分类器具有更好的分类性能.
原文链接:http://www.cqvip.com//QK/94832X/200501/11444853.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)