摘要:自动文本分类技术涉及信息检索、模式识别及
机器学习等领域.本文以监督的程度为线索,综述了分属全监督,非监督以及半监督学习策略的若干方法-NBC(Naive Bayes Classofoer),FCM(Fuzzy G-Means),SOM(Self-Organixing Map),ssFCM(semi-supervisedFuzzy C-Means)和gSOM(guided Self-Organizing Map),并应用于文本分类中.其中,gSOM是我们在SOM基础上发展得到的半监督形式.并以Reuters-21578为语料,研究了监督程度对分类效果的影响,从而提出了对实际文本分类工作的建议.
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)