摘要:提出了一种基于序列的文本自动分类算法,该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权,对于不含有关键词的子模式,采用Markov模型来对其信号幅度进行估计,从而生成一个待分类文本的特征序列,在中文本分类实验中,可以达到83%的BEP值,此外,该算法在实际系统中容易实现。
原文链接:http://www.cqvip.com//QK/96857X/200204/6155758.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)