摘要:基于
机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性.该文使用另外一种维吾尔文自动分词方法dme-TS.dme-TS中,不再以词间空格作为切分标记提取词特征,而是用一种组合统计量(dme)来度量文本中相邻单词之间的关联程度,并以dme度量的弱关联的词间位置作为切分点,提取对学习算法真正有意义的语义词特征.实验结果表明,用dme-TS提取文本特征可以降低特征空间的维度,同时也能有效的提高传统以单词为特征的分类算法的性能.http://www.cqvip.com//QK/96983X/201404/662124119.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)