摘要:许多研究表明传统分类器在对海量不平衡数据分类时偏向多数类规则,因此,会导致少数类实例被错误判断为多数类.针对上述问题,提出了一种基于分解求解的学习分类算法.算法先对样本数据进行聚类,在聚类的基础上多次根据权值对数据集进行欠抽样,产生平衡的数据集,对每个平衡数据集进行验证同时提高误判样本的权值.综合考虑每个基分类器的错误率作为分类器的权值,选择分类效果较好的基分类器进行加权集成.实验表明算法有较高的少数类正确率以及少数类F度量,同时可以大幅减少训练集数量.
原文链接:http://www.cqvip.com//QK/95251X/201502/664450355.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)