一种基于不平衡数据的聚类抽样方法

843

收藏 2018-01-01

摘要：许多研究表明传统分类器在对海量不平衡数据分类时偏向多数类规则,因此,会导致少数类实例被错误判断为多数类.针对上述问题,提出了一种基于分解求解的学习分类算法.算法先对样本数据进行聚类,在聚类的基础上多次根据权值对数据集进行欠抽样,产生平衡的数据集,对每个平衡数据集进行验证同时提高误判样本的权值.综合考虑每个基分类器的错误率作为分类器的权值,选择分类效果较好的基分类器进行加权集成.实验表明算法有较高的少数类正确率以及少数类F度量,同时可以大幅减少训练集数量.

原文链接:http://www.cqvip.com//QK/95251X/201502/664450355.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群