摘要:为了在仅有正例和未标注样本的训练数据集下进行
机器学习(positive unlabeled learning,PU学习),提出一种可用于PU学习的平均n依赖决策树(P-AnDT)分类算法。在构造决策树时,选取样本的n个属性作为依赖属性,在每个分裂属性上计算依赖属性和类别属性的共同影响;然后分别选用不同的输入属性作为依赖属性建立多个有差异的分类器并对结果求平均值,构造集成分类算法。最终通过估计正例在数据集中的比例参数p,使该算法能够在PU学习场景下进行分类。在多组UCI数据集上的实验结果表明,与基于贝叶斯假设的PU学习算法(PNB、PTAN等算法)相比,P-AnDT算法有更好更稳定的分类准确率。
原文链接:http://www.cqvip.com//QK/93231X/201607/669142286.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)