基于进化多目标优化的不平衡二分类算法研究
分类作为机器学习和
数据挖掘的重要研究领域,一直受到研究者广泛的关注。其中,在分类问题中二分类问题研究的最为广泛。
在二分类问题中,现有的很多算法大多关注的是平衡二分类。然而在实际应用中,收集到的数据通常在两个类别之间存在不平衡,这种情况被称为不平衡二分类问题。
对此有很多学者对不平衡二分类问题进行了研究并提出了AUC等常见不平衡二分类评估准则。随着这些评估准则的出现使得不平衡二分类应用更加广泛,但是随着应用的推广,由于实际问题的特殊性也迎来了新的挑战。
如行人检测,用户感兴趣的不是AUC,而是部分AUC(pAUC),传统方法以AUC为优化目标,这些方法难以直接优化pAUC;此外,像在生物领域中训练基因识别器时,训练样本中大部分是无标签样本,只有少量正样本,即PU学习。近年来,研究者提出了很多pAUC优化和PU学习算法,然而这些算法大多采用了传统优化技术,在算法中目标函数需要满足一定假设条件,例如凸或连续。
近些年,进化算法作为一种元启发式算法,已成功地解决了许多复杂的优化问题,且有着良好并行性、较强全局搜索能力且不需要给定函数的假设条件。基于此 ...