摘要:针对利用成对约束及互信息的特征选择算法通常忽略特征与特征之间的依赖性、对特征选择的因素考虑不够全面的问题,提出了一种基于属性依赖的混合约束半监督特征选择算法。主要工作包括:第一,根据相关系数确定特征之间的正依赖、负依赖关系构建属性成对约束矩阵M和C;第二,在原始数据上加入属性成对约束矩阵,使用样本成对约束作为监督信息计算每一维特征的得分并进行特征选择;第三,利用K-means聚类方法对特征选择结果进行聚类,分析特征选择的性能。与5种特征选择算法基于互信息的无监督特征选择(UFSMI)、Laplacian Score、多分类/聚类特征选择(MCFS)、谱特征选择(SPECFS)、线性判别分析(LDA)对比,在12种UCI数据集上的聚类平均准确率达到60.4%,最高准确率达到91.39%。理论分析及实验结果表明,该算法能够有效提高特征选择的准确率。
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)