摘要:不完全数据填充在数据处理和分析中起着重要的作用,并直接影响到
数据挖掘和知识发现的结果.大多数现存的数据填充算法有的不能处理混合属性的数据有的参数确定复杂度高.针对这些问题本文提出一种基于多个核函数的混合属性数据填充算法.首先,为了减少干扰和计算量,算法采用带修正线性单元的降噪深度信念网络对缺失数据进行特征提取和聚类.然后,为了减少算法的迭代次数,定义部分距离策略对缺失值进行初始化,这能使算法快速收敛并且提高准确性.最后,对连续和离散变量分别定义核函数,计算它们的概率密度,进而构造一个估计器对缺失值进行填充.实验结果表明,本文提出的算法,可减少参数确定复杂度和迭代次数.同时保证数据填充的精度.
原文链接:http://www.cqvip.com/QK/95659X/201707/672569843.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)