摘要:提出一种基于均矢量相似性的机器学习样本集分割方法(MSSS),根据样本集中每个样本矢量与均矢量之间的余弦相似性,将样本划分成训练集和测试集.为评价MSSS方法性能,分别用随机分割法(RSS)和MSSS方法,按不同比例划分来自UCI的4个数据集,对产生的训练集一测试集进行Hotelling T~2检验;另外,采用得到的训练集对分类BP神经网络进行训练,以相应的测试集测试神经网络.研究结果表明:对用RSS划分4个数据集产生的训练集一测试集进行Hotelling T~2检验,发现均存在F值超出界值的现象,而MSSS均未出现;使用MSSS训练的神经网络所产生的训练-测试误差差异、准确率差异均比使用RSS训练的
神经网络所产生的小,说明用MSSS划分产生的训练集与测试集的一致性比用RSS划分产生的好.
原文链接:http://d.wanfangdata.com.cn/Periodical/zngydxxb200906029
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)