摘要:基于神经网络的中文文本分类需要解决的核心问题是特征的选择问题。特征选择涉及选择哪些特征和选择的特征维度两个问题。针对上述问题,提出了信息增益(IG)与主成分分析(PCA)相结合的特征选择方法。通过实验比较分析了不同特征选择方法与特征维度对分类性能的影响,证明了该特征选择方法在基于神经网络的中文文本分类中的优越性,并得出
神经网络的特征输入维度在200左右的时候分类性能最佳。http://www.cqvip.com//QK/93231X/200607/22103457.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)