摘要:商品评论信息的情感分析,可作为人们推荐商品和选择商品的一个重要手段。特征选择在情感分类中能够删除一些不必要的候选特征,从而提高分类效率、减小误差。为了考察中文语言和多类别情感分类环境下特征选择方法的效果,为情感分析多分类研究选取合适的特征选择方法,对特征选择进行了对比研究。在朴素贝叶斯多类分类器中,对中文描述的关于手机的五种星级评论数据集进行情感分类,选取文档频率、信息增益、互信息和卡方统计四种常用特征选择方式进行了对比实验和分析。实验结果表明,信息增益能够在特征维数特别小的情况下获得很好的性能,卡方统计能够获得普遍较好的性能,文档频率因为计算简单也能成为一种不错的选择,而互信息通常情况下不是一个好的选择。
原文链接:http://www.cqvip.com//QK/94832X/2016A02/670811670.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)