摘要:近年来,如何利用计算机自动、快速、准确地识别大量文本产品评论数据情感倾向是自然语言处理领域关注的重点话题。使用数据抓取软件,抓取亚马逊官网华为honor畅玩版4X手机在线评论进行实验,实验中按照一定的语法规则将每条完整的在线产品评论分成若干子句,识别其中有效子句,提取有效子句评论中多种特征进行组合,然后选用C4.5决策树
机器学习法来识别子句的情感倾向,并对多组实验结果进行分析对比。实验结果表明,选择子句中情感词数量和否定词数量作为特征组合时,加权后模型的查准率和查全率均达到96%;程度副词和特殊符号对模型的作用比较微弱,仅有1%的影响;程度副词的作用略优于特殊符号。
原文链接:http://www.cqvip.com//QK/90453A/201705/672142373.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)