摘要:利用微博平台的API数据端口爬取微文数据,通过分词技术、去停用词等对原微文进行数据预处理,并基于TF-IDF计算文本特征权重后构建向量空间模型,使用文档频率和信息增量相结合的方法对特征向量进行降维,最后基于多种文本分类方法的对比研究构建最优情绪分类器。研究表明:基于
机器学习的文本分类技术适用于较大语料库的微博研究。在进行细粒度情绪分类时,支持向量机的分类效果较好。
原文链接:http://www.cqvip.com//QK/90226X/201402/48570229.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)