基于python机器学习深度学习实现股市评论情感分析完整程序源代码+数据+说明
在国内这样一个非有效的市场中,分析投资者的情绪似乎更有意义。这里我们利用标注语料分析股评情感,利用分析结果构建指标,之后研究指标与股市关系。可以按以下顺序运行代码:python model_ml.pypython compute_sent_idx.pypython plot_sent_idx.py数据数据位于data目录下,包括三部分:标注的股评文本:这些数据比较偏门,不是很好找,这里搜集整理了正负语料各4607条,已分词。从东财股吧抓取的上证指数股评文本:约50万条,时间跨度为17年4月到18年5月。东财上证指数吧十分活跃,约7秒就有人发布一条股评。上证指数数据:直接从新浪抓取下来的。模型情感分类模型也是文本分类模型,常用的包括机器学习模型与深度学习模型。model_ml.py:机器学习模型,对比测试了8个模型。model_dl.py:深度学习模型,对比测试了3个模型。结果在经过情感分析、指标构建这两个流程之后,我们可以得到一些有趣的结果
例如看涨情绪与股市走势的关系。
我们使用的看涨指标公式为:
经过处理之后,“看涨”情绪与股市走势的关系可以描画出来:
这里只展示诸多关系中的一个。
# 总结
这份代码仅为了演示如何从互联网中提取投资者情绪,并研究情绪与股市的关系。