上市公司股吧评论投资者情绪日度数据2010-2021:情感分析深度学习东方财富新浪贴吧
网络股票贴吧东方财富新浪股吧上市公司投资者情绪日度数据2010-2021:沪深主板中小企业科创业板
利用深度学习模型对网络股票贴吧的股评文本进行判断,整理出各上市公司股评的情绪和观点态度,并对此进行筛选、量化和统计。
数据期间:2010-2021年12月31日,日度每只股票的统计数据
数据范围:沪深所有上市公司,AB主板、中小企业板、科创板、创业板,4000多家上市公司
提供excel数据文件格式(数据文件压缩包里面包含
情感分析工具(snownlp、tushare、pandas、numpy、matplotlib等)的分析原理说明):
(400多MB的excel数据文件压缩包)
| Scode | Coname | Date | Tpostnum | Pospostnum | Negpostnum | Neupostnum | Readnum | Commentnum |
| 股票代码 | 公司简称 | 统计日期 | 帖子总量 | 正面帖子量 | 负面帖子量 | 中性帖子量 | 阅读数 | 评论数 |
| 688521 | 芯原股份-U | 2021-12-26 | 2 | 0 | 0 | 2 | 1493 | 5 |
| 688521 | 芯原股份-U | 2021-12-27 | 13 | 3 | 1 | 9 | 2927 | 14 |
| 688521 | 芯原股份-U | 2021-12-28 | 10 | 3 | 2 | 5 | 2443 | 12 |
| ...... | | | | | | | | |
股吧文章统计(交易时间)则根据交易时间统计了不同时间段内的发帖情况,这种计算方法可以直接反映交易时间内和非交易时间内投资者情绪对股市的影响。股吧文章统计采用机器学习方法对每个帖子的正面、负面和中性情感进行判断,并统计当天该上市公司所在股吧的正面、负面和中性帖子总量,这大大丰富了学者的研究维度。