立即打开
2007-2024年上市公司网络水军发帖记录数据发帖信息时间内容水军行为互动数据等
一、数据说明:
网络水军指通过虚假评论、重复发帖等方式操控公众舆论及市场预期的灰色行为,其通过社交媒体(如东方财富股吧)密集传播误导性信息,已成为上市公司大股东操纵股价、干扰市场秩序的重要工具。这种行为不仅扭曲资源配置效率,更可能引发系统性金融风险。
本研究基于董天一等(2024)在《南开管理评论》提出的水军识别方法,对2007-2024年中国上市公司股吧发帖数据进行深度清洗与标注,构建首个覆盖310万+帖子的网络水军行为数据库,为学术界和监管部门揭示水军操纵市场的机制提供数据支持。
可用于研究:水军发帖量与股价异常波动的因果关系检验、大股东减持期间水军活跃度的动态变化、水军帖对散户交易行为的非对称影响、新《证券法》实施后水军行为模式的适应性演变等等。
水军识别方法:
基于董天一等(2024)的算法,水军判定标准如下:
跨贴吧重复发帖:同一账号在30天内于≥2个不同上市公司股吧发帖;
内容相似度阈值:发帖内容重复率≥70%(采用余弦相似度计算);
行为模式验证:排除正常投资者(如机构分析师账号、高频互动用户)。
二、数据范围:A股上市公司310万数据量
三、数据指标及预览:
1. 基础发帖信息
| 变量名 | 含义 |
| user_id | 用户ID(匿名化处理) |
| post_publish_time | 发帖时间(精确到秒) |
| stockbar_code | 股票代码(如600000.SH) |
| post_title | 帖子标题 |
| content | 帖子正文(含文本清洗后的结构化数据) |
2. 水军行为标识
| 变量名 | 含义 |
| is_water_army | 账号是否被标记为水军(1/0) |
| is_water_army_post | 帖子是否被判定为水军帖(1/0) |
| 水军数量 | 单只股票月度水军账号总数 |
| 水军发帖数量 | 单只股票月度水军发帖总数 |
3. 互动与传播指标
| forward | 帖子转发量 |
| comment_count | 评论数 |
| click_count | 点击量 |
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
栏目导航
热门文章
推荐文章
扫码加好友,拉您进群