1、数据说明:
本数据分析两篇有代表性的金融领域中文情绪词典的构建方法及其词典数据,学者如需使用数据请引用原文。 一、姚加权,冯绪,王赞钧,纪荣嵘,张维.语调、情绪及市场影响:基于金融情绪词典,管理科学学报,2021.24(5),26-46
通过词典重组和深度学习算法构建了适用于正式文本与非正式文本的金融领域中文情绪词典,并基于词典构建了上市公司的年报语调和社交媒体情绪指标. 构建的年报语调指标和社交媒体情绪指标能有效地预测上市公司股票的收益率、成交量、波动率和非预期盈余等市场因素,并优于基于其他广泛使用情绪词典构建的指标. 此外, 年报语调指标和社交媒体情绪指标对上市公司的股价崩盘风险具有显著的预测作用. 为文本大数据在金融市场的应用提供了分析工具,也为大数据时代的金融市场预测和监管等活动提供了决策支持。 二、Bian S , Jia D , Li F ,et al.A New Chinese Financial Sentiment Dictionary for Textual Analysis in Accounting and Finance[J].Social Science Electronic Publishing [2024-03-06]. DOI:10.2139/ssrn.3446388.
使用HOWNET、DLUTSD、NTUSD三种词典作为初始词典,并搜集了在线路演纪要(online roadshow transcripts)、业绩说明电话会议纪要(earnings conference call transcripts)、IPO招股报告(lPO prspectus)及公司年报构建了基础语料库。基于算法和人工判断,使用多阶段剔除法来构建“中文金融情感词典CFSD”。