全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
791 0
2024-07-14

上市公司管理层讨论与分析MD&A文本及情感分析



参考文献:
[1]于挺,刘嘉庆.新质生产力背景下管理层语调与企业双元创新研究[J].会计之友,2024,(13):150-157.
[2]康进军,刘娜,范英杰.MD&A语调、融资约束与企业创新[J/OL].会计之友,1-9[2024-07-14].
[3]林乐,谢德仁.分析师荐股更新利用管理层语调吗?——基于业绩说明会的文本分析[J].管理世界,2017,(11):125-145+188.


基于上市公司年报和半年报数据整理计算
沪深、北京证券交易所A股上市公司

数据范围:2010-2023年,共 42,113 条观测值
数据对象:沪、深、北证券交易所A股上市公司
数据格式:dta和excel,面板数据可直接用
数据大小: 超过1G,放在百度网盘
指标如下:
  • [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。
  • [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。
  • [统计截止日期]
  • [行业代码]
  • [行业名称]
  • [管理层讨论与分析内容]
  • [与前一年相比文本相似度] - 如统计截止日期为XXXX-06-30对比的是前一年的6-30的半年报,统计截止日期为XXXX-12-31对比的是前一年的12-31的年报。关于中文文本相似度计算,首先使用结巴分词对文本进行处理,分词过程中去掉阿拉伯数字、标点符号、图片表格。接下来使用潜在语义索引(Latent Semantic Indexing, LSI)余弦相似度计算法,分别计算得出 MD&A文本相似度。
  • [正面词汇数量]
  • [负面词汇数量]
  • [词汇总量]
  • [句子数量]
  • [文字数量]
  • [情感语调1] - 计算公式为:(正面词汇数量-负面词汇数量)/词汇总量;数值越大,情感倾向越偏向正面积极。
  • [情感语调2] - 计算公式为:(正面词汇数量-负面词汇数量)/(正面词汇数量+负面词汇数量);数值越大,情感倾向越偏向正面积极。
  • [管理层盈利预测类型编码] - 盈利预测类型编码:1=首亏、2=续亏、3=扭亏、4=转亏、5=续盈、6=预增、7=大增、8=略增、9=大降、10=预减、11=略减、12=略降、13=不确定、14=其他、15=增亏、16=减亏
  • [管理层盈利预测类型] - 业绩预告类型为转亏、续亏、扭亏、续盈、大增、大降、略增、略降、不确定等
  • [管理层盈利预测发布日期] - 指发布业绩预告公告的日期
  • [管理层盈利预测偏差] - 计算公式为:(t年的预测净利润值-t年的实际净利润值)/|t年的实际净利润值|;如果t年的预测净利润值是个具体的数值,则取该数值为预测净利润值,如果是个区间估计,则取上下限均值作为预测净利润值(若上下限其中一个为空,则字段为空)
  • [管理层盈利预测修正次数] - 0=业绩首次预告;1=业绩第一次修正;2=业绩第二次修正,修正次数依次递推
  • [审计意见类型] - 审计后审计事务所对年报内容出具的意见类型。2003年前:1、标准无保留意见2、保留意见3、否定意见4、拒绝发表意见5、无保留意见加说明段6、保留意见加说明段7、否定意见加说明段2003年后:1、标准无保留意见2、保留意见3、否定意见4、无法发表意见5、无保留意见加事项段6、保留意见加事项段
  • [是否发布可持续经营非标意见] - 0:否;1:是。审计意见中是否由于可持续经营问题被出具非标意见。



QQ截图20240714195211.jpg
  




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群