全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
642 0
2023-10-31
上市公司管理层讨论与分析MD&A文本及情感分析2010-2022NLP自然语言处理

基于上市公司公告及交易数据整理计算
沪深、北京证券交易所A股上市公司
【2022】管理层讨论与分析 MD&A文本及情感分析
数据范围:2010-2022年,共 42,113 条观测值,所有A股上市公司,有dta和excel,面板数据可直接用!
指标如下
[1] MD&A文本:文本内容
[2] MD&A文本相似度(与上一年相比):关于中文文本相似度计算,首先使用结巴分词对文本进行处理,分词过程中去掉阿拉伯数字、标点符号、图片表格。接下来使用潜在语义索引(Latent Semantic Indexing, LSI)余弦相似度计算法,分别计算得出 MD&A文本相似度。
[3] 正面/负面词汇数量:个数
[4] 词汇/句子/文字总量:个数
[5] 情感语调1:(正面词汇数量-负面词汇数量)/词汇总量;数值越大,情感倾向越偏向正面积极。
[6] 情感语调2:(正面词汇数量-负面词汇数量)/(正面词汇数量+负面词汇数量);数值越大,情感倾向越偏向正面积极。
[7] 是否发布可持续经营非标意见:0否,1是


(2GB多的数据文件网盘链接)


f6ced3e744e632c742b3641b2ced309.jpg


6b2890ec20c537ac673b6d2c9cd66ba.jpg 52fda597ef0457e91f780c3d79cf68c.jpg


d7eaf005e34c2cf9e35b5b0ec912297.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群