上市公司年报语气/积极语调/消极语调指标
持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据
【原创整理,严禁转载,转载必究】
参考文献
[1]曾庆生,周波,张程,等.年报语调与内部人交易:“表里如一”还是“口是心非”?[J].管理世界,2018,34(09):143-160.
[2]王华杰,王克敏.应计操纵与年报文本信息语气操纵研究[J].会计研究,2018,(04):45-51.
计算说明
1)参照曾庆生等(2018)的研究,以Loughran 和Mcdonald(2011)提供的金融情感英文词汇列表为基础,依据有道词典和金山词霸对所有的英文词汇进行了翻译,如果一个英文词汇对应多个中文单词,都予以了保留,确保词汇能够最大限度涵盖中文财务报告中的语调情感词汇,最终词汇列表包括 22549 个消极词、5934 个积
极词以及1363个停用词(停用词为“的”等无意义或者无情感词汇)。创建中文词汇列表之后,采用分
词包围 Python 开放源“结巴”中文分词模块对年报全文文本进行自动分词,然后进行词频统计(统计
时考虑到语意反转现象,若积极词前紧跟着否定词,则统计为消极词,反之亦然)。
构建指标:
tone 该年报内积极词汇数与消极词汇数之差占年报总词汇数的比例
postone 积极语调:该年报内积极词汇数占年报总词汇数的比例
negtone 消极语调:该年报内消极词汇数占年报总词汇数的比例
tone_2 (积极词汇数-消极词汇数)/(积极词汇数+消极词汇数)
2)参照王华杰和王克敏(2018)的研究,使用台湾大学制作的《中文情感极性词典》,将诸如积极、进步、高效等积极属性词语集作为积极情绪词语列表;将诸如低迷、暗淡、不利等消极属性词语集作为消极情绪词语列表。构建指标:
tone 该年报内积极词汇数与消极词汇数之差占年报总词汇数的比例
postone 积极语调:该年报内积极词汇数占年报总词汇数的比例
negtone 消极语调:该年报内消极词汇数占年报总词汇数的比例
tone_2 (积极词汇数-消极词汇数)/(积极词汇数+消极词汇数)
数据说明
样本选择:全部A股2007-2022年数据
包含两个版本:一份未剔除、一份剔除金融和ST、*ST或PT
注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
并对连续型变量进行了1%和99%分位数的缩尾处理
每个压缩包都附有初始数据,计算代码,参考文献和最终数据
赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。
再额外赠送超值上市常用分组指标:是否 ST或PT、是否金融业、资产负债率是否大于1、是否沪深A股、
是否北京A股、行业名称、行业代码、所属省份代码、所属省份、所属城市代码、所属城市、分东部地区、中部地区、西部地区、是否高科技行业、是否重污染行业
数据截图
分年份数据量统计
缩尾后的描述性统计