数据介绍:
- 年份:2000-2024
- 范围:A股上市公司
- 三个版本:气候风险指数(未缩尾未剔除)、气候风险指数(已缩尾未剔除)、气候风险指数(已缩尾已剔除金融STPT)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
指标说明:参考文献并按如下步骤构建刻画气候风险的指标:
第一步,整理上市公司年报,并通过Python的Java PDFbox库提取所有文本内容,
以此作为后续特征词筛选的数据基础。
第二步,参考文献制定出年报中有关“气候风险”的词典(共计98个关键词)。
第三步,搜集文本数据后,使用Python中的jieba分词对年报文本进行分词处理,
生成年报总词频。
第四步,最后在分词后的文件中提取气候风险关键词出现的总频率,计算气候风险
关键词在年报中的词频占比再*100,得到气候风险指数指标。该指标值越大,表明企业面临的气候风险越大。同样地,转型风险指数、严重风险指数、慢性风险指数,这三个分项指标为对应词集的词频总和在年报中的占比再*100。
气候风险关键词分为以下三类:
1.转型风险关键词:节能、能源、清洁、生态、环境、转型、太阳能、升级、循环、利用率、核电、风电、天然气、增效、燃油、效率、再生、减排、环保、绿色、低碳、降耗、燃料、节水、光伏、高效、改造、油耗、电耗、能耗、风电、光伏、效能、集约。
2.严重风险关键词:灾害、地震、台风、海啸、旱涝、极端、恶劣、内涝、大风、我沙尘、飓风、霜冻、水灾、风暴、泥石流、滑坡、凌冻、雪灾、旱灾、洪涝、暴雨、龙只卷风、冰雹、洪灾、雨雪、冰冻、暴雪、冻害、干旱、旱情、强降雨、洪水、严寒、风沙。
3.慢性风险关键词:气候、天气、潮湿、水温、降温、寒冷、气温、降雨、温度、雨水、雨季、雨情、降水、阴雨、多雨、极寒、冬季、汛期、高湿、水情、水位、光照、缺水、高寒、寒潮、沉降、地下水、汛情、地表、蓄水。
气候风险总词频=转型风险关键词词频+严重风险关键词词频+慢性风险关键词词频。
气候风险指数=100*气候风险总词频/年报总词频。
转型风险指数=100*转型风险关键词词频/年报总词频。
严重风险指数=100*严重风险关键词词频/年报总词频。
慢性风险指数=100*慢性风险关键词词频/年报总词频。
注意事项:在参考文献中所给的关键词表中,风电、光伏这两个关键词是重复出现的。由于文献中说明的词集为98个词,若剔除以上重复关键词则词集中仅包含96词,这人会导致结果与文献描述不符,本资料为与原文保持一致,未剔除以上两个重复出现的关键词结果。
参考文献:
- 杜剑,徐筱或,杨杨.气候风险影响权益资本成本吗?——来自中国上市公司年报文本分析的经验证据[J].金融评论,2023,15(03):19-46+125.
代码:
数据量:
描述性统计:
结果数据