数据介绍:
- 年份:2000-2023
- 范围:A股上市公司
- 三个版本:气候风险指数(未缩尾未剔除)、气候风险指数(已缩尾未剔除)、气候风险指数(已缩尾已剔除金融STPT)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
参考文献并按如下步骤构建刻画气候风险的指标:
- 第一步,整理上市公司年报,并通过Python的Java PDFbox库提取所有文本内容,以此作为后续特征词筛选的数据基础
- 第二步,参考文献制定出年报中有关“气候风险”的词典(共计98个关键词)
- 第三步,搜集文本数据后,使用Python中的jieba分词对年报文本进行分词处理,生成年报总词频
- 第四步,最后在分词后的文件中提取气候风险关键词出现的总频率,计算气候风险关键词在年报中的
词频占比再*100,得到气候风险指标。该指标值越大,表明企业面临的气候风险越大
气候风险关键词:节能、能源、清洁、生态、环境、转型、太阳能、升级、循环、利用率、核电、风电、天然气、增效、燃油、效率、再生、减排环保绿色、低碳、降耗、燃料、节水、光伏、高效、改造、油耗、电耗、能耗、风电、光伏效能、集约、灾害、地震、台风、海啸、旱涝、极端、恶劣、内涝、大风、沙尘、飓风、霜冻、水灾、风暴、泥石流、滑坡、凌冻、雪灾、旱灾、洪涝、暴雨、龙卷风、冰雹、洪灾、雨雪冰冻、暴雪、冻害、干旱、旱情、强降雨、洪水、严寒、风沙、气候、天气、潮湿、水温、降温寒冷、气温、降雨、温度、雨水、雨季、雨情、降水、阴雨、多雨、极寒、冬季、汛期、亮湿、水情、水位、光照、缺水、高寒、寒潮、沉降、地下水、汛情、地表、蓄水气候风险指数=100*气候风险总词频/年报总词频
处理软件:原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式
参考文献:
- 杜剑,徐筱或,杨杨.气候风险影响权益资本成本吗?——来自中国上市公司年报文本分析的经验证据[J].金融评论,2023,15(03):19-46+125.
代码:
数据量:
描述性统计:
结果数据