数据介绍:
- 年份:2001-2024
- 范围:A股上市公司
- 三个版本:资产搁浅风险(未剔除未缩尾)、资产搁浅风险(已剔除金融STPT未缩尾)、资产搁浅风险(已剔除金融STPT已缩尾)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件,含生成代码和分析评估代码
- 分析结果及论文图表均在帖子末尾的压缩包,可直接下载查看情况
计算说明:
参考《企业经济》肖建忠(2024)老师的做法,使用Python 中Jieba 开源组件对MD&A数据进行分词处理, 这也是目前国内最常使用的分词工具之一。 对于分词的颗粒度和新词的识别需要进行重新考量,因为不同的研究领域内容存在差异。 为了避免这一误差,本文通过阅读资产搁浅相关文章及主流媒体报道,并随即抽选10家公司MD&A文本,从这些语料中提取出与资产搁浅相关的特有词汇(如“产能过剩”“新旧动能转换”等)进行记录,与此同时,通过查阅相关文献找出资产搁浅相关财会术语(如“资产减值损失”等),将这些词汇进行整理、编辑,创建自定义词库,以防止Jieba 工具将一些专有名词进行错误拆分,从而影响后续指标计算的准确度。
参考文献
- 肖建忠.我国能源企业规模化过程中的资产搁浅风险研究——基于创造性破坏理论视角[J].企业经济,2024,43(08):2+5-16.DOI:10.13529/j.cnki.enterprise.economy.2024.08.001.
计算代码及评估代码:
结果数据