2001-2022年A股所有上市公司(不包括北交所)的年报“管理层讨论与分析”章节文本语料集,数据集共包括53000+有效文本,分为沪A、科创板、深A、创业板。
数据为txt文件,每一份文本保存为一个文件,文件命名格式为“股票代码-年份”。购买者可通过Python、Stata、R等语言对数据进行进一步处理,构造更多结构化数据。
MD&A文本语料极具研究价值,研究内容广泛,比如公司治理、审计、风险识别、证券投资、股价预测、公司金融等等。研究人员可通过自然语言处理技术提取和分析MD&A的情感分析、自利性归因、竞争和风险分析、关键词提取和蹭热点分析、可读性分析等等。欢迎会计学、
金融学、产业经济学等研究方向的学者购买使用。