工作期间的一个小课题,关于商业银行信用评分的计量模型。
本文研究思路如下:
利用计量经济学方法,构建横截面线性回归模型。选择财务指标、性质指标等恰当解释变量,对发债企业发行时的主体评级等级进行Logistic回归,以筛选、寻找出对金融企业信用等级有显著影响的变量。再利用样本外数据,利用模型进行预测,通过比较模型预测的信用等级与实际主体等级是否一致,来检验模型的实用性、泛化能力。
研究的框架:先只针对银行业建模、再尝试合并银行业和证券行业。
实习期间,我先建立商业银行的信用评分模型,后期建立了覆盖银行、证券两个行业的金融企业信用评分模型,整合两个行业有利于减少实践中工作量。两个信评模型在样本内的解释能力、样本外的预测能力均良好;但商业银行模型因变量是根据中债估值收益率确定的市场评级,相对公允;而金融业信评模型因变量依赖评级机构评级,有失公允,这主要是中债尚未公布证券公司债券YTM曲线,市场上没有较好的比较基准。
样本选择、数据来源:
选取2006年至2015年7月发行的商业银行债券(含普通债、次级债、混合资本债)、证券公司债作为全部金融企业债券总样本。若同一企业在同一年份发行多只债券,则仅保留一只。模型的因变量Y是发行时企业主体评级,分为四档:AAA、AA+、AA、AA-(A+也算入AA-)。解释变量中涉及财务数据,则取债券起息日前两个会计年度算数平均值[1],而股东结构、客户结构等非财务指标选择前一个会计年度末值。
需要注意的是本文所称的金融企业债券不包括保险公司债券,这是因为保险公司债券发行数目少,剔除数据不可得的样本后仅剩余十多只,且评级普遍是AAA,建模意义不大。同样不包括政策性金融债等。
总样本按恰当比例(如70%、30%)随机划分成两部分,一是训练集合(样本内),用于建模或训练,二是测试集合(样本外),用于检验模型泛化能力。
本文首先说明商业银行业的信用模型构建情况,见第三部分;再阐述覆盖银行、证券行业的金融企业信用评分模型结果,见第四部分;最后解释两个模型的含义,见第五部分。