请参考:
计算违约概率的数学工具
从统计学角度看,可以进行违约概率分析的数学工具主要包括判别分析、逻辑回归、主成分分析和神经网络等四种类型。
(1) 判别分析
判别分析是一种度量特定范畴内因子重要程度的分类方法。如检验引起客户违约的主要因素,只要能确定所有可能的影响因素,模型就可以使用这些因素在违约主要因素和次要因素之间做出判别分析。在错判概率最小或错判损失最小的前提下,建立一个计算准则,对给定样本,依据该准则判断是否违约。
对客户违约概率的计算属于多元判别分析。具体而言,将已有的客户违约数据对应相应客户信用分类的样本进行分类,对各组样本选择相应的自变量进行统计分析,求出合并协方差矩阵。再利用新样本数据中相应的变量代入公式求得马氏距离,距离最小的表示新样本数据与该类样本最为相似,由此归入此类(违约或不违约),并根据距离远近求出新客户一年期违约概率。
目前,国际通行的统计工具软件,如SAS、SPSS、Statistcs等都能够提供判别分析功能,可以根据用户需要定制前端更加友好的界面,从而更直接地进行违约概率的计算和判别。
(2) Logistic逻辑回归
此类模型是计算违约概率的传统工具,其基本原理是对已有客户违约和不违约样本0-1分类,根据业务规则,选取一定指标作为解释变量。取得这些已有先验数据的样本后,将P设为客户违约概率,(1-P)为客户不违约的概率,将比率P/(1-P)取自然对数得Ln(P/(1-P)),即对P作LOGIT转换,由此建立线形回归方程进行分析。实践表明,这种模型对判断二分类变量的关系有着良好效果。而违约事件正好属于二分变量范畴,因此这种模型在计算PD过程中有着很好的适用性。
(3) 主成分分析
主成分分析是“空间旋转”构造原变量的线形组合,产生一系列互不相关的新变量,从中选出少数主要变量,使之包含尽可能多的原变量信息,从而使得用这几个新变量代替原变量分析问题和解决问题成为可能。当研究对象确定后,变量中所含信息的大小通常用该变量的样本方差来度量。在现实经济生活中,影响违约的因素很多,如企业经营状况、财务状况、还款意愿、担保品价值、政府干预等,这些因素对违约的发生有着不同的贡献,对违约概率的分析没有必要考虑所有影响因素,运用主成分分析可以从变量的相互影响关系中萃取出主要因素,并根据各要素所含信息的多少确定变量关系和计算方法。
统计实验表明,该方法在计算PD时,如单独使用,往往造成模型不健壮,即参数缺乏稳定性,但它可以十分有效地确定解释变量集合,因此在模型建立的前期发挥着重要作用,若与其他模型结合,会收到良好效果。
(4)神经网络分析
神经网络模型是近年发展起来的一种信用分析模型。它与非线形判别分析十分相似,扬弃了危机预测函数的变量是线形并且相互独立的假设。神经网络模型能深入挖掘预测变量之间“隐藏”关系,正在成为非线性违约预测函数的重要根据。
在人脑中,穿梭于神经元间的电子信号是受到抑制还是得到激活,取决于神经元网络过去学习的内容。同样,采用硬件或是软件构建的人工神经元与生物神经元的行为方式基本相似。神经网络的行为来源于相互联系的单元的集合性行为。神经元之间的关联并不是固定不变的,而是可以通过神经网络与外界间的相互作用所产生的学习过程进行相应的修改。
三、违约概率模型的比较研究
(1) 古典违约分析
银行最初的信用违约概率分析更像一个专家系统,这种分析过程多是依赖于训练有素的专家的主观判断的定性分析系统,一个信贷人员在其职业生涯中,积累了这种信用分析经验,进而成为专家。在信用分析模型不甚发达的时代,这些信贷专家的经验判断对银行来说是弥足珍贵的,他们对贷款的审核过程很有借鉴意义。其评估过程大致如下:基于以前客户贷款违约情况资料的分析,将客户的违约情况大致分为几种情况,如很低、低、中、高、很高五个数量级,然后对新贷款客户进行全方位的判断。
尽管这种判断方式无法给出具体的违约概率值,但这种客户违约判断方式在银行发展早期还是相当有效的,也在一定程度上控制了信用风险,特别像财务比率的分析思想,直到现在都是违约概率模型不可或缺的组成成分。然而,古典违约分析过多依赖信贷专家的主观判断,在实际应用中精确度和一致性很难保证。
(2)奥特曼模型
Altman教授创立的Z模型是建立在单指标比率水平及绝对水平基础之上的多变量模型。这些数值经过综合计算产生的衡量标准能有效地区分违约与非违约客户。这种标准之所以有效是因为通过对已有的违约客户和非违约客户的相关数据样本进行统计分析,两组的组内方差较小,组间方差很大,样本显著性非常高,即违约客户所呈现的各种比率和财务趋势与那些财务基础良好的公司截然不同。银行利用这种模型进行判断,当贷款申请者的评分濒于临界点时,要么拒绝其申请,要么对其进行详细审查。通过这种判断方式,就可以很自然的通过对客户相关指标得出恰当的分类,从而对客户违约概率进行大致估判。奥特曼多变量模型是以财务比率为基础的,在该模型基础上后来又产生了很多变形,但基本的Z模型沿用至今,并且已经拓展应用于私人企业、非制造企业以及上市公司等广泛领域。
迄今,奥特曼模型在国外商业银行得到广泛应用。ALTMAN选择的单指标是经过大量样本分析后确定的,具有相当的精准性和稳定性。这些指标包括衡量公司的获利能力、流动能力、偿债能力的各种比率。对于缺乏内部评级系统的金融机构或客户系统性风险无法界定时,可以采用比较简练的奥特曼模型。
(3)决策树模型
决策树模型在判断客户违约概率上也有广泛应用。在决策树模型中,按照申请者特征,由重要到次要,对不同指标连续地分割。这样一个客户的样本空间可被分成若干细小的模块,例如借款人可分成拥有住宅及租赁住宅两大类。拥有住宅者又可以再分成不同的收入水平,每个收入水平上的申请又可继续分成在现有地点居住两年以上者及以下者。这样整个样本空间就被分割成互不交叉的“小组”。该模型总的原则就是将整体按照不同的违约状况不断分割,接着即可根据每个“小组”的违约概率进行信用决策。
决策树模型原理和操作比较简单,系统开发难度较小,主要应用于没有成熟的统计、计量分析能力且有相当丰富的客户样本。此外,决策树模型能比信用计分模型更有效地处理变量之间的相互作用。即使在一些变量缺失的情况下,决策树模型也能产生信用分数。其不足之处在于,对一些最底层的“细胞”,可能只有极少的数据,因而不能满足统计所需的样本规模要求。
(4)宏观迁移模型
该模型由麦肯锡公司提出,属于多因素分析模型。它在宏观经济因素,如失业率、GDP增长率、长期利率水平、汇率、政府支出及总储蓄率等一定的情况下,模拟了违约概率的联合分布。该模型将违约概率、转移概率和宏观经济状况紧密结合起来,当经济恶化时,违约和降级就会增加;经济强劲时,情况相反。麦肯锡提出信贷组合理论,直接将信用等级转移概率与宏观因素的内在关系模型化,并通过制造宏观“冲击”来模拟转移概率矩阵的跨时演变。
转移矩阵中每个单元显示的是一个特定交易对手在期初被评为一定信用级别而在期末移往其他级别的概率。宏观因素用变量y来表示,则转移概率:
P=f(Y)        
上式中,P 反映客户在T期由等级C转移到等级D的概率,宏观指标Y可看作时间t的i种宏观变量集合(X)及非系统冲击或经济体系创新(V)所共同形成的函数。
Y=g(X,V) 
如GDP增长率、失业率以及其他宏观变量可视为由历史状况决定(如滞后的GDP增长率),而且对其自身所受冲击()敏感,则有:
X=H(X, X,……, )       
可将不同模型的具体形式用于上述表达式,以改善模型的拟合度。然后,就可以确定评级为C级贷款在下一年内移到D级的概率。
   P=f(X;V, ) 
有了各信用级别转移概率就可以进一步求得相应的未来年度的违约概率。 
(6)违约过滤器
近年来,IQ Financial公司成功开发了以神经网络分析技术为核心的违约概率模型,称之为违约概率器,该模型与非线性派别分析十分相似,它扬弃了违约函数变量是线性且相互独立的假设,能够深入挖掘预测变量之间的“隐藏”的相关关系。违约概率器设置了系统自学习功能,学习方式包括有导师型和无导师型,学习方式之一是多层感知器:输入层、隐蔽层和输出层。如果神经网络难以达到目标准确率,则灵活增减隐蔽层数目,通过有计划地增减隐蔽层,可解决神经网络技术存在的许多疑难问题。 
总之,当前违约概率模型发展的特点是:运用现代金融理论和分析技术,从定性分析转向定量分析;从计分卡向模型化形式转变,并寻求二者的有机结合;从单项贷款分析转化组合分析,从盯住帐面价值转向盯住市场价值;描述风险的变量从离散型转向连续型;尝试考虑宏观周期对信用风险的影响;广泛汲取相关领域的最新研究成果,如保险精算理论、神经网络等,并运用计算机大容量处理技术。
不过,现代违约概率模型仍存在一些问题:首先,各类模型均存在不同程度的技术局限,运行效果尚不够稳定;其次,模型风险作为银行操作风险的一个重要方面不容忽视,数据可能过时、偏差和错误,实际业务也可能与模型的前提假设相互脱离,这些都可能造成模型风险;第三,模型参数估计复杂和繁重,系统维护运行的成本较高;第四,模型所需数据输入量大,这在实际业务操作中往往难以满足,因而形成空白或残缺,影响计算精度。