2013年 第 24 期
总第 676 期
财会月刊(下)
理论与探索
公司财务预警Logit模型指标选择与实证分析

作  者
郑玉华(博士) 崔晓东(博士)

作者单位
(南京信息工程大学经济管理学院 南京 210044 南京晓庄学院经济与管理学院 南京 211171)

摘  要

【摘要】 在利用Logit模型对企业的财务困境或违约进行预测时,财务指标的选择是非常关键的环节。各种财务指标或多或少都能反映公司的财务状况,但各个指标反映的信息在一定程度上有重叠,有些指标之间具有很高的相关性或可替代性,这必然影响模型的评估精度和效率。本文针对现有分析方法存在的不足,提出筛选财务指标的方法和步骤,并利用我国沪深两市上市公司的样本数据建立财务预警Logit模型。
【关键词】 财务预警   Logit模型   财务指标   财务状况一、引言
公司财务预警Logit模型的基本原理是选取合适的财务指标作为解释变量来预测公司陷入财务困境的概率。Logit模型因具有不严格要求财务指标服从多元正态分布的优势,因而在实践中得到广泛运用。
在国外,研究Logit模型应用取得了好的效果。Martin(1977)在财务危机预警研究中首次采用Logit回归模型预测公司的破产及违约概率,取得良好效果;Ohlson(1980)将Logit回归模型应用于信用评估领域,区分不同信用级别的贷款申请人。自此,国外研究中Logit模型在公司财务预警方面得到广泛运用。
在国内,研究Logit模型适用性的学者不少。吴世农、卢贤义(2001)分别采用判别分析和Logit 回归方法建立预警模型,并比较各种方法的预测效果,得出Logit模型的判定准确性最高;于立勇、詹捷辉(2004)利用正向逐步选择法构建信用风险评估指标体系,并通过Logit模型构建违约概率的测算模型;石晓军等(2005)、刘倩(2010)也利用Logit模型对违约率进行研究。近几年,基于Logit模型的财务困境或违约预测的研究越来越多,在这类研究中,模型构建的关键步骤是财务指标的选择和确定。一般来说,公司的各种财务指标或多或少都能反映公司的财务状况,但这些指标反映的信息在一定程度上有重叠,有些指标之间有很高的相关性或可替代性,这必然影响模型的评估精度和效率。
国内外众多文献将Logit模型引入信贷分析或公司财务预警领域,但在选择财务指标时主要采用逐步回归法或因子分析方法,以降低预测变量的维度。然而,这两种方法在实际应用中都存在一定的缺陷:①逐步回归法未考虑各项指标的具体含义以及对违约的预期影响,仅仅根据统计检验结果筛选变量,很容易遗漏重要变量或者出现变量符号与经济直觉不一致的情况;②因子分析方法所确定的因子是原始变量的线性组合,由于因子的复杂性,往往无法对因子作出合理、直观的经济解释。
因此,如何从不同方位、不同层次选择财务指标体现公司的财务状况,并获取对财务状况具有解释能力的财务指标,以提高预测模型的准确性和可靠性,是值得研究的现实问题。
二、财务困境Logit预测模型的基本原理
假设公司i用于困境或违约预测的k个财务指标集合为xi=(x1i,x2i,…,xki),则事件发生的条件概率记为pi=p(yi=1|xi),(1-pi)为客户不违约的概率,pi/(1-pi)称为事件的发生比。在Logistic分布下,Logit回归模型的表达式为:
[Logit(pi)=ln(pi1-pi)=][β0+k=1kβkxki] (1)  
事件发生的概率可写作:
 (2)  
估计模型的参数后,根据式(2)计算企业陷入财务困境或违约的概率[pi]。         
三、财务指标的选择方法与步骤
要从不同方位、不同层次反映公司财务状况,必须遵循全面性和综合性原则,同时考虑可比性和数据的易于获取性原则,先初步确定备选指标;然后在此基础上,通过以下方法和步骤获得最能反映公司财务状况的财务指标:
1. 单变量分析。单变量分析是从备选指标中找出与企业违约具有直接联系、存在显著贡献的指标,也即对违约与否具有一定解释能力的指标。这类指标具有两个基本特点:①与违约率之间具有单调关系。对违约率有较好解释能力的财务指标应在其变动范围内与对应的违约率保持单调关系,随着财务指标值的增加,违约率有增加的可能性;但也有可能随着指标值的增加,违约率会倾向于减小。为了分析各财务指标与违约率之间是否满足该项特征,可将样本的财务指标值按从小到大进行排序,计算在每个比率值的累计违约率,并分析违约率的变化趋势。②陡峭性。陡峭性是指财务指标与对应的违约率的关系图形越陡峭越好。如果违约率随着某一财务指标的变化而迅速变化,则这个财务指标的解释力越强。由于各财务指标的分组依赖于取值范围,而各财务指标又不处在相同的取值区间,曲线陡峭性的判断不能仅仅根据图形作直观判断。
2. 解释变量的共线性与相关性分析。大部分文献主要采用两种方法来解决多元共线性问题:一是采用因子、主成分分析方法;二是根据变量之间的相关系数,在具有较高相关系数的两个变量之间直接删除一个变量的方法。因子分析、主成分分析的不足之处在于选定的因子或主成分是原始变量的线性组合,它不能简单地解释为单变量的属性作用,而且由于因子或主成分的复杂性,也很难给因子或主成分一个合理解释;而第二种直接根据相关性大小删除变量的方法在操作上也存在一定的问题,最突出的一点是多个变量之间可能存在比较复杂的相关关系,某一变量的删除可能会使两个相关性较弱的变量显示较大的相关系数,或者使两个具有较高相关性的变量显示出较弱的相关性,这种方法很容易遗漏重要变量,产生模型错误。
出于尽可能保留具有较高解释能力变量的考虑,实证分析对于这一步骤重点考虑两个变量相关系数的绝对值达到0.9以上时才对其中的某一个变量进行删除。而究竟删除哪个变量,笔者认为应采用如下原则:如果这两个变量增加时违约率都变大或都变小,则删除单变量分析中系数绝对值较小的变量;反之,则参考其他变量对违约率的影响方向,从而删除与其他变量大多不一致的那个变量,其目的是使解释变量尽可能对违约具有相同的影响方向,避免在估计模型系数时出现系数符号与预期不一致的情况。删除变量之后,利用容忍度指标来检查共线性问题。容忍度定义如下:
Tolerance=1- (3)  
式中,    是以xk为因变量,其他变量作为自变量,建立回归方程得到的拟合优度。当    很高时,容忍度很低,表明自变量xk与其他自变量之间存在高度相关。Menard(1995)曾指出,容忍度小于0.20可以认为是多元共线性存在的标志,容忍度小于0.10说明多元共线性很严重。
3. 按年度实施Logit模型。为了在剩下的指标集合中进一步获得具有解释能力的指标,实证分析中,根据不同年度的样本数据分别建立各年度的违约率回归模型,其具体做法是采用向前逐步回归方法,并结合似然比检验,在各年度引入具有较高解释能力的变量,再综合得出能在较长时期预测违约的财务指标集合。分年度建立模型一是为了考察不同时期预测违约率的财务指标是否具有一致性;二是为了尽可能使财务指标能在相对较长的时期对违约预测具有较高的准确性。如果确定的财务指标具有较长的预测能力并具有较好的稳定性,则银行调整模型的时间可适当延长,否则模型的变量和参数可能变动较频繁,这将给模型的维护带来较大的成本。要指出的是,这种思想仅仅是出于选择财务指标而言的,管理机构必须经常对模型进行评估,包括对模型变量和参数的合理性进行检验以及对模型的稳定性进行检验。
4. 回归系数显著性检验。通过上述步骤后,可以认为筛选得到的解释变量在预测违约或困境方面具有显著能力。此时,利用向后逐步回归方法最终建立违约回归模型。系数的显著性检验采用Wald检验方法。由于进行逐步回归的解释变量已经经过了若干步骤的筛选,为了不遗漏重要的解释变量,显著性水平的取值应适当放大。Bendel、Afifi(1977)以及Mickey、Greenland(1989)等学者都曾指出,使用较常规的水平如0.05为标准常常可能导致遗漏重要变量。
5. 解释变量回归系数的符号分析。最终确定的财务指标不仅要求与违约之间的关系要直观清晰,而且在违约回归模型中,解释变量系数的正负性也要与经济直觉获得的预期符号相一致。在变量筛选的过程中,删除一些变量后,可能会导致模型中的某些系数与预期不一致,此时应当适当分析和调整,特别是在共线性分析和相关性分析中删除变量时,要向同一方向调整预测变量,以避免“抑制变量”的影响。
四、实证分析
1. 样本选择与财务指标初选。本研究选取的财务困境公司样本是2001年1月1日至2011年12月31日期间沪深两市A股中被ST或被∗ST的200家公司(不包含由于非财务原因被ST或被∗ST的公司)。确定了该样本后,再根据研究期间一致、行业类型相同或相近、上市地点尽可能一致的原则,按1:1 的比例选择非ST 的上市公司作为配对样本,数量为200家。样本涉及《中国上市公司分类指引》中除金融保险行业外的12个大类,具有较强的代表性。
对于样本公司,预测其财务困境的财务指标数据均来自于公司被ST或∗ST年度前一年的财务年报,也即利用t-1年的财务信息来预测其在第t年是否会处于财务困境或违约。样本数据来源于CCER数据库和CSMAR数据库。
在借鉴国内外众多文献研究成果的基础上,兼顾数据的可获得性,初步选择反映公司财务状况(即影响公司违约率)的25个备选财务指标。这些指标涵盖了公司的盈利能力、发展潜力、偿债能力、营运能力、投资价值等五个方面,具有一定的全面性。
各项指标的名称分别为:X1:净资产收益率;X2:资产收益率;X3:净利润率;X4:净资产增长率;X5:总资产增长率;X6:营业收入增长率;X7:营业利润增长率;X8:税后利润增长率;X9:流动比率;X10:速动比率;X11:存货流动负债比率;X12:现金流动负债比率;X13:资本充足率;X14:现金负债比率;X15:债务资本比率;X16:债务资产比率;X17:存货周转率;X18:应收账款周转率;X19:流动资产周转率;X20:资产周转率;X21:固定资产周转率;X22:市盈率;X23:市净率;X24:每股收益;X25:每股净资产。其中,指标X1 ~ X3反映公司盈利能力;X4 ~ X8反映公司发展潜力;X9 ~ X16反映公司偿债能力;X17 ~ X21反映公司营运能力;X22 ~ X25反映公司投资价值。
2. 财务指标筛选。利用1:1配比的样本集合数据,分别对25个财务指标运用Kolmogorov-Smirnov 统计量进行正态检验,检验结果表明,除X13、X16、X20、X25可认为服从正态分布外,其余变量均不服从正态分布。Logit模型没有要求自变量服从多元正态分布的严格假设,因此适合建立Logit模型。
在单变量分析中,根据单调性要求,将每个财务指标从小到大排列,按取值范围划分为10个区间并计算各个区间上的违约率,绘制各项财务指标与违约率之间的关系图(限于篇幅,图略)。根据关系图,得出:变量X7和X8和违约率之间总体上不存在明显的单调关系;而X1 ~ X6,X9 ~ X14,X17 ~ X22,X24,X25总体上都与违约之间呈现负相关关系,即随着变量取值的增加,违约率递减;X15、X16、X23总体上都与违约之间呈现正向关系。结合各项指标的含义,这一结论与预期基本上是一致的。同时,这一结果也表明,随着营业利润增长率和税后利润增长率的增加,违约率并不总是降低,资产收益率、净利润率等因素的降低明显削弱了利润增长对降低违约率的作用。根据财务指标与违约之间的单调性要求,删除财务指标X7和X8。
根据陡峭性要求,分别对各项财务指标建立单变量模型,即对各项指标分别建立违约率回归模型,结合回归系数的大小和显著性水平,实施财务指标的筛选。为了不遗漏重要变量,在显著性水平取0.25的条件下,将X6、X7、X8、X17、X21、X23删除。经过该项筛选后,保留的财务指标为:X1、X2、X3、X4、X5、X9、X10、X11、X12、X13、X14、X15、X16、X18、X19、X20、X22、X24、X25。
结合各项保留指标的含义,并计算各指标之间的相关系数,结果表明:X9和X10高度相关(相关系数为0.983);X12和X14高度相关(相关系数为0.995);X13和X16高度相关(相关系数为-0.984)。结合单变量回归结果可以得出,X9的系数与X10的系数均为负值,而X10系数的绝对值小于X9,根据陡峭性原则可删除指标X10,同样的道理可删除X12;又由于保留的大多数指标与违约表现为负相关,而X16与违约表现为正相关,为了避免“抑制变量”的影响,可将X16删除。
对于剩余的指标,基于以下考虑进一步寻找更具解释能力的指标:①在不遗漏重要变量的前提下尽可能减少变量数目,保持违约预测模型的简约性;②样本来源于一个较长的期间(10年),由于不同年度公司所处的经济环境不同,各项财务指标不可避免地受到与时间有关的因素如宏观经济形势的影响,而财务指标的选择应当在预测违约率上具有稳定性,以提高模型适用性。因此,对各年度的样本数据建立回归模型,在通过检验而且系数符号与单变量分析得出的符号一致的情况下,选择较少的指标作为各年度最具违约解释能力的变量。
通过各年度的模型发现,各年度有显著解释能力的变量并不完全相同。考虑到各年度模型中样本规模受到一定的限制,由各年度选定的财务指标综合得出违约预测的指标集合为:X2、X4、X13、X18、X22、X24。指标的相关系数和多元共线性容忍度计算结果见表1和表2。从表2中可以看出,容忍度结果均大于0.20,表明多元共线性现象不显著,不过从表1看出,X2和X24的相关系数相对于其他数值较大。由于X2在所有年度都具有较强的解释能力,故删除指标X24。删除X24后再次计算多元共线性容忍度,计算结果见表2中括号内的数值。对比表明,删除X24后容忍度均大于0.20,而且从总体上看,多元共线性的程度大大减弱。

 

 


 

 

 

 

 


经过以上步骤,五大类共25项初选财务指标经过筛选获得的指标为X2(资产收益率)、X4(净资产增长率)、X13(资本充足率)、X18(应收账款周转率)、X22(市盈率)。各项指标对预测具有显著的解释能力,也符合其经济含义:①资产收益率反映了企业的盈利能力,盈利能力越强,企业在较长时期内的资金来源就越有保障;②净资产增长率反映了企业的发展潜力,代表着企业规模增长的能力,资产规模扩张能使企业具有更强的实力,也可能带来更高的收益.事实上,企业在较长时期内的盈利能力主要是由企业的发展潜力所决定的;③资本充足率反映了企业的偿债能力,它直接反映借款企业还本付息的能力;④应收账款周转率反映了企业的营运能力与企业保持资金流动性的能力;⑤市盈率反映了企业的投资价值,也反映了企业的盈利能力、业务增长能力以及未来的市场潜力。
3. 财务困境或违约预测Logit模型。以上述五项财务指标作为解释变量,并利用1:1配比的样本集合的数据构建违约率回归模型,模型系数估计、Wald检验结果、模型拟合效果以及分界点取0.5时模型的分类准确性分别见表3和表4。根据表3的Wald检验结果,在显著性0.05下系数都通过统计检验,表明系数都显著不为0。另外,5个系数均为负值,表明随着各项指标的增加违约率都将降低,这与经济直觉和单变量分析结果也保持一致。表4中Nagelkerke R2类似于线性回归的拟合优度,其值0.74表明模型拟合样本数据的效果较好;模型预测违约与不违约的准确率分别为92%、91%,整体准确度为91.5%,表明模型具有很好的预测能力。

 

 

 

 

 

 

 

财务困境或违约预测模型的表达式为:
ln(p/(1-p))=-23.30X2-2.46X4-1.42X13-0.01X18
-0.01X22
违约率可写成:
p=1/(1+                                   )
根据上式计算公司的违约率,若[p≥0.5],则认为公司财务状况较差会发生违约;若[p<0.5],则认为公司财务状况处于正常状态。
【注】 本文系教育部人文社科基金项目“内部公司治理对银行风险承担行为影响研究”(项目编号:10YJC790149)和江苏省高校优势学科建设工程资助项目的研究成果。
主要参考文献
1. Martin D.. Early warning of bank failure: a logit regression approach. Journal of Banking and Finance,1977
2. Ohlson J. A.. Financial Ratios and the Probabilistic Prediction of Bankruptcy. Journal of Accounting Research,1980;18
3. 吴世农,卢贤义.我国上市公司财务困境的预测模型研究.经济研究,2001;6
4. 于立勇,詹捷辉.基于Logistic回归分析的违约概率预测研究.财经研究,2004;9
5. 石晓军,肖远文,任若恩.Logistic违约率模型的最优样本配比与分界点研究.财经研究,2005;9