2016年
财会月刊(12期)
业务与技术
指标选取对聚类分析的影响——以第三产业上市公司财务状况为例

作  者
李 建,宋丽平(教授),张晓杰

作者单位
哈尔滨理工大学经济学院,哈尔滨150080

摘  要

【摘要】 本文以2014年我国部分第三产业上市公司为例,采用两种不同的方法对财务指标进行选取,并对聚类结果与财务状况水平进行了比较分析。研究表明,第一种采用非参数检验法所取得的财务指标聚类结果等价于采用因子分析中由“因子得分系数矩阵”所取得的因子指标聚类结果。两者均不能直观精确地反映上市公司的财务状况。而在此基础上,第二种采用由因子分析中“初始因子载荷矩阵”拟合出的具有主成分内涵的财务指标进行聚类,结果显示该方法具有较高的敏感性。不仅可以准确地对不同财务水平的企业进行聚类,而且可以对每一类结果进行合理解释。
【关键词】 聚类分析;因子分析;财务指标;财务危机
【中图分类号】F275           【文献标识码】A           【文章编号】1004-0994(2016)12-0084-4一、引言
在我国经济快速发展的这十年,相比于第一、二产业,第三产业在其中所起到的作用可谓举足轻重,特别是交通运输、电子商务、房地产等行业占据了当今经济发展潮流的巅峰。然而,当前信息化程度的高速发展也给我国第三产业带来了更多的竞争和潜在的危机,如民营经济抗风险能力等问题。为了能够全面合理地了解当前我国第三产业上市公司的财务状况以及为投资者提供科学的分析方法,本文选取了我国部分第三产业的45家上市公司作为研究对象。其中包括2015年被ST的9家公司和与之以1∶4配对的36家非ST公司。要对企业财务状况进行比较全面的分析,必须引入ST公司,因为这样能够对企业财务状况的优劣程度进行更全面的分析。
由于研究重点是财务指标的选取对聚类分析结果的影响,因此为了缩小ST与非ST公司的差异,样本的选取除了考虑在企业规模上相接近,还对ST公司选取了2014年份的财务数据,而非ST公司也选择了与之对应的2014年份的财务数据进行研究。所选取的财务数据均来源于国泰安数据服务中心。
二、非参数检验指标的获取
通过借鉴前人的文献并遵循指标选取所必需的全面性、可比性、重要性及可操作性等原则,本文先从能够反映企业盈利能力、成长能力、偿债能力、现金流量能力、运营能力的240多项财务指标中,选取了具有代表性的40个指标作为备选指标。这样选取的原因是研究指标数量过多不利于及时发现财务危机。
此外,指标之间若存在较大的相关性可能会对分析的最终结果产生偏差和误导。因此,在诸多财务预警文献中,学者们均对研究指标进行了显著性检验,主要检验方法包括参数检验和非参数检验。由于非参数检验统计方法不需要考虑研究对象的分布状态,本文以1∶4配对的45家公司的40个备选指标为例,进行了两独立样本非参数U统计量的曼-惠特尼(Mann-Whitney)显著性检验。
表1列出了两独立样本的曼-惠特尼(Mann-Whitney)检验结果。
由表1可以看出,在显著性概率0.05的水平上有16个指标通过,它们分别为:X1流动比率、X2速动比率、X3现金比率、X5现金流量净额/流动负债、X6资产负债率、X9权益对负债比率、X17资产报酬率、X18总资产净利润率、X19流动资产净利润率、X21长期资本收益率、X23营业成本率、X24营业净利率、X25成本费用利润率、X29资本积累率、X30总资产增长率、X37全部现金回收率。将选取上述指标的方法称为第一种方法,然后进行聚类分析研究。
三、“初始因子载荷矩阵”拟合法获取指标
在因子分析中可以得到“初始因子载荷矩阵”(又称成分矩阵),第二种聚类指标的选取方法就是基于此矩阵而得到的。
“初始因子载荷矩阵”是用来表述主成分因子和各指标之间的一种线性关系,具体形式可写为:
[1nXi=F11nai1+F21nai2+⋯+Fj1naij+1nεi] (1)
其中:Xi代表第i个指标,i的取值从1到n;Fj为第j个成分因子;aij就是由因子分析所得到的“初始因子载荷矩阵”;等式最后一项ε表示特殊因子,表示公因子之外的影响。若在式(1)两边同时乘以指标Xi,原式则可写为如下形式:

 


最后一项依然表示公因子之外的影响成分,为了尽量减小该项对分析结果的影响,在因子分析过程中采取累积贡献率大于90%以确定主成分因子数。
公式(2)所示含义可以理解为,对于一个公司各财务指标的平方和与因子分析提取出的公因子之间也可表示成线性组合的关系。于是就可定义公式(2)的因子系数作为第二种方法的指标:
[Y1=1nai1Xi;Y2=1nai2Xi;⋯;Yj=1naijXi] (3)
可以看出,该拟合Yj因子指标的获取需要借助于因子分析中的“初始因子载荷矩阵”得到。
为了检验前述非参数检验所选取的财务指标是否可以用来做因子分析,首先进行KMO和巴特利特检验,结果在表2中列出。

 

 


样本KMO测试系数为0.774,近似卡方值为1169.732,显著性值为0.000<0.05。表明所选取的16个财务指标间存在较强的相关性,非常适合进行因子分析。
表3为采用正交旋转提取出来主成分因子的总方差解释,可以看出所提取出来的5项主成分因子能够对原始数据信息的解释达到91.22%。
表4是第二种方法获取指标时要使用的“初始因子载荷矩阵”表。利用式(3)便可得到所选取的45家公司各自5项拟合因子指标Y1、Y2、Y3、Y4、Y5。
四、两种方法的聚类分析
聚类分析是统计学中应用非常广泛的多元统计分析方法,其目的是使同一类个体的相似度尽可能大,而不同类别个体之间相似度尽可能小。它在评价企业财务管理及风险水平方面亦得到了广泛应用。聚类分析的方法有很多种,但常用的主要有系统聚类和快速聚类。现采用系统聚类的方法对45家企业财务状况进行比较分析。
使用SPSS和EXCEL软件分别计算得到了两种方法的指标,即第一种方法选取了16项变量指标,第二种方法选取了5项Yj因子指标。表5是分别采用两种指标对45家上市公司进行聚类得到的结果。可以看出,他们均可分为四类,很明显一种指标的聚类结果不能很好地将ST企业与非ST企业进行鉴别。尤其在第四类中,将很多非ST企业划入,表明第一种指标的选取方法对各企业财务状况敏感性不足。而第二种通过拟合“初始因子载荷矩阵”法得到Yj因子指标的聚类结果明显优于前者,它不但可以将ST企业聚为一类,同时引入的非ST企业数量大幅减少。若以ST企业聚为一类为检验两种方法的标准,则第二种方法的整体误判率仅为4.4%,对应第一种方法的整体误判率高达33%以上。当然这只是基于1∶4配对所得到的数据,在实际情况中,ST与非ST企业的配对比远远高于此比率,这将导致第一种方法的误判率更高。两种方法都对ST000892公司缺失,主要是由于该公司的原始财务指标数据不完整造成的。

 

 

 

 

 

 

 

 

 


由表5可以看出,两种指标选取方法的聚类结果有很大的相似成分。深入分析可对此做如下解释:
第一种方法获得的指标共有16项,它是能够通过提取到的主成分因子进行解释的,也就是说,该16个指标直接聚类与将因子分析得到的“因子得分系数矩阵”的主成分因子作为指标的聚类是等同的,通过计算证实了两者的聚类结果相同。这就表明第一种指标获取方法可使用主成分因子进行解释。
第二种方法选取的Yj因子指标共5项,与前者等价于“因子得分系数矩阵”不同,它是重新定义了与“初始因子载荷矩阵”有关的因子指标。它将企业的各财务指标的平方和作为得分整体,来与因子分析提取出的主成分因子拟合成线性关系。也就是说该方法亦可用主成分因子进行解释。
因此,采用两种指标获得的聚类分析结果虽然有一定的相似成分,但第二种方法选取的Yj因子指标对于采用聚类分析来预警企业财务状况具有较高的敏感度和准确性。
由表3可以看出,第一个成分因子对于整体指标的解释度已经能够达到48.332%,根据第二种方法的式(3),可以计算出四类企业拟合因子指标Y1的均值做定量分析。而因子一种指标的聚类结果不能很好地将ST企业与非ST企业进行鉴别。尤其在第四类中,将很多非ST企业划入,表明第一种指标的选取方法对各企业财务状况敏感性不足。而第二种通过拟合“初始因子载荷矩阵”法得到Yj因子指标的聚类结果明显优于前者,它不但可以将ST企业聚为一类,同时引入的非ST企业数量大幅减少。若以ST企业聚为一类为检验两种方法的标准,则第二种方法的整体误判率仅为4.4%,对应第一种方法的整体误判率高达33%以上。当然这只是基于1∶4配对所得到的数据,在实际情况中,ST与非ST企业的配对比远远高于此比率,这将导致第一种方法的误判率更高。两种方法都对ST000892公司缺失,主要是由于该公司的原始财务指标数据不完整造成的。

 

 

 

 

 

 

 

 

 


由表5可以看出,两种指标选取方法的聚类结果有很大的相似成分。深入分析可对此做如下解释:
第一种方法获得的指标共有16项,它是能够通过提取到的主成分因子进行解释的,也就是说,该16个指标直接聚类与将因子分析得到的“因子得分系数矩阵”的主成分因子作为指标的聚类是等同的,通过计算证实了两者的聚类结果相同。这就表明第一种指标获取方法可使用主成分因子进行解释。
第二种方法选取的Yj因子指标共5项,与前者等价于“因子得分系数矩阵”不同,它是重新定义了与“初始因子载荷矩阵”有关的因子指标。它将企业的各财务指标的平方和作为得分整体,来与因子分析提取出的主成分因子拟合成线性关系。也就是说该方法亦可用主成分因子进行解释。
因此,采用两种指标获得的聚类分析结果虽然有一定的相似成分,但第二种方法选取的Yj因子指标对于采用聚类分析来预警企业财务状况具有较高的敏感度和准确性。
由表3可以看出,第一个成分因子对于整体指标的解释度已经能够达到48.332%,根据第二种方法的式(3),可以计算出四类企业拟合因子指标Y1的均值做定量分析。而因子解释。表6和表7分别是计算得到的旋转后的成分矩阵和聚类类别与各类企业Y1因子指标的均值关系。

 

 

 

 

 

 

 

 

 

 

 

 


由表6可以看出,Y1因子指标可以由反映企业运营能力的指标X6(资产负债率)和反映企业盈利能力的指标X17(资产报酬率)、X18(总资产净利润率)、X19(流动资产净利润率)、X25(成本费用利润率)、X24(营业净利率)来解释。因此,对于表7中Y1因子指标均值越大,说明该类企业的运营及盈利能力越强。由表7可以看出,在聚类结果中第二类和第三类企业的Y1因子指标均值较高,表明财务状况处于稳健水平;第一类企业的Y1因子指标均值虽然明显较小但仍然是正值,表明财务状况处于正常水平;第四类企业的Y1因子指标均值则为负值,表明该类企业的财务状况处于不良或危机水平,所以此类中基本都是被认定为ST的企业。表7也列出了被误判企业的Y1因子指标值,被误判为正常水平的ST000033公司为4.07,与均值的5.8水平较为相近;而被误判为危机企业的600892公司为0.42,而均值为-3.07,说明该企业已经接近危机水平的边缘。如果仅从Y1因子指标的解释来看,ST000033公司在未来转为正常水平的概率较大,而600892公司转为财务危机水平的概率较大。值得注意的是,从样本中每一类企业的数量来看,基本呈现正态分布,财务状况一般的企业较多,而财务优良和危机的企业数量相对较少,这与实际行业情况是一致的。因此,属于第一类的企业在未来出现财务危机的概率则相对较高。
综观聚类分析类型的文献,大部分都使用非参数检验法选取的指标或是“因子得分系数矩阵”所得到的成分因子作为指标来进行聚类,得到的聚类结果及意义并不十分显著,所以聚类分析在财务预警方面只是辅助性质。然而基于因子分析的“初始因子载荷矩阵”所定义的拟合财务指标不但增强了区分企业财务状况优劣程度的敏感性,而且还能为企业财务预警提供有力的支持。
五、结论
本文以2014年我国部分第三产业45家上市公司财务状况为例,研究了在不同方法下的财务指标对聚类分析结果的影响。由研究结果可知,采用非参数检验方法所获得的财务指标与因子分析中“因子得分系数矩阵”得到的因子指标有等价关系,该方法的聚类分析结果对上市公司的财务状况敏感性不足,聚类结果比较模糊。而在此基础上,本文通过利用因子分析中的初始因子载荷矩阵来拟合出具有主成分内涵的财务指标并进行了聚类分析。
本文的结果显示,该方法具有较高的敏感性,不仅可以准确地对不同财务水平的企业进行聚类,还能够对每一类结果进行合理的解释。因此,该方法可为行业财务评价及企业危机预测提供一种新思路。

主要参考文献:
游怡,刘婉璐.基于因子分析与聚类分析的通讯公司财务状况研究[J].财会通讯,2014(14).
刘蓉晖,雷怀英,付景莉.两种财务困境程度判别模型的构建与比较[J].统计与决策,2013(7).
孔宁宁,魏韶巍.基于主成分分析和Logistic回归方法的财务预警模型比较——来自我国制造业上市公司的经验证据[J].经济问题,2010(6).
董银霞.我国商业银行经营绩效的全局主成分分析[J].会计之友,2014(7).