2016年
财会月刊(26期)
财务·会计
基于修正遗传算法的上市公司财务盈余预测模型构建

作  者
王 琳,刘 英(副教授)

作者单位
Srinivas M..Genetics Algorithms: A Survey[J].Computer,1994(6).

摘  要

    【摘要】过去的财务盈余预测往往以统计方法进行,同时预测结果只能以增长或衰退的二元式模式输出,而类神经网络的预测方式也可能因变数的增加,使得网络较为复杂,不容易收敛。为提高上市公司财务预测的准确率,减少传统模型的训练样本数,在传统遗传算法的基础上,本文提出了一种以实际值编码方式代替二进制编码方式的修正遗传算法,构建了基于该修正算法的财务盈余预测模型。以中国电子行业上市公司数据为样本,对建立的财务盈余预测模型进行实验验证,结果表明:修正的遗传算法在每股盈余预测上是一个可行的预测工具,且具有预测实际值的能力,在对小样本的趋势预测上可达到95%的预测准确度,而在实际值的预测上误差比率不到10%。
【关键词】财务预测;每股盈余;修正遗传算法
【中图分类号】F275.5           【文献标识码】A           【文章编号】1004-0994(2016)26-0059-4公司陷入财务危机,不仅危及自身的生存和发展,也给投资者、债权人带来巨大的损失。因此,构建彼此不相关且信息量大的财务预测指标体系对于公司的发展和证券市场的稳定具有重要的作用。财务报表分析中财务比率分析是较容易操作的方法之一,过去在应用财务比率分析方法时,往往以简单、重要的少数几个财务比率或指标来进行分析,但各种不同的财务比率或指标可能具有不同的衡量意义。以企业经营管理目标分析为主,财务比率一般可以分为短期偿债能力、长期偿债能力、获利能力、生产能力和成长能力等。根据以往的许多研究来看,不同行业间财务比率特性并不相间,同时影响公司财务比率的因素还包括公司的组织架构、公司产品的生命周期、公司成长状况及规模大小等。在应用财务比率进行财务预测的模型中,多数学者都偏向于采用多变量分析和回归分析两种模式。这两种分析模式中,前者是找出关键性的财务比率,再对这几个财务比率进行分析与预测,结果以趋势的二元式模式输出为主,而回归分析的限制是所有自变量不能线性重合,因此使用更多种的财务比率及指标来进行分析,将可以增加结果的准确性。
以往的财务预测大多以统计分析为主,近年来随着信息技术的发展,使得分析预测有了更多的方式,如使用类神经网络建立财务预测模型,利用遗传算法进行经济预测或销售预测等。类神经网络的预测方式可能因变数的增加,使得网络较为复杂,不容易收敛,而过去在遗传算法的应用上,往往偏重于科学或工程方面的应用,同时该算法在编码上多采用二进制式编码。目前的研究总体上还缺乏系统的理论指导,尤其是在提高模型预测正确率的前提下,如何减少训练样本的数量、缩短模型运行时间、优化模型等方面的研究还处于起步和探索阶段。因此,本文利用修正的遗传算法建立财务盈余预测模型,以期使该模型具有预测实际值的能力,不再是过去单变量或多变量预测的二元式输出结果,也不需要太多对各个财务比率的假设、限制及较多的先验知识等。
一、财务预测分析架构
研究中,为建立一个数量化的预测模型,部分不易数量化的影响因素均不予考虑,仅以可数量化的财务比率作为预测的输入变数。而传统的遗传算法中,在进行问题的编码时,多采用二进制式的编码方式,如果要预测每股盈余的实际值,用实数的编码方式代替二进制的编码方式效果会更佳,它可以使原来的财务比率值直接反映到对每股盈余的影响即盈余预测模型中。该模型的基本假设为:公司i在t年的每股盈余   与过去几年的财务状况有关,公司的财务状况可用一组财务比率{   }作为指标来表示,其中   表示公司i的第j项财务比率。若使用h个年份来表示每股盈余, 则盈余预测模型可用函数关系表示为:

式中:    表示公司i在第t年的每股盈余;       表示公司i在第t-h年的第j项财务比率。
由于(1)式中各种财务比率值的衡量单位不一致,因此对其进行归一化处理,以便利用财务比率建立与每股盈余之间关系的数量模型,归一化后的数值模型可避免某项财务比率因本身的特性而具有过大或过小的值,造成衡量时无法客地评估该比率对预测值的影响。经过归一化后的财务比率用        表示,其意义为公司t-h年第j项正规化财务比率,来代替财务比率       。研究中以前一年度(t-1)的财务比率来预测第t年的每股盈余,故h=1。因此,修正后的逻辑转换公式可表示为:

将        代入(1)式可得

采用线性回归分析,可进一步假设(3)式中正规比率指标和每股盈余间呈线性关系,则(3)式可表示为:
[Pit=j-1nCijRit-1,j]                (4)
式中:    表示对于公司i而言,正规指标和每股盈余两者间的关系系数; n为预测模型中所使用的财务比率个数。令
                     ,则可以将(4)式用矩阵表示为:
[Pit=j=135CijRit-1,j=Ci×Rit-1T]                     (5)
从(5)式中可以得出,只要能找出一个最适当的系数矩阵[Ci*],将其代入(5)式,即可由该式来预测每股盈余。在财务比率选取方面,虽然财务比率项目较多,在本研究中,去掉经济指标等因素,同时以该财务比率能在公开的财务报表中取得为原则,经筛选后,总共有35项财务比率符合要求,具体如表1所示,从而式即(5)中n的取值范围为1 ~ 35的整数。

 

 

 

 

 

 

 

 

 

 

二、遗传算法修正与模型构建
以优生学的观点来修正传统的遗传算法,目的是确保每个遗传子代中最佳的染色体表现一定不小于母代的任一染色体的表现。该修正的遗传算法是修正复制基因到子代的过程,以人为方式,保留一定比例的母代最优良基因到下一子代中,子代剩下的染色体部分,则以传统遗传算法的过程产生,然后定义遗传算法的各项操作方式和各个参数。根据财务预测分析的架构可以把问题定义为:找到一个系数矩阵[Ci*],把[Ci*]代入式(5),使得对于过去的公司财务比率和每股盈余资料代入上式时,等号两边的值最接近。即:找出一组最佳[Ci*],使得下式具有最小值:

下面根据下图所示传统遗传算法的建立过程,逐步定义修正后的各项参数和操作方式。

 

 

 

 

 

 

 

 

 

1. 染色体的表示方式。研究中所使用的财务比率共有35个,因此相对应的系数矩阵[Ci]的长度为35,即每个染色体的长度为 35。每个染色体基因的编码方式采用实数型的数值,其所代表的意义为其相对应的财务比率对每股盈余贡献的权重,其产生方式为随机分配,范围为-1000 ~ 1000。
2. 母体的组成大小。母体为每个遗传子代的所有染色体集合,根据Srinivas所提出的观点,一般常用的母体大小为30 ~ 100,在考虑染色体长度因素下,设定母体大小值为 50。
3. 遗传的代数。遗传代数采用设定固定值的方式确定,为求较高准确率,设定遗传代数为5000代。
4. 基因复制方式。基因复制采用狭义的定义方式,从母代中挑选出来的染色体不经交配或突变,遗传到下一子代。因此研究中所采用的复制包括两种方式:一是传统随机的复制;二是优良染色体的复制。从母代染色体中对其适合度进行排序,选出一定比例最佳的染色体,复制到子代,这也是本研究中所修正的传统遗传算法的一部分。研究中两者的比例皆设定为0.05。
5. 交配和突变的几率。根据文献研究,一般交配的几率越高越好,本研究中采用Srinivas的其中一组建议值,设定交配发生的几率为0.9,突变的几率为0.01。在研究中,交配的方式采用两点式交配法,突变的方式则是伴随于交配动作而产生的,即在交配时选取母代基因到子代基因的同时,若发生突变,则以产生第一代染色体基因的矩形分配函数,重新产生一个新的随机数。
6. 适应度函数设计及染色体选取方式。以(6)式作为适应度函数,根据(6)式可以计算出每一组染色体的适应度   ,
即公司i在第t年第k组染色体的适应度值,而得到一组        。根据适应度判断准则,      值越小,其预测效果越好,且在下一代的出现几率越高,因此以(7)式作为染色体的选取准则:
[πil,k]=(1/[Dit,k])/(1/[k=150Dit,k])  (7)
其中:     表示在对公司i的模拟过程中,第l代的第k个基因组被选中遗传到下一代的几率。
修正遗传算法模型的预测参数如表2所示。

 

 

 

 


三、实验研究与分析
1. 实验样本与过程。实验样本来自教育部电子计算机中心的经济统计资料库系统中的股票上市公司财务报表资料,选择电子行业为样本,以其2004 ~ 2014年数据作为分析对象。分析时,如果某公司某一年度财务比率的相关会计科目有异常值出现,且财务比率的异常值超过三种,则该年度将被视为无效年份。对于分母会出现0的财务比率,以罚函数因子 (1015)代替该值,最后得到28家样本公司,有效样本年数为171。研究中,分别进行四组实验来检验盈余预测模型的预测效果。
【实验一】该实验以单一公司为对象,利用单一公司的历年财务比率资料进行训练学习,分别找出每家公司最佳的系数矩阵染色体,再利用该染色体做每股盈余预测。预测方式为迭代模式,即以公司第 t-1年的财务比率作为训练学习资料,而以第t年的每股盈余进行验证,接着以第t年的财务比率作为学习资料,以第t+1年的每股盈余进行验证,如此循环下去。本实验的目的是检验预测模型在少量的学习样本年数下,得到的预测效果。
【实验二】该实验先以整个电子业为对象,利用整个产业的历年财务比率资料进行学习,找出一个适合本产业的最佳系数矩阵染色体,再利用该染色体对每家公司做每股盈余预测,预测方式仍为迭代模式。由于以整个产业的学习资料为主,因此将(6)式修正为:
Dt=     ([Pit(real)]-[Ci*]×         )        (8)
实验的目的是检验以整个产业构建出来的系数矩阵染色体的预测效果。
【实验三】该实验以单一公司为学习及预测对象,但方式改为利用多年的学习资料来构建最佳系数矩阵,而以最后一年的资料作为预测验证。因此将资料分成两部分:第一部分以2014年以前的资料作为建立预测模型的学习资料;第二部分为验证资料,保留最后一年即2014年度的资料对模型预测结果进行验证。因此将(6)式修正为:
Di=     ([Pit(real)]-[Ci*]×         )        (9)
其中,k表示公司有效的资料年度,但因各公司有效年度不同,其值也不同。本实验的目是检验以长时间的学习资料作为构建预测模型的学习资料时其预测的效果。
【实验四】该实验以整个产业的多年财务比率作为学习资料,而以最后一年的每股盈余作为预测验证资料。因此以2014年以前的所有公司的资料作为建立预测模型的学习资料,而保留2014 年度的资料作为模型预测结果的验证资料,验证时利用整个产业构建出来的系数矩阵对每一家公司做预测。因此将式(6)修正为:
D=(         [Pit(real)]-[Ci*]×         )               (10)
本实验的目的是检验以整个产业、长时间的资料为预测模型的学习资料时,其对每一家公司预测的效果。
2. 实验结果与分析。四组实验的模型趋势预测正确率和实际值预测误差率的结果如表3所示,趋势预测正确率表示能够正确预测每股盈余增长或衰退趋势的比率,实际值预测误差率为每股盈余预测值和实际值两者误差和实际值的比率。从采用迭代方式预测的实验一和实验二及采用所有年限预测的实验三和实验四的结果比较中可以发现,虽然以迭代方式预测的效果比采用所有年限预测的效果差,但不论是在趋势预测上还是在实际值预测上差异均小于10%,说明本预测模型即使在公司的历史资料不够多时,仍有相当的预测价值,也表明长期的资料可能包含了季节循环性的影响因素,而这些影响因素也将影响整个预测的准确性。以多年度数据样本分析虽然可以减少因季节性变动因素而产生的误差,但从实验结果来看,两者的预测结果相差不大,说明主要的决定因素还是在各项短期的财务比率上。
另外,将实验一和实验二以及实验三和实验四作比较可以发现,以单一公司的资料作为学习资料时比以整体产业的历史资料作为学习资料时,不论是趋势预测还是实际值预测,其准确率均高出许多,得出以本预测模型进行预测时,以单一公司为对象的学习资料比以整体产业的历史资料作为学习资料时学习效果佳的结论。因此,以单一特定公司的资料作为学习样本可使影响的变数减少,从而改善预测效果。

 

 

 

 


本文中每个实验均进行了三十次模拟,因此每个实验中均可得到三十组系数矩阵,对实验所得到的系数矩阵加以分析,发现较短年度的学习结果不如较长年度的学习结果稳定,这主要是由系数矩阵的变异数较大引起的。此外,每个公司中这些财务比率系数大小的分布情况也不一致,这表示每家公司盈余状况的影响因素不尽相同。不同产业间在预测每股盈余时,因产业特性不同,选用的财务比率也不相同。而从上面的实验结果也可以发现,即使是同一产业,因为公司的财务结构不同,用来预测每股盈余的财务比率也会有差异。整体而言,大部分财务比率的系数变异数值均偏大,这是由于同组内财务比率具有较高相关性(包括正相关性及负相关性),因此相互间存在影响,使得系数变异性增加。采用遗传算法虽然未先对自变量即各项财务比率进行分析,了解彼此相关程度,但从其系数输出的结果来看,仍然可以发现这些财务比率存在关联关系,因此得出遗传算法并不需要类似各个财务比率间关系的先验知识,一样可以在学习过程中自我找寻其关系。
四、结论
本文基于修正的遗传算法,以财务比率为基础,构建了每股盈余预测模型,并以中国电子行业上市公司数据为样本进行了多组实验验证分析,通过本文的研究可得出以下几点结论:
以往在每股盈余的预测上,多以产业为分析对象,本文除以产业中电子行业为分析对象外,还对电子行业中个别公司进行了实验分析。实验结果表明,该预测模型即使是在小样本的情况下也具有较高的准确度。
该预测模型可以同时考虑多个种类的财务比率,不必担心财务比率间的相关性问题,亦即不需要预先知道变数间的关系。
采用以实际值编码方式代替二进制编码方式的修正遗传算法构建的财务盈余预测模型,能够较为准确地预测出趋势值,还可以得到影响程度较大的财务比率,提高预测准确度。

主要参考文献:
刘彦文.上市公司财务危机预警模型研究[D].大连:大连理工大学,2009.
Davalos S., R. Gritta, J. Goodfriend, et al. The use of a genetic algorithmin forecasting air carrier financial stress and insolvency[J].Credit and Financial Management Review,2005(2).
朱忠明.公司财务状况评价中财务比率分析的应用[J].财经界,2015(17).
Arifovic J..Genetic Algorithm in Learning and Cobweb Model[J].Journal of Dynamics and Control,1994(1).
Richard J. Bauer.Genetic Algorithms and Investment Strategies[M].New York: John Wiley and Sons, Inc. 1994.
赵冠华.基于遗传算法和熵的缩减记忆式LS-SVM财务困境预测模型研究[J].运筹与管理,2010(10).
高淑芳.基于粗糙集—神经网络的财务危机预警系统研究[D].秦皇岛:燕山大学,2008.
Goldberg E..Algorithms in Search, Optimization and Machine Learning[M].State of New Jersey: Addison-Wesley Publishing Company,1989.
Elton E. J., M. J. Gruber. Improved Forecasting Through Design of Homogeneous Groups[J].The Journal of Business,1971(7).
Shin K., Lee Y..Agenetic algorithm application in bankluptcy prediction modeling[J].Expert Systems With Applications,2002(3).