2015年 第 5 期
财会月刊(5期)
审计·CPA
基于倾向得分匹配法的会计师事务所审计溢价分析

作  者
王 旭(副教授)

作者单位
(镇江高等专科学校,江苏镇江 212003)

摘  要

      【摘要】为了控制样本选择偏误,本文采用倾向得分匹配法来分析国内会计师事务所审计费用溢价情况。与线性回归结论相比,在国际四大会计师事务所、国内六大会计师事务所和国内一般会计师事务所之间仍然存在审计费用溢价;而在控制选择偏误影响后,总体溢价程度相对降低。通过Rosenbaum边界分析表明,国际四大会计师事务所相对国内六大会计师事务所或一般会计师事务所的审计溢价结果对未观测到变量不敏感,结论是稳健的。
【关键词】审计溢价;倾向得分匹配法;Rosenbaum边界分析一、引言
审计溢价是会计师事务所为弥补建立品牌所付出的成本而收取的较高的审计费用。国外多数研究认为,国际四大会计师事务所(简称国际“四大”所)在欧美成熟经济体能提供可靠的审计质量而得到市场的认可,取得了垄断性的市场份额和较高的审计费用(Simunic,1980;Peel和Roberts,2003)。在国内审计市场,国际“四大”所凭借其品牌相对于国内其他会计师事务所是否取得审计溢价并没有得到一致结论(耿建新和房巧玲,2006)。
Ireland和Lennox(2001)认为不一致的原因是研究方法存在问题,因为客户对会计师事务所的选择通常不是随机的,高质量客户倾向于选择大所审计,以往研究没有控制客户与审计师之间的自选择偏误。为了控制审计客户的自选择问题,本文借鉴Peel(2009)使用倾向得分匹配法(Propensity Score Matching),以2007 ~ 2012年间国内上市公司为研究对象,分析国际“四大”所(或国内“六大”所)与非国际“四大”所(或国内小所)相比审计费用溢价程度。结果显示,国际“四大”所、国内“六大”所、小所之间存在审计费用溢价,与线性回归结论相比,总体溢价程度相对降低,比如国际“四大”所相对非“四大”所只取得88%的审计溢价。通过Rosenbaum边界分析来衡量未观测到变量对处理效应误差的影响程度,结论显示国际“四大”所相对国内“六大”所或小所的审计溢价是稳建的。
二、文献综述与研究思路
Simunic(1980)首先对审计师是否收取溢价进行经验研究,结果显示,由于大所在审计时具有规模经济效应,所以“六大”所的审计收费略低于非“六大”所。而Francis(1984)、Palmrose(1986)研究则认为,无论在大客户市场还是在小客户市场,“六大”所审计收费都显著高于非“六大”所。Pong和Whittington(1994)研究发现,“六大”所的审计收费平均值要高于非“六大”所,但是在处理复杂的审计问题时,审计收费溢价低于非“六大”所而更有效率。Moizer(1997)研究认为,在一个竞争性日益激烈的市场中,不同会计师事务所之间的收费差异,代表了对会计师事务所高声誉资本投资的回报,但在不同的国家结论有所不同。Hay(2006)统计表明,在63份调查审计收费的研究中,支持在不同的国际“四大”所收取了溢价有42份,其余21份研究没有发现存在溢价。
国内伍莉娜(2003)、漆江娜(2004)等研究表明,国际“四大”所在中国审计市场审计费用存在显著溢价。李连军(2005)研究进一步发现,审计师声誉与审计费用的“质量溢价”呈正相关关系,不仅国际“四大”所的审计费用显著高于国内“六大”所, 而且国内“六大”所的审计费用也显著高于国内其他所。吴应宇等(2008)研究认为,国内“六大”所针对大型客户收取了高额审计费用,而小客户群则不存在溢价情况。但是李爽和吴溪(2004)用2000年 ~ 2001沪深两市A股上市公司为样本进行实证研究,并未发现国内前“六大”所(包括国际“四大”所)具有收费溢价。耿建新等(2006)在对会计师事务所审计质量和客户特征控制后,发现国际“四大”所收取的审计费用并不比本土会计师事务所高。因此国际“四大”所在国内外是否收取了溢价仍没有得到一致结论。
Ireland和Lennox(2001)认为,由于客户对会计师事务所的选择通常不是随机的,高质量的客户倾向于选择大型会计师事务所审计,审计客户并没有被随机分配到国际“四大”所或者非国际“四大”所,将所有审计客户纳入一起分析无法克服样本选择偏误问题而导致结果有偏。因此研究者开始使用Heckman两步法控制自选择问,例如Ireland和Lennox(2002)、McMeeking et al.(2006)研究发现,大所审计溢价显著为正;而Chaney et al.(2004)则研究发现,大所显著为负,大所的审计收费并不高于小所,相反客户如果选择与实际选择相反的会计师事务所,会支付更高的费用。Peel(2009)认为,Heckman估计在使用时可能由于不能满足其严格的假设条件,使得结论缺乏稳健性,因而会得出相反的结论。
针对以上问题,本文采用倾向得分匹配方法(Rosenbaum,1983),控制审计客户对会计师事务所的自选择问题,以中注协对全国前百家会计师事务所的评分排名为依据,将不同会计师事务所划分为国际“四大”所、国内“六大”所、国内小所三类,分析不同类型会计师事务所对客户收取的审计溢价情况,最后通过Rosenbaum边界分析未观察变量对匹配结论的影响程度。
三、研究方法
1. 倾向得分匹配法。Rosenbaum和Rubin于1983年提出利用倾向得分匹配法(PSM匹配法)来消除混淆因素(Confounding Factor)所产生的偏误,该方法已被广泛应用于药物治疗、政策实施效果评价等研究中。倾向得分匹配法通过均衡处理组(Treatment group)与控制组(Control group)之间的协变量分布,对非随机化研究中的混淆因素进行类似随机化的均衡制造一个“准随机”试验;其利用降维的思想,将多个特征变量浓缩成一个指标——倾向得分值,再通过它将处理组对象和控制组中预处理特征类似的对象相匹配,比较处理组与控制组结果差异。得到该因素的影响效果,可有效降低样本选择的偏误问题。
PSM匹配法是一种非参数统计技术,具有估计处理效应时不要求具有一定函数形式或服从特定假设的优点,比较适合于会计和财务领域。对于审计溢价问题,考虑到选择“四大”所审计的客户和选择非“四大”所的客户在某些关键变量上存在着系统差异,若将所有审计客户纳入一起分析,则无法克服样本选择偏误而导致结果不一致。这时可以借助PSM匹配法找到一组和选择“四大”所审计的企业特征相似的非“四大”所审计企业进行比较分析:“四大”所审计的企业同时被非“四大”所审计情况下两者的审计费用差异,即可认为是审计溢价。
PSM匹配方法运用步骤如下:
(1)选择变量后,采用Probit(或者Logit)模型估算倾向得分值。处理组为选择“四大”所(或国内“六大”所)进行审计的企业,控制组为不选择“四大”所(或国内“六大”所)进行审计的企业。
倾向得分被定义为在给定样本特征X的情况下,若企业选择“四大”所(或国内“六大”所)进行审计,则D=1,否则D=0,其概率表示如下:
P(x)=Pr[D=1|X]=E[D|X]       (1)  
(2)根据估算的倾向得分值选择匹配方法对处理组和控制组样本进行匹配。常用的匹配方法有最近邻匹配法(Nearest neighbor matching)、核匹配法(Kernel matching)、半径匹配法(Caliper or Radius matching)、分层匹配法(Stratification matching)等方法。
(3)检查匹配样本是否满足共同支撑假设(Common Support Assumption)和条件独立分布假设(Conditional Independence Assumption)。共同支撑假设要求处理组和控制组样本特征分布有一定相同的量,匹配质量才高,否则会影响结论。条件独立分布假设是假设在一组不受事务所选择影响的可观测协变量情况下,审计费用大小独立于事务所的选择,这时企业选择会计师事务所审计是随机的,就可以比较相同特征的企业在选择和不选择“四大”所审计情况下审计费用的差异。如果在匹配后发现两个假设不满足,应调整匹配变量重新计算倾向得分或者改变匹配方法,重复多次直到假设得到满足为止。
(4)比较匹配后平均处理效应,分析处理效果。匹配后总体层次的平均处理效应ATE为:
ATE=E[Y1-Y0]=E[Y1]-E[Y0]
={πE[Y1|D=1]+(1-π)E[Y1|D=0]}-{πE[Y0|D
=1]+(1-π)E[Y0|D=0]}
=π{E[Y1|D=1]-E[Y0|D=1]}+(1-π){E[Y1|D
=0]-E[Y0|D=0]} (2)  
[π]是样本总体中选择“四大”所(D=1)进行审计的客户所占比例,Y1和Y0分别表示同一客户在选择和不选择“四大”所审计两种情况下的审计费用。
处理组的平均处理效应ATT为:
ATT=E[Y1|D=1]-E[Y0|D=1] (3)  
控制组的平均处理效应ATU为:
ATU=E[Y1|D=0]-E[Y0|D=0] (4)  
ATT表示被国际“四大”所审计公司在不选择国际“四大”所审计的情况下审计费用的差异;ATU表示被非国际“四大”所审计的公司在选择国际“四大”所审计的情况下审计费用的差异;ATE表示样本中选择国际“四大”所和未选择国际“四大”所审计的企业审计费用差异的加权平均,三者中ATT是分析处理效应的重要结果。
2. Rosenbaum边界敏感性分析。Heckman(2008)研究认为,当存在未观测到的混淆因素时,倾向得分匹配法不仅不能消除系统偏差,反而会带来新的偏差。Becker和Caliendo(2007)也认为,在研究中检查估计的处理效应对假设偏离的敏感程度越来越重要。因此我们参考Duvendack(2011)使用Rosenbaum边界分析法来分析匹配结果受未观测到的变量影响的敏感程度。
假设公司i选择国际“四大”所进行审计的概率是Pi,则此概率不仅由观察到的配对变量Xi所决定,而且受到未观察到的变量ui的影响,由下式表示:
Pi=P(Xi,ui)=P(Di=1|Xi,ui)=F(βXi+γui)    (5)  式中:γ表示变量ui对企业是否选择“四大”所审计的影响程度;F表示logistic分布。
针对匹配公司i和j,其接受“四大”所审计的可能性分别由Pi/(1-Pi) 和 Pj/(1-Pj)表示,因而同时具有未观察到特征变量的处理组公司i和控制组公司j的概率比(odds ratio)由下式给出:
       (6)  
匹配过程要求i和j两家公司有相同或相近的可观察变量,即Xi =Xj,因此得到:
     (7)  
这时两家公司在选择“四大”所审计的概率通过参数γ和未观察到的协变量u的差异共同决定。如果未观察到的变量对进入处理组概率没有影响(γ=0),或者未观察到的变量对处理组和控制组个体影响相同(ui=uj),则概率比等于1,表明不存在与未观察到变量相关的隐藏偏误。随着γ和ui-uj的大小变化,可以估计处理效果受其影响的敏感度。假设Γ=eγ,确定的概率比范围如下:
      (8)  
式中:Γ=1(γ=0)表示不存在隐藏偏误,随着Γ值(未观察到变量u的系数γ的对数值)的增加,意味着未观察到的特征变量对处理组选择的影响也越大。Rosenbaum边界分析即针对不同Γ值计算的处理效应的置信区间来判断结论多大程度会被改变,如果包括零的置信区间的Γ值小于2,则意味着这时所估计的处理效应对未观测到的变量是敏感的(Duvendack,2011)。
四、样本选取与变量定义
1. 样本选取。本文选取2007 ~ 2012年沪深两市A股上市公司为研究样本,样本公司财务数据和治理数据来自CSMAR和CCER数据库,会计师事务所排名资料来自中国注册会计师协会每年公布的全国前百家会计师事务所综合排名,并进行了如下技术处理:①剔除银行、保险等金融类上市公司;②剔除财务信息、审计费用等数据缺失的公司;③为了控制异常值对模型结果的影响,对样本中连续变量进行上下1%分位缩尾处理。
为了分析不同规模会计师事务所的审计溢价情况,将其划分为国际“四大”所、国内“六大”所、国内小所三类。国际“四大”所是指普华永道、毕马威、德勤、安永在国内的合作所,国内“六大”所是指按照中注协每年发布的综合评价前百名会计师事所中除“四大”所之外的排名在前十名的所,国内小所是指在排名前百名以后的一般会计师事务所。选取的最终样本为8 860家公司,其中“四大”所共审计了487家,国内“六大”所审计了3 320家,其他小所审计了5 053家。
2. 变量定义及描述性统计。参考伍利娜(2003)、陈冬华(2006)、吴应宇(2008)、郭梦岚(2009)的研究成果,选择影响审计费用的变量及其描述性统计如表1所示:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


五、结果分析
1. OLS估计结果分析。本文先使用常规的审计费用模型来比较三类所审计费用溢价情况:
lnfee=α0+β1lnTA+β2large1+β3lev+β4soe+β15loss+β6
turnover+β7opinion+β8InvnAssets+β9quick+β10ROE+β11st
+β12eastregion+β13cenregion+τDUM+ε (9)  
式(9)中变量含义见表1,DUM分别表示变量big4、big4mid6、mid6small、big4small的结果,如表2所示,模型控制了年度和行业,并考虑异方差稳健估计,同时还以Logit回归结果表示不同企业在选择国际“四大”所、国内“六大”所、国内小所三类所审计时的差异。由表2可以看出,在控制其他变量时,会计师事务所变量DUM的系数均显著,big4的回归系数为0.745,表明国际“四大”所比非“四大”所有110.6%的溢价;big4mid6的系数为0.629,即国际“四大”所比国内“六大”所有87.6%的溢价;mid6small的系数为0.091,即国内“六大”所比国内小所有9.5%的溢价;而big4small的系数为0.806,即国际“四大”所比国内小所有123.9%的溢价。
用于会计师事务所选择的Logit模型包含的变量和OLS模型相同,结果显示,企业对选择“四大”所、国内“六大”所、小所审计时有一定倾向差异。总体来说公司规模、资产负债率、非标准审计意见、速动比率、公司注册地位于东部地区等变量影响了公司选择不同会计师事务所进行审计,规模较大的企业、注册地位于东部地区、资产负债率较低、资产流动性较好的的企业倾向于选择国际“四大”所进行审计,而具有第一大股东持股比例较高、资产周转率较快、大股东具有国有性质、公司所在地位于中部地区等特征的企业倾向于选择国内“六大”所进行审计。
2. 倾向得分匹配估计分析。下面以国际“四大”所和非国际“四大”所样本为例,说明利用最近邻匹配法进行倾向得分匹配的过程。
(1)计算客户选择国际“四大”所审计的倾向得分值。下图分别呈现了处理组和控制组在匹配前后的倾向得分值的核密度函数,从图中可以看出,二者分布存在明显差异,控制组非国际“四大”所审计的企业集中在倾向得分较低的部分(大多位于0.2以下),而国际“四大”所审计的企业相对分布较平稳,因此直接比较这两组样本公司之间的审计费用差异,所得到的统计结果会有偏的。同时倾向得分显示,两组之间有很大的重叠区,符合共同支撑假设要求。相比之下,在完成匹配后,两组样本倾向得分值的概率分布已经比较接近,匹配效果较好。
(2)利用最近邻匹配法进行样本配对。进行样本匹配时设置强制共同支撑(Common support),即在处理组中倾向得分值高于控制组中最大值或者低于最小值的观察对象会被丢弃,最终匹配成功8 660个样本。
(3)检查PSM匹配结果是否满足平行假设。Oakes和Kaufman(2006)认为,匹配后的变量标准偏差低于10%是可以接受的。从表3中可以看出,匹配后各变量在处理组和控制组间不再存在显著差异,除了变量eastregion为7%外,其余变量的偏差都小于5%,匹配结果较好。

 

 

 

 

 

 

 

 


(4)倾向得分匹配估计结果分析。表4列出了PSM匹配结果ATT值、模型对应的Rosenbaum边界分析的Hodges-Lehmann估计值和Γ临界值、OLS回归结果。从表4可以看出,ATT值和HL值非常相近,表明匹配的样本没有极端异常值。在不考虑未匹配样本的情况下,ATT值及HL值都显示,国际“四大”所和国内“六大”所存在显著的审计溢价。总体来说,国际“四大”所比非“四大”所收取了较高的审计溢价(约88%),但低于OLS回归结果的110.64%,说明在控制样本自选择后,审计溢价程度降低,OLS回归会高估审计溢价。另外,与OLS结果一致,国内“六大”所对小所溢价(11% ~ 12%)比“四大”所对国内“六大”所存在的溢价(73% ~ 74%)、“四大”所对小所溢价(约103%)程度低得多。
鉴于OLS结果提供了审计溢价的全样本(存在选择偏误问题)平均估计值,而PSM估值时样本则限制在共同支撑区域,因而三种结果只在一定样本范围具有可比性。从表4还可以看出,通过PSM匹配控制观察到的偏误后,仍然提供了有力的证据,支持如下结论:国际“四大”所相对具有相似特征的国内“六大”所收取了较高溢价,后者相对于所匹配的小所收取了较低溢价。
表4还列出了Rosenbaum边界临界Γ值,当它导致处理效果在5%水平上不显着。汇总数据显示,模型1(“四大”所与非“四大”所)中只有未观测到的变量导致客户在两类事务所之间出现选择偏误的Γ值在约6.2时,超过88%的溢价估计才会出现统计上不显著(模型2和模型4也能得到类似的估计)。而国内“六大”所对国内小所具有较小的审计溢价(11% ~ 12%),并且由于临界Γ值为1.4,表明结论相对未观察到的混淆因素影响更为敏感。

 

 

 

 

 

 

 

v3. Rosenbaum边界敏感性分析。表5以模型3为例,列示了PSM估计后的Rosenbaum边界分析值,其中sig+、sig-是Wilcoxon符号秩检验值,t-hat+、t-hat-、CI+、CI-是Hodges-Lehmann 点估计值。

 

 

 

 

 

 

 

 

 

 

在模型3中,当临界Γ值介于1.39到1.4时,处理效果结论在5%水平上不显著,这说明影响企业是否选择“六大”所审计的未观察到变量仅仅增加40%会导致审计溢价在5%的水平上不显著。这时未观察到的变量对事务所选择的影响很重要。Hodges-Lehmann点估计的95%置信区间包含了零(HL估计值为0.018),表明审计费用溢价接近于零。因此与表2中配对变量是否选择“四大”所的logit回归系数相比较,此数值大约是资产负债率(lev)和公司所在地在中部地区(cenregion)系数的0.639和0.560。也就是说,未观察到变量u对事务所的选择影响力至少要像资产负债率一样大,才会影响到ATT的结论。
表4中模型1、模型2、模型4的Γ临界值非常高,95%置信区间分别为6.2、5.0、8.8,Hodges-Lehmann点估计分别为6.0、4.8、8.5,意味着未观察到变量对事务所选择的影响力要达到这么高才会影响ATT值的变化。Duvendack和Palmer-Jones(2011)认为,临界值大于2时可以得出未观测到变量不敏感的结论。并且这样的敏感性分析描述了一个“最坏的情况”,只是说明处理效应的估计可能通过隐藏偏误而改变,但这并不表示这些偏误是一定存在的(Becker和Caliendo,2007)。因此我们可以合理地得出结论,这三个模型的ATT结果对未观察到变量是不敏感的,估计审计费用溢价的结果是稳健的。
为进一步证实结果的稳健性,本文还检验了不同匹配算法和不同倾向得分计算方式的可靠性。在匹配方法改为核匹配和半径匹配法时,结果显示审计溢价仍然存在,而且比最近邻匹配方法计算的结果更高(ATT分别为0.661和0.683)。并且不论用Probit还是用Logit模型计算倾向得分,结论也不没改变,国际“四大”所、国内“六大”所、小所之间显著存在着不同程度的审计溢价。
六、结论
为了控制样本选择偏误,本文采用倾向得分匹配法来分析国内会计师事务所审计溢价情况。与线性回归结论相比,在国际“四大”所、国内“六大”所、国内小所之间仍然存在审计费用溢价情况,在控制选择偏误影响后,总体溢价程度降低,比如国际“四大”所相对非“四大”所只取得88%的审计溢价,只有国内“六大”所相对国内小所获得11%溢价,略高于回归估计溢价水平。
我们还通过计算Rosenbaum 边界分析来衡量未观测到变量对处理效应误差的影响程度,结果表明,国际“四大”所的审计溢价结果对未观测到变量不敏感,而国内“六大”所相对小所的溢价则容易受未观测到变量的影响。总体来说,模型的ATT结果是稳健的,为会计师事务所审计溢价的存在提供了新的证据。
主要参考文献
Craswell A. T., Francis J. R., Taylor S. L.. Auditor brand name reputations and industry specializations[J]. Journal of accounting and economics,1995(20).
Peel M. J., Roberts R.. Audit fee determinants and auditor premiums: Evidence from the micro-firm sub-market[J]. Accounting and Business Research,2003(33).
耿建新,房巧玲.国际四大所与我国本土大所审计收费比较研究——来自我国证券审计市场的初步证据[J]. 当代财经,2006(1).
Rosenbaum, P.R., ‘Hodges-Lehmann Point Estimates of Treatment Effect in Observational Studies’,Journal of the American Statistical Association, 1993(88).
Francis J. R.. The effect of audit firm size on audit prices: A study of the Australian market[J]. Journal of accounting and Economics,1984(6).
Palmrose Z. V.. Audit fees and auditor size: Further evidence[J]. Journal of accounting research,1986.
Pong C. M., Whittington G.. The determinants of audit fees: Some empirical models[J]. Journal of Business Finance & Accounting, 1994(21).
伍丽娜.盈余管理对审计费用影响的分析——来自中国上市公司首次审计费用披露的证据[J].会计研究, 2003(12).