指数化投资组合的构建|2013年|第七月|财会月刊（下）|业务与技术|历年期刊|财会月刊

2013年第 14 期
总第 666 期

财会月刊（下）

业务与技术

指数化投资组合的构建

【作　　者】
孟迪薛建宏（博士生导师）

【作者单位】
（西北农林科技大学经济管理学院陕西杨凌 712100）

【摘　　要】

【摘要】针对大多数文献在构建指数投资组合的过程中仅考虑初始组合的构建忽略投资组合的维护以及交易成本等缺点，本文采用遗传算法追踪了2009 ~ 2011年的沪深300指数，在模型中加入成本及现金限制，对组合进行动态跟踪。同时，通过改变交易成本比率以及跟踪组合的变换周期，分别计算出了各种条件下的跟踪误差。研究结果表明，应用遗传算法可有效地实现对目标指数的动态跟踪。
【关键词】遗传算法跟踪误差动态跟踪投资组合

      一、引言
指数基金是指以指数成分股为投资对象的基金，其通过购买某一金融市场指数中的一部分或全部的股票，构建指数基金的投资组合，目的在于取得与指数相同的收益率。指数型基金因其低廉的费用、透明的管理以及长期表现超过主动型基金等优点而受到投资者喜爱。
指数投资组合的目标是跟踪基准指数，获得市场平均收益。然而，投资组合的收益与指数的收益相比，并不会完全相同，而是经常表现出或高或低的偏离，即存在着跟踪误差。跟踪误差度量了投资组合对于指数的准确跟踪程度，较大的跟踪误差即意味着组合面临着较高的风险。
根据组合中所包含的股票数量，指数跟踪方法可分为完全复制法和优化复制法两大类。完全复制法是指通过购买与指数相同权重的每一种成分证券进行投资。理论上，完全复制法能够完美地模拟市场指数，跟踪误差应为0。但现实中，当指数中所包含的股票数量较多时，由于交易成本、流动性、管理费用以及基金赎回等问题，完全复制法很难实现。另外，完全复制的指数跟踪方法需要一个有效的、高度成熟的证券市场。而中国证券市场波动性较大，且目标指数的更新和成分股的质量存在很大欠缺，采用完全复制法会带来高昂的成本以及较大的跟踪误差。
因此，大多数的研究都集中于优化复制法。优化复制法是指从指数中选取一定数量的股票来复制目标指数，使所构建的指数投资组合的跟踪成本控制在可以接受的范围内，并使跟踪误差最小。优化复制法构建指数型投资组合包含两个步骤：①从指数的成分股中选出一定数量的股票作为投资组合的标的，即“选股”过程；②确定各证券的投资权重，以达到复制指数的目标。
我们使用优化复制法追踪沪深300指数。针对国内大多数文献并未考虑交易成本的情况，我们在模型中加入交易成本的限制，采用遗传算法，追踪投资组合与目标指数之间跟踪误差的变化情况，并且对指数进行动态更新维护。本文采用2009~2011年的沪深300指数数据，数据来源于中证指数有限公司官方网站以及大智慧股票交易软件。
二、研究方法
1．指数跟踪模型的目标以及约束条件。指数化投资的目标为跟踪误差的最小化，其约束条件包括现金数量、交易成本的比例等。本文的模型充分考虑了上述目标和约束条件，模型中的变量定义如下：
N：指数中的股票数量；
K：投资组合中的股票数量；
?着i：投资组合中持有股票i的最小比例（i=1，2，3，…，N）；
?啄i：投资组合中持有股票i的最大比例（i=1，2，3，…，N）；
T：在此时刻将原有投资组合转换为新的投资组合；
Xi：在组合中股票i的数量（i=1，2，3，…，N）；
Vit：股票i在t时刻的价格（t=0，1，2，…，T）；
It：目标指数在t时刻的值（t=0，1，2，…，T）；
Rt：指数在t时刻的收益率，Rt=Rt/Rt-1（t=1，2，3，…，T）；
Ccash：在T时刻，投资组合中的现金量，Ccash<0：卖出投资组合中的股票得到的现金Ccash>0：可投资到投资组合中的现金；
C：在T时刻，投资组合中股票的总市值与现金量之和，表达式为：C=      VitXi+Ccash；
Fi（?孜，?兹，t）：t时刻，投资组合中的股票i的数量由?孜变为?兹时所产生的交易成本，?孜>0：卖出?孜-?兹股i股票，?孜<0：买入?孜-?兹股i股票，?孜=0：Fi=0；
?酌：交易成本在C中所占的比例（0≤?酌≤1）；xi：股票i在新的投资组合中的数量；
zi：投资组合中是否含有股票i，若含有，则zi=1，反之为0：
Ctrans：由原有的投资组合［Xi］变为新的投资组合［xi］所产生的交易费用，公式为：
Ctrans=      Fi（Xi，xi，t）（1）
rt：投资组合的收益率，有：

其中：      Vi，tXi为t时刻投资组合的总市值，      Vi，t-1Xi为t-1时刻投资组合的总市值。
跟踪误差的表达式为：
TE=（      |rt-Rt|2）1/2/T（3）
因此，可得指数型基金的目标：Min TE（4）
由式（2）、（3）、（4）可得目标函数的具体形式：
Min［      |log（                  ）-Rt|2］   /T（5）
其约束条件为：
      zi=K（6）
?着izi≤Vi，tXi≤?啄izi（7）
Ctrans≤?酌Ｃ（8）
      Vi，txi＝C-Ctrans（9）
xi≥0，i=1，…，N（10）
zi∈［0，１］（11）
上述条件中，式（6）表示投资组合中股票个数之和为K；式（7）包含两层含义：①若股票i不在投资组合中，则zi=0，即xi也为0；②若股票i在投资组合中，则zi=1，因此，xi受到以下条件的限制：?着i≤Vi，txi/C≤?啄i。
式（8）为交易费用的限制（r给定）；式（9）为现金平衡限制，即T时刻，投资组合的总市值应等于投资组合中股票的总市值与现金量之和减去总交易成本。
2．遗传算法。遗传算法是由美国著名学者、密歇根大学的Holland J.H.教授于1962年提出的，是一种适合于复杂系统优化计算的基于生物遗传和进化机制的自适应概率优化方法。它把自然界“优胜劣汰”的进化原理引入优化参数形成的编码串联群体中，按照所选择的适应度函数并通过遗传中的选择、交叉和变异对个体进行筛选，保留适应度值较高的个体，淘汰适应度值较差的个体。经过反复循环，直至得到满足条件的最优解。
遗传算法的基本步骤包括：①选择。按照一定的规则或方法，根据个体的适应度，从第i代群体P（i）中选出一定数量的优良个体遗传到下一代群体P（i+1）中。②交叉。将群体P（i）中的个体以交叉概率（crossover rate）进行随机配对，交换它们之间的部分染色体。③变异。群体P（i）中的每个个体，以某一概率（变异概率）改变某个或某些基因位上的数值，进而改变整个个体的数值。
遗传算法具有高效启发式搜索以及并行计算等特点，目前广泛应用于航空航天、智能控制、函数优化等方面，近年来在经济学中也有广泛的应用。
三、数据与结果
本文选择沪深300指数作为目标指数，从沪深300指数的300只股票中选出30只股票作为备选股票，构造指数跟踪组合。由于沪深300指数的调整周期为每半年一次（每年的1月和7月调整），指数跟踪组合的调整频率也为半年（约120个交易日）。为了充分考虑每次调整对目标指数的影响，选取2009年1月5日 ~ 2011年12月30日，共730个交易日的数据，在此期间，沪深300指数共进行过6次调整。我们通过改变投资组合的调整周期来验证投资组合跟踪目标指数的效果。文中所用数据均采用向前复权的方式进行处理，即数据已经包含了配股、分红、增发等情况对股价的影响。在不考虑冲击成本的前提下，假定跟踪组合的调整可在一天内完成，股票调整的价格按收盘价计算。沪深300指数2009 ~ 2011年的收盘价情况见图1。

1. 投资组合中股票的选择。在选择股票的过程中，主要考虑以下三个参数：股票的?茁值，股票的成交额，上市公司的总市值。其中，股票的?茁值代表了股票与市场的关联程度，若?茁=1，则该股票与市场指数的关系为完全正相关，即指数上涨1%，股票也上涨1%，反之亦然；股票的成交额代表该股票的流动性，流动性越高，代表该股票越受市场的青睐；上市公司的总市值代表公司的资本化程度，具有较高市值的股票在指数中拥有较大的权重，对指数变动的影响较大。
基于此，本文采用文献中的方法，首先将沪深300只股票的成交额及总市值进行数据归一化，随后对上述三个参数分别赋予不同的权重，计算方法如下：
Pi=?琢i?茁+?琢iA+?琢iM （12）
令?琢1=2|?琢2=1|?琢3=2，将得到的P值进行排序，选取其中最大的30个股票，构建投资组合：
Ccash=0.05C
2. 具体约束条件。由于指数基金的总资产由跟踪组合的市值和现金两部分组成，在构建初始投资组合中应考虑用于购买及赎回所保留的现金，该比例设为5%，即遗传算法的约束条件为：①初始跟踪组合包含30只股票，即K=30；②投资组合中任意一只股票的权重下限为0，上限为10%；③对交易费用?酌进行动态调整，分别取0、0.002 5、0.005 0、0.007 5和0.010 0；④对于T（换股周期），分别取T=60和T=120，即每3个月或每6个月更换一次权重股。
3. 实证结果。在选择完投资组合的标的以后，即可使用遗传算法计算各只股票在组合中应当占有的权重，进而分配资金。进行最优化配置的策略为：首先，以过去3个月的交易数据为样本，即采用T-60周期的数据，这部分数据成为样本内数据。其次，通过遗传算法计算出使跟踪误差最小化的各只股票的权重。最后，以此权重为基础，计算T+60或T+120周期的投资组合的跟踪误差，即：计算样本外数据的跟踪误差。由于T-60周期内的数据为既定的数据，因此，理论上样本内数据的跟踪误差应小于样本外数据的跟踪误差。我们的目标使样本外数据的跟踪误差尽可能的贴近样本内数据的跟踪误差。具体运算结果见下表及图2。

由图表可知：
（1）随着交易成本?酌的增大，跟踪误差呈现逐渐减小的趋势。由于成本约束的限制条件（式（8））为不等式，在计算最优组合时，模型会对?酌值进行动态调整，因此，理论上随着?酌的增大，跟踪误差（TE）会出现不断减小的趋势。而本文的结果证明了上述观点的正确性。
（2）样本内数据的跟踪误差小于样本外数据的跟踪误差同样得到证明；同时，样本内数据跟踪误差与样本外数据跟踪误差的变动方向一致，即：随着样本内数据跟踪误差的减小，样本外数据的跟踪误差也随之减小。
（3）在对周期T进行调整以后，我们发现：当股票更换频率减慢时，跟踪误差出现变大的趋势（?酌=0时除外）。这是因为：由于采用的是3个月的样本内数据进行最优化计算，在计算样本外数据时，若周期太大，则由于股票价格变动范围的加大，会导致对指数追踪的难度加大，则跟踪误差将会增大。
四、结论
目前，我国证券市场还很不成熟，导致我国股市的波动性较大，成分股经常变换，不利于指数的稳定。对于指数跟踪而言，这些缺点无疑增大了跟踪的难度。因此，能否寻找到良好的指数跟踪方法，在减小成本的前提下，尽可能地降低跟踪误差。针对大多数文献仅考虑初始组合的构建、忽略投资组合的维护以及交易成本等缺点，笔者在模型中加入成本限制，并对组合进行动态跟踪，结果表明：
（1）用遗传算法对目标指数进行跟踪，不仅可以创建最初的投资组合，解决构建问题，也可以在指数成分股发生变化时进行动态追踪。
（2）将指数化投资中的跟踪误差最小化问题转化为最优化问题进行求解。在考虑了成本约束、现金约束、投资比例约束等条件下，充分利用了遗传算法的非线性和多维的特点，得到了理想的结果。
（3）本模型同样适用于其他投资品种，例如债券。在熊市中，可将组合中的部分股票换为债券，尽管会出现一定的跟踪误差，但可借此提高组合的收益率。以牺牲一定的跟踪误差来换取超额收益，在熊市中是不错的选择。
主要参考文献
1. 高见，杨丹.指数化投资复制方法的比较分析.金融研究，2006；8
2. 劳剑勇.指数跟踪问题的广义双线性规划模型.应用数学与计算数学学报，2004；6
3. Treynor， J. L.， Black. F.. How to use security analysis to improve portfolio selection. Journal of Business，1973；1
4. Chang， K. P.. Evaluating mutual fund performance：an application of minimum convex input requirement set approach. Computers and Operations Research，2004；31
5. Roll， R.. A mean/Variance analysis of TE. Journal of Portfolio Management，1992；18