研报&论文

主导跟随模型:利用因子模型进行指数跟

由crisvalentine创建,最终由crisvalentine 被浏览 24 用户

报告摘要

研究背景

被动管理基金通常密切复制跟踪指数的投资组合。完全复制指数策略在很多情况下由于指数权重变化产生的股票交易成本,以及较小权重股票的流动性成本,导致成本高昂。部分指数复制的方法能够极大降低交易和流动性成本,因此在实践中被普遍使用。

部分复制指数方法介绍

简单选择:根据特定选择标准对成分股排名,选择排名最高固定数量的成分股构建组合,缺点是可能无法完全复制指数。优化选择:通过解决具有条件约束的优化问题来选择跟踪投资组合中的资产,缺点是模型复杂并且计算量很大,可能包含冗余资产。覆盖指数结构:通过分层抽样和分层聚类等方法选择资产来模拟指数结构,缺点是面临决定资产数量及指数跨期跟踪风险。

Follow-the-Leader:主导跟随方法

主导跟随方法通过追踪驱动指数回报的因子,选择一组完全捕捉标的指数因子结构的资产来实现指数跟踪。实现步骤:首先估计跟踪指数回报的系统性因子的数量,其次通过主成分方法估计因子载荷,最后通过迭代过程选择主导个股集构建跟踪组合。主导跟随方法计算简单,能够完全代表指数的因子空间。蒙特卡洛模拟结果显示,相较于其它方法,Follow-the-Leader方法在模拟测试中表现更好,跟踪误差低,并且参数灵敏度较低。

实证研究

跟踪标准普尔500等权重指数:时间区间为2015年至2016年,使用滚动窗口进行样本外分析,样本期为1年,样本外为1个月,选取整个样本期间始终保留在指数中421只成分股。通过主导跟随方法计算得到主导个股组合,使用CM-2006和简单选择方法作为对比,主导跟随方法平均选择28只主导个股,跟踪误差、换手率及其他跟踪效果指标也好于对照组。

接下来通过将第一期的17只个股作为整个样本期的基础投资组合进行改进,改进后的方法换手率从3.18降低到1.11,平均持股个数减少到23只。

跟踪 MSCI 美国小盘股指数:时间区间为2016年至2019年,每期样本区间为2年,样本外为1个月,指数成分股数量为1391只,远多于标普500指数,并且流动性更低。结果显示主导跟随方法平均使用38只主导个股。与CM-2006相比,主导跟随方法的MSE降低了大约20%,换手率大约降低40%。

结论

本文提出了一种新的基于因子的主导跟随方法,用于构建跟踪指数的成分股组合。该方法易于执行并且计算相对简单,通过选择较少的成分股选择构建投资组合,能够以非常小的跟踪误差跟踪基础指数,并且选定的主导个股随着时间的推移是稳定的。主导跟随方法由于复制指数所需的换手率更低,指数基金使用该方法可以极大地节省交易成本。

文献来源

文献来源:XIN ZHANG, LANWU and ZHIXUE CHEN, “Follow the leader: Index tracking with factor models (Nov, 2021)”, Journal of Empirical Finance.

文献亮点:

基于因子模型的新进展,本文提出了一种新的方法—主导跟随方法—来选择部分成分股来复制指数的投资组合。本文的方法基于因子模型,并采用了一个独立的资产选择过程,该过程可以得到一个稳定的代表指数因子空间的资产子集。此外,本文构建的方法可以很容易地用于合成复制指数,其中不属于该指数的资产(比如期权或期货)可以加入到复制投资组合中

摘要

本文构建的模型选择了一组主导股票,这些股票组合完全代表了要复制的指数的因子结构。蒙特卡洛实验表明,因子模型构造的指数副本能够以非常小的跟踪误差跟踪基础指数。实证研究中,本文通过跟踪标准普尔500等权指数和摩根士丹利资本国际美国小盘股指数的样本外表现,展示了该方法的适用性。本文构造的方法可以很容易地适用于综合指数复制,并纳入流动性或交易成本的控制措施。

介绍

被动管理基金通常密切复制跟踪指数的投资组合。例如,交易型开放式指数基金(ETF)可以低成本复制跟踪指数投资组合,并且可以像股票一样交易。最简单的指数跟踪策略是完全复制指数策略,该策略构建包含指数中所有成分股的投资组合。然而,由于指数权重变化产生的股票交易成本,以及较小权重股票的流动性成本,这种复制指数的成本高昂(Beasley等人,2003年)。另一种策略是部分复制指数,即仅使用指数中的有限数量的成分股构建复制投资组合。部分指数复制的方法能够极大降低交易和流动性成本,因此在实践中被普遍使用。例如,跟踪CRSP美国总市场指数表现的VanguardTotal Stock Market ETF(股票代码VTI)仅使用约3600种资产来复制基准指数中的约7000种资产。同样,由于固定收益ETF的基准指数通常持有数以千计的债券,其中许多债券几乎没有交易活动,因此大多数固定收益ETF使用部分复制的方法。

在本文中,我们提出了一种新方法,该方法选择部分指数成分股来复制指数。我们方法的基本前提是追踪推动指数回报的系统性因子,而不是追踪指数本身。具体而言,该方法是基于选择一组完全捕捉标的指数因子结构的资产。我们将这组资产称为主导资产,将我们的方法称为“主导跟随”(Follow-the-Leader)法。本文的主要贡献是基于对多维度因子模型的最新研究,提出了一种一致的方法来选择主导资产集。

本文构造的方法只需要估计资产收益协方差矩阵的特征值和特征向量,因此计算简单。首先估计解释指数回报的系统性因子的数量。通过Bai和Ng(2002年)、Hallin和Liška(2007年)、Onatski(2009年,2010年)或Ahn和Horenstein(2013年)提出的方法,可以稳定地计算出这一步的结果。接下来,本文使用Bai和Ng (2002)和Bai(2003)的主成分方法估计因子大小(或因子载荷)。最后,对于前两步得到的估计因子,本文通过一个迭代过程,通过公因子在指数成分股样本空间内选择资产集。

迭代结果表明,当样本数据的维度很大时,Follow-the-Leader方法会得到一组资产,这些资产始终能够跨越样本空间来解释指数(即𝑁,𝑇趋向于∞)。这样的一致性结果得益于Parker and Sul (2016) 的公因子识别方法。此外,本文的蒙特卡罗模拟结果表明,与其它方法相比,Follow-the-Leader方法在有限样本中表现良好,跟踪误差低,并且参数灵敏度也低得多。

为了验证本文提出的方法在实际中的有效性,接下来本文进行了一项复制S&P500 等权重指数的实证研究。实证研究结果表明,与其它资产选择方法相比,Follow-the-Leader方法的结果相对较好。构建的跟踪指数投资组合最多包含27只主导股票,可以以非常低的均方误差跟踪标准普尔500等权重指数。此外,与其它方法相比,Follow-the-Leader方法具有相对较低的投资组合换手率,因此可以有效地降低交易成本。MSCI美国小盘股指数包括更多的资产,平均流动性低于标准普尔500指数,当使用这个方法跟踪MSCI美国小盘股指数时,得到了类似的结果。

Follow-the-Leader方法的另一个优势是它可以很容易地用于合成复制指数,其中不属于该指数的资产(比如期权或期货)可以加入到复制投资组合中。此外,该方法可以将流动性或交易成本纳入到组合的衡量标准中,以便确保所选资产是交易成本最低的资产。

本文并不是首个研究指数部分复制问题的文章。一般来说,由于计算简单,指数跟踪问题分为两个步骤:第一是选择要包含在跟踪投资组合中的资产集,第二是估计跟踪投资组合中的资产权重。但是,试图联合解决这两个问题的方法计算很繁琐,甚至往往无法得到可行的解决方案。之前的大多数文献只关注第二个问题,而对资产选择的关注相对较少,Corielli和Marcellino(2006年)(下文的CM-2006)做了关于资产选择方法的最新研究。CM-2006提出了将资产包含在复制投资组合中的选择标准,该标准取决于这些资产的价格与估计的潜在因子的相关性。此过程通过特定的相关性阈值水平来选择哪些资产应该包含在复制组合中。本文的方法基于因子模型,这是受到了CM-2006的启发。但是,本文采用了一个独立的资产选择过程,该过程可以得到一个稳定跨越指数因子空间的资产子集。与CM-2006方法相比,本文的蒙特卡洛模拟和实证研究结果证明了本文提出的独立资产选择过程的重要性。

本文的其余部分组织如下:在第2节中,简要回顾了有关指数跟踪的文献,然后介绍构造的方法并研究其大样本特性,在第3节中,通过蒙特卡洛模拟总结了该方法的有限样本特性,第4节介绍了实证研究,第5节是总结。

指数追踪方法

指数跟踪问题

在本节中,我们将指数跟踪问题形式化。时间t的指数价格定义如下:

{w:100}{w:100}其中Pt和 {w:100}{w:100}和分别是股票价格和指数权重的N1和1N向量,时间𝑡=1,…,𝑇。在本文中,假设权重在时间𝑡是已知的。市场上可用的大多数基准指数都报告了成分股的权重或构建方法,也可以放宽这一假设而不影响本文的理论结果。本文专注于通过使用Q*1资产价格向量 {w:100}{w:100}来复制 {w:100}{w:100}的问题,它是 {w:100}{w:100}的子集;因此,𝑄 < 𝑁。这个问题也被称为抽样复制,通过使用包含较少数量的指数资产的跟踪投资组合来复制指数。在交易成本成为一个重要问题的情况下,基金经理将考虑对那些非常大的、流动性差或国际市场指数使用抽样复制。

跟踪组合定义如下:

{w:100}{w:100}其中𝜔是一个1 ∗ 𝑄的跟踪投资组合权重向量。

一般来说,由于计算简单,指数跟踪问题分为两部分:第一,选择要包含在跟踪投资组合中的资产集(估计 {w:100}{w:100});第二,估计跟踪投资组合的资产权重(即估计𝜔)。

试图联合解决这两个问题的方法计算很繁琐,甚至往往无法得到可行的解决方案。之前的大多数文献只关注第二个问题,而对资产选择的关注相对较少,即估计跟踪的投资组合的资产权重,该投资组合为指数投资组合的资产子集。权重是通过优化跟踪质量的度量来估计的,最常用的方法是最小化跟踪误差。以前的研究提出了基于简单启发式算法的最小化跟踪误差方法,如等权重、市值加权、或价格加权,(例如Beasley等人,2003年;Li等人,2014年),但也可以通过更复杂的数学方法,包括分级非凸方法(例如Coleman等人,2006年)和基于聚类的方法(例如Focardi和Fabozzi,2004年)。

资产选择问题的关注相对较少,该问题涉及确定跟踪投资组合中应包含多少资产和哪些资产。Karlow (2012)回顾了相关工作,将选择方法分为三类:第一是简单选择标准,第二是优化选择,第三是覆盖指数结构的方法。在“简单选择标准”方法下,根据给定的选择标准对资产进行排名,选择排名最高的资产纳入跟踪投资组合中。常见的选择标准是指数中的资产权重、市值(例如van Montfort等人,2008年)、业绩(例如Larsen和Resnick,1998年)、与指数的相关性或协整程度(例如van Montfort等人,2008年)、交易量(Rey和Seiler,2001年)和市场贝塔系数(van Montfort等人,2008年)等。这些启发式方法易于应用,但它们存在三个主要缺点:对资产数量的任意决定、包含过多具有重复信息的资产的风险以及无法捕获所有系统风险的可能性。

“优化选择”方法通过解决具有条件约束的优化问题来选择跟踪投资组合中的资产。优化问题尝试根据某种相似性度量对资产进行分组,然后仅选择一组具有代表性的资产。这些方法通常很复杂并且计算量很大。此外,由于跟踪投资组合在设计上将包含与指数非常相似并且可能是多余的资产,这些方法可能会产生缺乏多样化代表水平的复制投资组合。

“覆盖指数结构”方法旨在通过使用分层抽样(Maginn等人,2007 年)和分层聚类(Focardi 和 Fabozzi,2004 年;Dose 和 Cincotti,2005 年)等方法选择资产来模拟指数结构。这些方法大多保留了“简单选择标准”的简单性,同时也大大减轻了“优化选择”方法中包含冗余资产的可能性。然而,他们仍然面临决定资产数量以及指数跨期风险的挑战。“覆盖指数结构”方法下的第三种替代方法是基于降维的方法。而CM-2006和本文中提出的方法属于基于因子的方法。由于本文将CM-2006用作模拟的基准,因此在第3节中详细描述了这个方法。在下一节中,将介绍本文构建的Follow-the-Leader方法,以便稳定一致地选择要包含在跟踪投资组合中的资产子集( {w:100}{w:100})。

Follow-the-Leader主导跟随

在本节中,我们将描述Follow-the-Leader方法,以识别跟踪投资组合中具有价格 {w:100}{w:100}的资产集。假设指数中资产的收益可以用线性因子模型来描述,

{w:100}{w:100}主导跟随方法的基本前提是追踪驱动指数回报的因子,而不是追踪指数本身。我们将确定一组能够捕捉驱动因子𝐹𝑡变化的个股(主导个股),并且用这组个股构建跟踪投资组合。接下来在本节中将展示如何始终如一地识别这些主导个股。

首先用一个简单的例子来解释主导跟随的方法。假设方程中的因子数是两个 (𝑘=2)并且有一组 5 只主导个股能够完全代表这两个因子。考虑以下对每个主导个股的资产回报的回归方程:

{w:100}{w:100}当5个主导个股的集合完全复制了这两个因子空间,方程(4)中的回归残差将不再包含因子结构。因此,这些残差中因子数的估计值等于零。

{w:100}{w:100}在正式介绍本文的方法之前,先简要做一些说明。首先,本文的方法依赖于对因子收益和因子数量的估计。通过Bai和Ng(2002)和Bai(2003)提出的主成分(PC)方法可以获得等式(3)中因子收益和因子载荷的一致估计,通过使用Bai和Ng(2002)、Hallin和Liška(2007)、Onatski(2009,2010)以及Ahn和Horenstein (2013)中多维度因子模型提出的方法来估计因子数量。

{w:100}{w:100} {w:100}{w:100}

证明略。

上面的理论结果保证了Follow-the-Leader方法将对跟踪投资组合中的资产子集提供一致的估计,即跟踪投资组合中包含的资产将完全表征跨越指数的因子空间。

Follow-the-Leader选择方法实现

本节将逐步介绍利用主导跟随方法进行资产选择的过程。如上一节所述,该方法的理论结果是一个方向性的结果。它保证了在跟踪投资组合中选择的资产可以完全捕捉指数的因子结构,但有可能出现一些被选择的资产是冗余的。因此,接下来需要精心设计一个测试程序,选择表征指数所需的最少资产数量,同时保持一致性和计算效率。

{w:100}{w:100} {w:100}{w:100}可以通过现有文献中介绍的用于多维度因子型的任何方法来估计因子数量。在本文中,我们使用Bai和Ng(2002)的主成分方法。

上面介绍的Follow-the-Leader步骤使用来自指数成分股的资产子集来构建副本投资组合。此外,上述方法可以很方便地修改用来实现对于合成指数的复制,包含跟踪投资组合可能包括不属于指数的资产,比如其他股票、股票期权或期货。具体地,可以在第二步和第三步中,可以使用任何资产集,对它们进行排名,然后继续执行其余步骤。

基金经理往往希望优先考虑包含在跟踪投资组合中的股票子集——例如流动性最强的股票或交易成本最低的股票。通过修改步骤第二步和第三步中根据与因子的相关性排序,而是根据给定的流动性或交易成本衡量标准对股票进行排名,轻松地将此条件纳入算法。这个修改后的步骤将选择所需的股票,并仍然保证指数的因子空间可以被跟踪投资组合解释。

一旦根据Follow-the-Leader方法选择了要包含在复制投资组合中的股票子集,下一步就是确定投资组合的权重。权重估计方法不是本文的重点,因此下文将遵循以前的文献进行模拟和实证测试。具体来再使用CM-2006中的方法,通过最小化平方和误差来估计投资组合权重,该方法有两个约束条件:因子跨期约束和初始值约束。具体优化方法如下:

{w:100}{w:100}

蒙特卡洛模拟

在本节中,我们将测试Follow-the-Leader方法的小样本属性,其中的数据生成过程旨在捕捉动态因子模型对价格的影响。指数中的每只股票价格都是根据以下因子模型生成的:

{w:100}{w:100} {w:100}{w:100}最后将模拟的结果与CM-2006方法进行比较。CM-2006首先估计资产价格因子模型中的因子,而要估计的因子数量取决于选择的需要由因子解释的特定变异百分比,他们使用90%和99%的解释力来选择在模拟中的选择的因子数量。当估计出这些因子,接着执行以下步骤:


  1. 根据因子与指数的相关性对因子进行排序。
  2. 为每个复制因子的选择最小的 R平方
  3. 从因子1开始
  4. 将股票按与因子的相关性顺序排列
  5. 对第一个股票的因子进行回归
  6. 如果回归的R平方大于目标值,则跳过下一步
  7. 将与残差相关性最高的股票添加到回归中,然后转到步骤 6
  8. 对当前分析中包含的所有变量对下一个因子进行回归,然后转到步骤 6
  9. 如果所有的所需因子都达到目标精度值,则停止。

前面的过程还需要临时选择最小的R平方的值来复制每个因子。在本文的模拟中,使用最小值R平方= 0.80,这个取值和CM-2006论文中保持一致。最后一步是确定投资组合的权重。

{w:100}{w:100}对每个模拟数据集计算这些指标值,并计算1000次模拟和蒙特卡洛标准误差的平均值。此外,还计算了指数与副本投资组合(Correl)之间的相关系数。

我们分别了样本内和样本外样本的模拟结果。对于样本内的结果,使用N个资产生成T个时期的数据,并估计副本投资组合中的资产及其权重。对于样本外情况,我们使用N个资产在T期间生成的数据,但使用从样本内数据估计的资产和权重。

表1给出了𝑁=100和𝑇=500的模拟结果,并与CM-2006方法进行了比较。结果可以看出,主导跟随方法始终能够准确估计真实因子数量𝑘=10,而CM-2006中使用的启发式规则对事先选择的阈值比较敏感。具体来说,当解释方差阈值设置为90%时,它捕获的因子太少,𝑘 = 3,当解释方差阈值设置为99.9%时,捕获的因子又太多,𝑘=45。这导致CM-2006方法跟踪的结果非常不同。例如,在99.9%的解释方差阈值的情况下,投资组合看似良好的表现是因为该方法几乎完全复制了指数,具体来说对于成分股数量𝑁=100的指数,复制投资组合中的资产平均数量为95.4。而主导跟随方法更能准确估计因子数量,构建的投资组合平均资产数量为30.03个,本文倾向于认为这对于𝑁=100是合理的替代。此外,跟踪性能指标表明,无论在样本内还是样本外,方差阈值为90%时,主导跟随方法好于CM-2006,方差阈值为99.9%时,主导跟随方法与 CM-2006 表现不相上下。主导跟随方法仅使用30种资产就能够构建与指数相关性为99.98%的副本投资组合,其MSE值较低,为0.0071。主导跟随方法的另一个优点是计算速度。表1中的结果显示,使用CM-2006需要运行190小时,而使用主导跟随方法只需要不到5小时的时间。总之,通过前文构建因子和资产选择的步骤,主导跟随方法提高了计算效率并提供了更好的部分复制,而且在参数敏感性测试表现优异。

{w:100}{w:100}接下来,评估了主导跟随方法的有限样本性能。首先分析两种一般情况,分别为T>N和N>T的情况。表2中显示了样本内和样本外的测试结果。

对于T>N的情况,测试了𝑁=50和100,𝑇=125、250和500的结果。测试包含了较小的投资组合,数据使用6个月、1年和2年的日度数据。测试结果表明,对于所有测试的样本,因子数量的估计都是准确的。副本投资组合(主导个股集)中的资产数量在𝑁=50时不到N的一半,在𝑁=100时约为N的25%–30%。因此,主导个股的数量的增加明显少于资产总数的增加,不会随着𝑁的增加而成比例增加。𝑇的增加对主导个股数量的影响较小。正如理论所预测的那样,无论是在样本中还是样本外,所有跟踪误差度量都会随着样本大小的增加而改善。例如,当𝑁=50时,当样本中的𝑇从125增加到500时,均方误差(MSE)从0.0235减少到0.0089。类似地,对于𝑇=500,当𝑁从50增加到100时,MSE从0.0089 减少到0.0071。

对于N>T的情况,测试了𝑁=125、250和500的结果,其中𝑇= 50、100和250,涵盖了大约两个月到一年的日度数据的较大容量的投资组合。在T>N的情况下,测试的结果显示,主导个股方法对所有样本大小的因子数量的估计非常可靠。副本投资组合(主导个股集)中的资产数量与N相比相对较少,低至从N的10%(𝑁=500,𝑇=250)到N的48%(𝑁=250,𝑇=50)。模拟结果表明,当N>T时且𝑇≥100时该方法是可靠的。例如,𝑇=100时,MAD分别从𝑁=125时的 0.1346、𝑁=205时的0.1076和𝑁=550时0.0963,样本内呈现单调递减的规律。此外,当𝑇=250时,𝑁分别为125、250和500时,MAD值分别为 0.1143、 0.0992 和0.0811,同样呈现递减规律。

模拟测试还表明主导个股方法对于非常小的T和较大的N(比如T=50)的情况有一定局限性,原因在于在选择投资组合时,要求复制投资组合中的股票数量小于T。对于N比较大的情况,需要复制的投资组合中股票数量应该更多。例如(如表2所示),在𝑁=250、𝑇=50的情况下,模拟结果显示副本投资组合中平均需要120.61只股票。在这种情况下,不可能在给定小较小的𝑇(比如T=50)的情况下找到副本投资组合的最佳权重.但是此限制与本文中提出的 Follow-the-Leader方法无关,因为该方法仅被设计考虑选择要包含在复制投资组合中的股票子集,而不考虑投资组合权重。权重估计方法不是本文考虑的重点,因此我们遵循以前的文献,当在参数数量(投资组合权重)小于 T 时利用最小化残差平方和求解。

{w:100}{w:100}最后,通过模拟实验评估了弱因子(WeakFactors,具有小信噪比的因子)对得到的副本投资组合的影响。若干估计因子数量的研究证明了识别弱因子的重要性。本文使用 Ahn和Horenstein(2013)的数据生成过程,并使用1、2和3个弱因子进行模拟。具体来说,通过修改平稳因子的信噪比来创建如下弱因子:

{w:100}{w:100}其中,𝜃是信噪比,在给定模型中的误差是标准正态分布。本文将𝜃设置为0.17,和Ahn与Horenstein(2013)的设定一致。在表3中,与没有弱因子的基础情况相比,本文测试了具有1、2和3个弱因子的结果。测试结果表明,估计的因子数量不受影响,但随着弱因子数量的增加,主导个股的数量减少,但这种减少并不显著,从基础情况测试结果的平均30.032个主导个股到具有3个弱因子的情况的28.118个。此外,样本内的MAD 和样本外的MSE的准确性没有受到显著影响。

{w:100}{w:100}蒙特卡洛模拟结果证实了主导个股方法的一致性,并提供了有限样本中良好性能的证据。当时间序列维度的观察值数量大于副本投资组合中的资产数量,本文所构建的方法在T>N和N>T的大样本测试中表现良好。在大多数情况中,可以取较大的T值用于估计,例如只有六个月的每日数据,𝑇 = 125,因此时间数量大于资产梳理的这种限制在实际中影响并不大。

实证应用

跟踪标准普尔500等权重指数

在本节中,将前文构建的主导跟随方法应用于构建2015年至2016年期间的标准普尔500等权重指数的复制投资组合。鉴于指数基金很少进行日内交易,选择日度回报数据进行实证分析。指数和成分股收益收益数据来源于证券价格研究中心 (CRSP) 数据库。指数的成分股变化数据来源于Compustat。为简单起见,仅使用在整个样本期间保留在指数中的股票,从而得到421只股票。我们使用滚动窗口进行样本外分析,每期样本区间为1年,样本外为1个月。因此,第一个窗口为从2015年1月开始的250天样本数据,从中挑选主导个股并计算得到投资组合权重,将该交易策略应用于接下来的 21个交易日的样本外分析。计算滚动的每期估计因子数、主导个股数和跟踪效果指标(均值、STD.DEV.、MAD和SUPMOD),并计算整个结果的MSE、相关性和换手率(Turnover)。当投资组合较大或权重调整幅度较大时,换手率通常会更高。因此,换手度量被定义为副本权重的平均绝对变化:

{w:100}{w:100}使用CM-2006方法设置样本外效果的对照组,按照该方法建议的参数,即解释方差阈值设置为99.9%,R2阈值设置为80%。接下来还设置了“简单选择标准”的相关方法作为另一个对照组,该方法简单地选择与指数回报相关性最高的固定数量的股票来构建副本,本文选取了100只股票。

在表4中,我们使用主导跟随方法测试了12个样本外窗口中的两个对照组的跟踪效果。主导跟随的方法平均选择28只主导个股,复制投资组合中最多有45只股票,最少有17只股票。这意味着副本投资组合中只有指数中成分股数量的6.7%。即使得到的副本投资组合数量很少,但是相对于CM-2006和简单选择标准的相关方法,副本投资组合也具有较低的跟踪误差。

在表4中,我们还测试了主导跟随方法与整个12个样本外窗口期的基准相比的平均效果。使用Follow-the-Leader方法构建的副本投资组合在跟踪指数方面表现最好,在三种方法的测试结果中MSE最低(0.0635),相关性水平最高 (0.9835)。使用CM-2006方法构建的复制投资组合具有较大的MSE(0.1107)和较小的相关性。使用简单选择标准相关方法构建的复制投资组合具有相对较低的MSE(0.0656),但需要100只股票才能达到这样的结果。正如预期的那样,大量股票影响了这个简单选择跟随副本投资组合的的换手率 (4.0452),使其比主导跟随方法的投资组合副本的换手率(3.1846)高出30%,更大的换手率将导致更高的基金交易成本。

{w:100}{w:100}最后,本文提出了一种改进的实用方法,可以进一步降低Follow-the-Leader副本投资组合的换手率。具体来说,将在第1个窗口(表4)中挑选的17只股票作为接下来11个窗口的基础投资组合,并且仅当这17只股票无法跨越以下估计的因子空间时才将股票添加到该基础投资组合窗口中。换句话说,基金经理将在第一个月构建一个Follow-the-Leader副本投资组合,然后在下个月简单地添加股票,以防该投资组合无法捕获所有系统因子。在这种方法下,一个合理的假设是认为因子和跟踪这些因子的主导个股随着时间的推移相对稳定。这个修改方法的结果显示在表5和图1中。正如预期的那样,改进后的方法的换手率从3.1846降低到1.1123,效果明显。此外,MSE=0.0528,相关性为0.9832,总体跟踪误差和与指标的相关性也有所改善,。由于投资组合中持有第一个窗口的17只股票,捕捉系统风险所需的平均主导个股数量也从 28 只减少到23只。

{w:100}{w:100} {w:100}{w:100}

跟踪 MSCI 美国小盘股指数

本文的第二个实证分析实现了对2016年至2019年期间MSCI美国小盘股指数的复制。此次指数的复制与标准普尔500等权重指数的复制在三个方面有所不同。首先,本次复制专注于拥有大量资产的投资组合。MSCI美国小盘股指数旨在衡量美国股票市场小盘股的表现,该股票指数成分股约占美国自由流通调整后市值的14%,平均每年大约包含1700只成分股。其次,该指数包含的成分股平均流动性低于标准普尔500指数成分股。第三,本次实证研究从2016年到2019年,包括了更长的时间段。指数成分股和权重数据来自MSCI网站,为简单起见,本文只考虑了整个样本期间留在指数中的1391只股票。股票收益数据来自证券价格研究中心(CRSP) 数据库。同样使用滚动窗口进行样本外分析,每个样本内窗口期为2年,样本外为1个月。因此,第一个窗口期包含从2016年1月开始的504天样本数据,从中选出主导个股并计算出投资组合权重,并将该交易策略应用于接下来的21个交易日进行样本外分析。表6为实证分析结果,同样选择了两个对照组,第一个对照组为CM-2006方法,解释方差阈值为99.9%,R2阈值为80%,第二个对照组为“简单选择标准”相关方法,使用与该指数最相关的80只股票。我们还提供了指数与副本投资组合结果的对比图,如图2所示。结果显示,Follow-the-Leader方法相对于其他方法产生了更好的结果。与CM-2006相比,主导跟随方法的MSE从0.0569到0.0475,降低了大约20%,MAD变化不大,换手率大约降低40%。与在复制投资组合中使用80只股票的简单选择标准相关方法相比,主导跟随的方法产生了类似的 MSE,换手率降低一半,平均使用38只主导个股。

{w:100}{w:100} {w:100}{w:100}

结论

本文提出了一种新的基于因子的主导跟随方法,用于构建跟踪指数的有限成分股组合。主导跟随方法采用严格的资产选择步骤,因此不受其他方法中由于启发式选择规则而出现的参数敏感性问题的影响。该方法的步骤基于风险因子的估计,因此在收益上市直观的。此外,该方法易于执行并且计算相对简单。本文的蒙特卡洛模拟实验和实证研究结果表明,主导跟随方法通过捕获指数成分股所有系统因子得到估计指数副本投资组合(主导个股集),能够以非常小的跟踪误差跟踪基础指数。

实证研究还表明,主导跟随方法平均仅使用28只主导个股,就可以跟踪由421只成分股组成的等权重标普500指数,并且相对于其他研究提出的方法具有更低的均方误差。此外,对MSCI美国小盘股指数跟踪的实证研究结果表明,该指数由1391只股票组成,主导跟随方法平均只需要38只主导个股即可准确跟踪该指数。实证分析结果表明选定的主导个股随着时间的推移是稳定的。主导跟随方法由于复制指数所需的换手率更低,指数基金使用该方法可以极大地节省交易成本。

标签

交易成本因子模型投资组合优化风险管理投资策略
{link}