“学海拾珠”系列之二十三:因子择时的前景与挑战
由crisvalentine创建,最终由crisvalentine 被浏览 67 用户
报告摘要
主要观点
本篇是“学海拾珠”系列第二十三篇。作者在本文中证明,指标对因子收益的预测能力是视预测时长而定的,同时受指标与因子收益的时变关系以及数据挖掘的影响。尽管有这些挑战,但只要投资者能切实地意识到因子择时的局限性,因子择时仍有可能成为非常好的工具。
- 因子表现随时间变化很大
产生因子溢价的主要来源包括风险暴露的补偿、由于市场参与者的不理性而产生的回报以及市场摩擦的影响。这三个因素中的每一个因素,都会随时间变化而波动。
- 五类信号可以预测因子的回报
因子的回报可以通过金融环境、经济环境、情绪、价差和动量这五类信号来预测。价差和动量作为预测因子具有直观的逻辑;情绪指标反映了投资者承受风险的意愿以及承担这部分风险所需要的回报;宏观经济预测指标同样可以反映风险承受意愿和所需风险回报的变化,同时也能反映那些未被情绪指标捕捉到的市场变化。
- 建立因子择时模型的三个主要挑战
三个挑战分别为信号与因子收益的时变关系、选择性指标筛选以及数据修正,投资者应对择时模型的适用范围持谨慎态度。解决这三个主要挑战的方法包括使用简约模型或多信号模型。
风险提示
本文结论基于历史数据、海外情况进行测试,不构成任何投资建议。
短期投资因子周期性无法匹配
从早期金融理论开始,因子研究就在资产定价的学术研究中占据重要地位,某些特定的股票特征或因子驱动股票收益的概念也是现代量化投资和风险模型的基础。目前为止,学术界已经提出了许多不同类型的因子(如宏观经济因子,统计因子和基本面因子),当前使用较多的因子是价值、规模、动量、低波动、质量和流动性。
然而,因子的表现随时间变化波动较大。如图表1所示,在1990年代后半段,小市值股票和价值股表现不佳,而成长型科技股表现则十分抢眼。从科技泡沫破裂到2007年之间,小市值股和价值股在2000年代中期表现突出(2007年价值因子再次“失宠”)。小市值股在全球金融危机后的表现优于价值股,但从2010年起表现一般。高质量股票(拥有较高的ROE和ROA且债务较少的公司)和低波动的股票在2008年前一直不受欢迎,但在全球金融危机之后的几年中表现强劲。
为什么因子收益会随时间变化?首先,作者认为这是一定会发生的;如果没有收益的这种波动,则潜在的收益将被迅速套利。换句话说,这些因子一开始就是不存在的。
要真正理解为什么因子收益会随时间变化,将风险溢价按照其关键组成成分分解是很有帮助的。尽管各个因子的相对大小不同,但每个因子溢价的主要因素是:
- 风险暴露的补偿
- 由于市场参与者的不理性行为而产生的回报
- 市场摩擦的影响
直观地讲,这三个因素中的每一个因素,都会随时间变化而波动。例如,随着特定风险来源发生变化,承担该风险的回报将相应地变化。同样,市场中出现过度反应、反应不足或其他非理性行为的程度会系统性的资产定价偏差,这种偏差同样随时间发生变化。另外,市场摩擦的程度也会减慢或扭曲价格发现的过程。
尽管这些波动体现了因子分散化的好处,但它们也说明了分散化的局限性,当因子之间的相关性提高时,因子分散化往往无法充分发挥作用。不过,因子驱动因素的不断改变也可能有助于改善静态因子的分配,并在一定程度上更好地规避风险。
文献综述
学术界围绕预测全市场收益已做了大量的研究。坎贝尔和席勒 [1998]发现有依据表明,周期性调整的市盈率(CAPE)可以预测长期(未来10年)的股票收益,研究的基本原理是基于股价均值回归:异常高的股价最终会在未来下跌,从而使相关财务比率回到更正常的历史水平。坎贝尔和席勒模型一直到今天仍然是预测长期股票收益的开创性模型。
之后的论文集中研究市场是否可以在较短的时间范围内实现因子择时。黄等学者[2015]表明情绪指标在一个月的时间范围内有预测效果。其他的预测因子包括总市场的隐含资本成本(Li,Ng和Swaminathan[2013])、股票市场的波动率(Merton[1980];French,Schwert和Stambaugh[1987])、新股和新债总额中的股权份额(Baker和Wurgler[2000])、低信用评级公司债券收益率和一月国库券收益率之差(Keim和Stambaugh[1986])、历史实际盈利(Campbell和Shiller[1988])、股息率(Fama和French[1988])、横截面beta溢价(Polk,Thompson和Vuolteenaho[2006])、期限利差(Campbell[1987];Fama andFrench[1989])、通货膨胀(Campbell和Vuolteenaho[2004]),以及投资占资本比(Cochrane[1991])。
在因子收益预测领域,从业者已经检验了许多上述与总体股票市场有关的预测因子,但当前的文献,特别是学术领域的文献仍然有限。目前已知的文献主要围绕不同的预测因子进行研究,包括市场指标、情绪指标以及宏观经济指标:
- 价值:这是从坎贝尔和席勒框架到因子的扩展。Garcia-Feijóo等[2015]用低风险策略证实了坎贝尔和席勒的依据,这些策略在低beta股票表现出较高的B/P之后的一段时间里表现较好,如果这些股票在接下来的一段时间内动量效应明显的话表现会更好。
- 情绪:Baker和Wurgler在2006年完成了将投资者情绪与因子表现挂钩的开创性研究。作者假设情绪可以影响例如规模、公司成立时间、波动性、股息率、增长和盈利能力等因子。具体而言,当情绪低迷时,小市值、成立时间较短、波动性较高、盈利能力较低、不支付股息、增长速度高于平均水平以及公司运营状况不佳的股票的后续回报相对较高。研究表明,投资者在情绪低迷时倾向于避开这些股票。
- 宏观经济:这一领域的研究侧重于宏观经济指标与因子表现之间的关系。最近的一些例子包括Muijsson,Fishwick和Satchell [2014]对因子与利率变动之间关系的研究,以及Winkelmann等人[2013]认为因子对具有不同现金流特征的宏观经济冲击的反应不同。
哪些信号可以预测因子回报
在本节中,作者将讨论可用的候选信号类型及其背后的投资原理。图表2总结了现有文献中最常提出和分析的五个主要信号类别。
金融环境(Financial Conditions)是反映特定市场中金融稳定性的指标,包括货币供应量的增长、长期债券和短期债券的利差以及低评级债券和投资级债券的利差等度量标准。
尽管经济环境与金融环境密切相关,但作者将两者进行区分,经济环境指标(Economic Conditions)主要衡量了经济是否健全、经济增长速度、经济稳定性等等。
情绪(Sentiment)是一个笼统的术语,它描述了投资者如何看待外部环境。Baker 和Wurgler(2006)将其描述为“投资者进行投机的倾向”,它与金融和经济环境密切相关,因为糟糕的金融和经济环境通常会使投资者感到紧张和规避风险。但是,情绪反映了金融数据或经济数据未反映的内容,这些数据包括采购经理人指数(PMI)和芝加哥期权交易所波动率指数(VIX)。
最后两个类别是价值(Value)和动量(Trend/Momentum/Persistence)。这两个类别与前三个类别的不同之处在于它们取决于因子本身。价值反映了一个因子相对于其他因子或其自身的相对水平,动量反映了该因子的近期表现。这些指标与外部环境或投资者的总体思维方式无关。
信号背后的投资逻辑至关重要
候选信号与未来因子收益之间的关系应该是什么样的?投资背后的理由不充分的话,数据挖掘驱动信号选择所造成的风险就会太大。
价差和动量作为预测因子具有直观的逻辑。坎贝尔和席勒(Campbell and Shiller,1998)认为,股票市场的价值长期来看是均值回归的。被热度炒高的股票最终会回归至历史平均水平。这种直观的逻辑可以扩展到因子层面。
为了说明这种周期性,作者在图表三中绘制了价值因子(B/P和CFO/P的等权因子)的IC相对于价值差的曲线。IC为因子在12个月内因子的平均表现,价值差衡量的是低估值和高估值的价值组合之间的B/P差异。可以看到,随着低估值股票的估值变得越来越低,而高估值股票的估值变得越来越高,价值差也越来越大,价值因子的表现也不佳。当价值差持续扩大且低估值股票的估值远低于其公允价值时,市场参与者开始寻找投资机会,价值因子开始再次跑赢大盘。
与价差类似,动量作为因子收益的预测指标的直观逻辑与动量作为股票收益的预测指标(如Jegadeesh和Titman[1993])和资产类别预测指标(如Ang,Goyal和Ilmanen [2014])相似。在均值回归开始之前,最近一段时间表现优异的因子往往会继续表现出色。
理解情绪和宏观经济变量要更困难一些。情绪指标在很大程度上反映了投资者承受风险的意愿以及承担这部分风险所需要的回报。宏观经济预测指标同样也可以反映风险承受意愿和所需风险回报的变化,但它们可以反映那些未被情绪捕捉的变化。随着市场风险偏好发生波动,承担风险所需的补偿也随之变化。例如,由于防御性因子的beta值始终较低,因此投资者往往认为防御性因子(低波动因子和质量因子)在大多数时期风险较小。而另一方面,价值差和动量则可以在高风险和低风险、高beta和低beta之间交替变化。对于宏观经济周期中的每一时刻,必须考虑到伴随的风险水平的变化以及市场参与者对该风险的态度。
因子预测指标的实证依据
接下来,作者着重探讨实证依据。对于因子投资组合,作者使用Kenneth French网站上提供的美国Fama-French数据。具体而言,作者使用Fama-French多头因子投资组合进行分析,其中包括在纽约证券交易所、美国证券交易所和纳斯达克上市的按相关因子特征进行排名的前30%的证券。作者用到的Fama-French因子是规模、价值、盈利能力、投资和动量。作者认为,盈利能力和投资都是质量指标。低波动率不是作者认为的Fama-French因子之一,因此作者将其排除。Fama-French的所有投资组合均按市值加权,并且除动量(每月调仓)外,每年进行调仓,在计算长期收益之前扣除交易成本。多头因子投资组合的表现如图表4所示。
首先来看一个特定的因子。图表5显示了美国期限利差(以20年期美国国债收益率减去三个月的国库券利率计算)以及Fama-French盈利能力因子(多头投资组合)相对于市场的超额收益。从历史上看,作者观察到收益率曲线较陡的时期与经济环境恶化(利差扩大)相吻合。在经济放缓期间,收益率曲线变得非常陡峭,最陡峭的点通常发生在经济衰退的低谷,正如Fama和French[1989]所述,这个最陡峭的点可以预测未来的增长。在经济低谷期间,投资者对包括股票在内的风险资产要求更高的补偿。在衰退结束后,防御性资产表现不佳。因此,在盈利能力因子投资组合表现不佳之前会出现一段陡峭的曲线,这与作者之前提出的基本原理是一致的:利因子通常是防御性的,多头标的通常是低成长的大型公司。
接下来,作者研究了预测信号和预期因子收益的相关性,以总结两者之间的关系。预测信号与未来因子收益之间的相关性捕获了信号与因子之间的方向性和幅度。图表6总结了在不同预测时长下不同的财务信号与未来因子收益之间的相关性。可以看到,期限利差与盈利能力之间的相关性在所有预测时长下均为负,且随着预测时长的增加,两者之间的负相关性越发显著,预测时长为一个月时,相关性仅为–0.18,但是增加到一年时,相关性高达–0.46。总的来说,TED利差和期限利差是对六个月以上的预测时长的有力的预测指标,尤其是对于价值、盈利、投资和动量因子。
图表7总结了其他指标与因子收益的相关性,包括住房市场、情绪、席勒和动量指标等。黑色单元格表示相关性较强(正相关和负相关0.75以上或–0.75以下),白色单元格表示相关性较弱(相关性介于–0.25和0.25),灰色单元格位于0.25和0.5之间。
在经济环境指标中,4个信号(单位产出增长率、个人储蓄率、消费者物价指数CPI和生产者物价指数PPI)与价值和投资因子在一年或更长时间的预测范围内具有相当强的相关性。VIX和情绪指标在一年及以后的时间里具有很强的预测关系,但是与其他因子之间的关联并不统一。价值指标与未来因子的表现有很强的关系,尤其是在更长的预测范围上。过去三个月的因子收益作为一个信号对某些因子来说预测能力非常显著(对于规模、价值、盈利能力和投资因子最为强劲)。
结果证实了以下信号与因子收益的关系:价差与未来因子收益之间的正向关系、过去因子表现(动量/持续性)与未来因子收益之间的正向关系、情绪与规模/价值之间的正向关系以及情绪与盈利能力/投资之间的负向关系。当然,预测的时长很重要,在一个月的时间范围上,没有信号展现出较强的预测能力。
因子择时的风险与不足
但是,若使用在历史上与因子未来收益呈现显著相关性的信号进行择时,在实际应用中往往不够理想。此外,历史上观察到的某些关系可能是受到随机因素的影响。在本节中,作者研究了在构建择时模型时面临的困难。
作者认为,建立因子择时模型主要有三个挑战:
- 信号与因子收益的时变关系
- 选择性指标筛选
- 数据修正
信号与因子收益的时变关系
作者认为最主要的困难是信号和因子之间的时变关系问题。例如,作者在图表8中绘制了美国企业信用利差与价值因子在未来一年的收益之间的关系,信用利差以BAA和AAA企业债券之间的收益率利差衡量。信用利差在2000年价值因子收益上升之前的几个月中有所下降,但在2009年,在价值因子收益上升之前信用利差反而显著增大。
这两个时期有什么不同?最重要的区别是,在2000年,价值型股票是低beta的),但在2009年却是高beta(见图表9)。
当然,这两个时期的经济和金融环境之间还有其他差异。2000年,美国主要贸易伙伴的经济增长仍然强劲;2009年,全球金融危机对全球经济产生了广泛影响。但是,作者认为差异更多是来源于与价值相关的变化。
选择性指标筛选
因子择时的第二个挑战是数据挖掘的问题。识别历史上在预测因子收益方面效果很好的信号与站在当前挑选能够预测未来因子收益的信号是完全不同的。建立因子择时模型时,即使是在充分的理论和学术支持下也是不够的,因为学术研究往往围绕于那些似乎已经体现出一定预测性的信号,而对于那些看似不具有预测性的信号则不太会过多关注。
举例来说,作者研究在1970年至1990年之间预测能力较为显著的信号在1990年至2010年之间是否会起作用。结果总结于图表10。
毫不意外,作者发现1970-1990年期间表现强劲的许多指标在1990-2010年期间预测能力不佳。具体来说,作者利用1990年的数据对不重叠的三个月因子超额收益和38个宏观变量进行了单变量回归,发现18个规模指标、3个价值指标、2个盈利能力指标、10个投资指标以及9个动量指标的beta系数在统计上显著。但是,当作者使用1990年至2010年的数据重复该回归时,只有1个规模指标、2个盈利能力指标以及1个动量指标具有显著的beta系数,没有任何价值和投资指标的预测能力显著。这个现象在不同预测时长范围上均类似。
数据修正
第三个困难是数据修正,尤其是宏观经济指标的数据修正。虽然诸如双边汇率和证券价格之类的财务数据一般不会发生变化,但是实际经济活动和价格水平的度量指标通常会被修正,比如国内生产总值和失业率这两个宏观经济指标通常在公告后会重述。因此,包含这些指标的回测可能会使用到未来数据,无法准确反映预测时能够获得的实际信息。
克服因子择时的挑战
综上所述,因子择时是极具挑战性的,投资者应该对各类择时模型的适用范围持谨慎态度。但与此同时,作者认为在因子择时领域所做的努力也并不是完全白费的,如果投资者有足够长远的眼光并且了解即使是好的因子择时策略也不会在每个时期都成功,那么因子择时仍然可以成为一个非常好的工具。
作者认为有一些方法是值得讨论的。首先是使用简约模型,目的是仅使用经过研究并具有理论逻辑的一些指标。这种方法虽然无法使用到全部的可用信息,但也不太容易受到噪声和选择性筛选指标的影响。价差和动量信号在这方面是不错的选择。
我们可以考虑使用基于Campbell和Schiller[1998]的框架,仅使用价差作为信号。当因子的估值过高时,放弃使用该因子。在该框架下,投资组合是根据4个因子投资组合进行等权配置的,4个因子为价值、规模、低波动和质量。每月将会根据股票的价值、市值、波动和质量将股票分为5组。定义B/P差为第5组的B/P中位数减去第1组的B/P中位数。当B/P差较大且为正数时,该因子的估值较低。当B/P差为负时,该因子的估值较高。
将当前的B/P差与历史B/P差的平均值进行比较,如果给定因子的估值较高且和历史均值相差超过一个标准差,则该因子将从投资组合中剔除三年,其余因子等额加权。将此动态策略的结果与等权静态策略进行比较,如图表11所示。截止至2015年12月,择时动态投资组合年化收益率为11.28%,静态投资组合为9.14%,MSCI世界指数为7.57%。
另一方面,利用多个指标构成的多信号模型也是一个值得关注的择时框架,尤其是对于不到一年的预测范围,这种方法的好处是它可以利用信号和因子之间更细微的关系。
例如使用含4个预测信号的模型,预测指标分别为价差、动量、宏观经济指标以及情绪指标。如图表12所示,结果表明由4指标构成的择时模型相对于静态、等权分配的投资组合具有超额收益。自1997年1月至2015年9月,按年化收益率计算,动态策略优于静态策略1.08%,与MSCI全球指数的追踪误差降低了0.05%,使信息比率从0.88提升至1.17。
结论
关于因子择时,不同的人会有不同的看法。择时模型的建立无疑是具有挑战性的,必须考虑一系列潜在的缺陷。例如过去一段时间,一些预测指标在一定时期内对因子的预测看似十分有效,但实际应用上往往失效。同时,事后回顾地进行指标筛选也带来了潜在的问题。因子投资的回报是不可否认的,但同时风险也是真实存在的。本文认为因子择时是可能成功的,只要投资时长足够久,以便择时模型有足够的时间带来回报。
究竟是什么导致了因子收益的时效性?作者认为这与长期投资者和短期投资者比例的边际变化有很大关系。只要长期投资者的风险承受能力和分散短期因子收益波动的能力更强,他们就会成为短期投资者天然的对手方,作者认为这是一个值得进一步研究的领域。
本文核心内容摘选自B & S & T & Z在Journal of Portfolio Management上发表的论文《因子择时的前景与挑战》
风险提示
本文结论基于历史数据、海外情况进行测试,不构成任何投资建议。