量化投资—一种主动投资的分析框架

用户成长系列
标签: #<Tag:0x00007f73eea36308>

(iQuant) #1

导读
1989年发表的论文《The Fundamental Law of Active Management》及其随后的相关论文揭示了寻求主动投资的$\alpha$收益的数量化关系,这为主动组合投资管理带来一套令人信服的分析框架,这个数量化关系很好揭示了数量化技术(量化投资)可以如何或者应该如何切入投资管理领域。

和被动组合管理(passive porfolio management)相比,主动组合管理(active porfolio management)更显投资水平的能力,或者说运气。被动投资力求完全复制相应的基准成分股及其权重,所以每当某指数做成分股的调整时,新入选的股票会走稍微强,被剔除的股票会走弱,源于追踪该指数的被动型基金需要做仓位调整。主动投资积极发挥投资管理人的主观判断力,选股(stock selecting)和择时(market timing):选股在理论和实践上都是可行的;择时,包括市场择时和因子择时。

1. 什么是$ \alpha与\beta $

资本资产定价模型(CAPM模型)强调证券市场组合是唯一的风险来源,个股的特别风险(specific risk)可以通过组合分散化,故不会有风险补偿。个股的期望超额收益仅与市场组合收益相关,且其关系为简单的线性关系:

$$E(R_i)-R_f =\beta_i(E(R_M)-R_f)$$

这里的,即个股和大盘的关联强度,$ R_f $为无风险利率。

多因子模型进一步补充到个股的收益由$K$个共同风险因子的风险补偿决定,而且和其对各个因子的暴露程度成线性关系:

$$ E(R_i)=R_f+\sum_{factor_j=1}^K{\beta_i*E(R_{factor_j}) }$$

投资组合中源于这些风险因子带来的收益称为$ \beta $收益,不可被这些风险因子解释的收益称为$ \alpha $收益。

信仰主动投资的人即使承认上述的理论,也认为现实世界市场不是一直以均衡或无套利状态下运行,故而他们相信,股票的收益率存在着

$$ R_i=\alpha_i+R_f+\sum_{factor_j=1}^K{\beta_i*R_{factor_j}}$$

对于某些股票是严格为正的,有些是严格为负的。他们致力于找到那些具有正的$\alpha$的股票。$\alpha$收益即为独立于其它具体风险的收益。某基金收益比之业绩基准收益存在显著的$\alpha$的话即为下面关系中$a_{fund}$显著不为0:

$$ R_{fund}-R_f =\alpha_{fund}+\beta_i*(R_{benchmark}-R_f)$$

故$\alpha$收益率即为上述回归残差收益率$ a_{fund}$(residual return)。

2. 寻找$\alpha$有什么用

$\alpha$收益是独立于其它具体风险的收益,寻找$\alpha$收益可以在你不增加额外风险情况下获得额外收益。组合通过超配具有正$\alpha$的股票,低配负$\alpha$的股票,同时保持各风险因子的暴露程度与指数基准一致(各$\beta$不变)可以做到“战胜”指数基准。

同时,当存在稳定且可观的$\alpha$时,可以通过对冲策略来对冲掉具体风险(比如做多股票通过做空股指期货对冲市场风险),而获得低风险、小回撤但稳健的回报。

3. 主动投资策略如何寻找$\alpha$

衡量一个主动投资策略的绩效最核心的指标是所谓的信息比例(IR,Information Ratio ),主动投资的$\alpha$收益与该$\alpha$波动程度的比值。它本质是一个风险调整后收益的衡量。IR越大,说明该策略越有吸引力。

$$ IR = \frac{\alpha_A}{\sigma(\alpha_A)} $$

IC是另外一个重要的指标,其衡量的是一个因子的预测收益率与其真实收益率的相关性,由通过计算股票的预测收益率(在$t-1$期末预测$t$期收益率)和真实收益率的横截面相关(cross- section correlation)得到:

$$IC = CORR( \hat{r}_t|t-1,r_t) $$

在一系列的简化假设下,存在如下的所谓主动管理基本定律(The Fundamental Law of Active Management):
hat
$$ IR = IC*\sqrt{N}$$

N代表独立的投资决策次数。

大体意思是:如果你的策略基于某个因子值进行预测,则因子预测有效性高(即IC越大越好),同时预测的标的资产越多、预测的独立性越大越好(即N越大越好),IR就越高。

故性价比高的策略需要兼顾因子的预测能力及预测范围,如果某个有效的因子只能局限于预测少数的资产标的,则该策略IR不会高,同时明显限制了该策略可容纳的资产规模。

实务中确实存在这种情况,追求可靠性高的买卖信号时,它发出买卖信息的频率或标的总是比较地低和少,而频率高的策略,胜率却总是比较低。

4. $\alpha$的来源

在一些简化的假设下(各股票相同收益率分布等),对于用单因子预测股票收益率,可以得到如下的$\alpha$来源:

$$ \alpha_i =\sigma(r_i)* IC*Z_{score}(i) $$

$Z_{score}(i)$ 为股票$i$在该因子值的标准化得分。该公式表达的思想是:

$\alpha $ (残差收益率) = 波动率 * IC * 预测得分 =机会 * 预测能力* 预测得分置信程度

比如,盈利超预期因子,该因子通常与随后的股票超额收益($\alpha $ ,实际收益率-预期收益率)存在强相关关系,假设IC值为0.8,代表该因子的预测能力相当高,股票A和B在该因子的标准化得分分别为1.2,1.8,相同波动情况下,则B的$\alpha $ 会更高,因为1.8意味着股票B比A更超预期,故其超原先预期收益的程度会更大。

该公式虽过于严苛的假设,实际应用受很大局限,但它提供了如下非常有意义的洞见:

1)波动率,即机会。没有波动的资产,或者波动低的资产,难以从中得到大的$\alpha $

2)IC,即预测能力,投资不过是一种预测,挖掘更多信息,寻找具有预测能力的因子,是获得更多$\alpha $ 的前提,这是决定主动投资战胜指数基准的根本因素。

3)预测得分,将IC的预测能力转为对各标的资产的打分,进而做到了正、负$\alpha $ 的区分。

IC,是所有主动投资策略的核心能力,尤其以量化投资的角度看,无非是运用更多更全的数据、更优化更先进的数学模型,挖掘出更有预测能力的高IC因子,当你具备高IC的因子时,上述公式告诉你,你可以获得高的$\alpha $ 。内幕消息就是那一类具有非常高IC,而普通人又无法拿到的因子。

5. 现实世界

遗憾的是,现实世界,任何因子的预测能力是动态变化的,即IC不是常数,一段时期该因子预测能力强,一段时期弱,甚至完全不相关。筛选因子不难,利用各种回测平台,可以很快计算各个因子在过去的预测能力,你可以筛选各时间段平均IC绝对值大于某个阈值的因子作为有效因子。但因子择时仍然很困难,决定当下哪些有效因子在起作用,以及其有效性将会维持多久不是简单的事,因子择时仍有“艺术”成分,仍需投资者“拍脑袋”决定。国内券商的因子研究报告引用因子半衰期的概念,按某因子预测收益率排序筛选出来的前N个股票若超过一半的股票不在真实收益率排序top N时,说明该因子在当前开始失效,需要谨慎使用。

IC的波动性如此重要,以至于通过一些其他的简化条件,有:

$$ IR = \frac {\bar {IC}}{\sigma(IC)} $$

即IR为IC的均值比其标准差,IC波动性被认为是投资策略的模型风险,如果投资策略IC方差大,意味着该策略在历史回测上表现良好,在未来可能遭遇滑铁卢。

寻找高IC的因子和机器学习中寻找有解释力的特征变量一样,属于特征工程的苦力活,可以用暴力的方法,搭一套大集群测试成千上万的的因子及其组合,力求找到最佳因子组合,也可以结合人的先验知识来自我定制。

6. 结束语

$\alpha$ = 波动率 * IC * 预测得分 =机会 * 预测能力* 预测得分置信程度

虽然推导该公式相当复杂和些许牵强的假设,但不妨碍其给出了有力的洞见,相当于给出了主动投资管理的框架,对于使用大数据技术来助力主动投资策略的开发,更是相当有指导意义。实际中,可以不必直接预测股票的收益率,只需计算因子秩值及其收益率相关性(或者直接使用秩相关系数),或者自定义一种距离来衡量因子值和收益率之间的关系,当我们获得了高IC的因子时,我们按因子排序取top N的股票即可以作为我们的投资组合了。

参考文献

  1. Grinold, Richard. "The Fundamental Law of Active Management."journal of Portfolio Management, vol. 15, no. 3, 1989, pp. 30–37.
  2. Grinold, Richard C. "Alpha Is Volatility Times IC Times Score, or Real Alphas Don’t Get Eaten."Journal of Portfolio Management, vol. 20, no. 4, 1994, pp. 9–16.
  3. Active Portfolio Management(2ed.Grinold,Kahn)