【研报分享】兴业证券:猎金 Alpha 因子探索系列之一

alpha
标签: #<Tag:0x00007f5b898c2fd0>

(aite) #1

猎金 Alpha 因子探索系列之一

投资要点

 作为多因子模型的核心,alpha 因子的探索和应用一直都是广大投资者关注的核心。本文所开启的 alpha 因子探索系列报告将致力于为机构投资者提供关于 alpha 因子的最新研究成果。

 从 alpha 因子产生的逻辑基础出发,我们提出可以从挖掘新的市场异象和提出新的构建方法两个角度挖掘新因子。同时也介绍了我们在数据库的使用及因子评价测试方法上的观点。

 我们介绍了三个比较新颖的 alpha 因子:自由现金流市值比、基于 RCVB的价值增强因子和流动性冲击因子。对于每一个因子,我们都详细阐述了因子的逻辑基础和定义,并在测试基础上给出了因子的具体表现及特点。

目 录

Alpha 因子,红海 VS 蓝海 .
因子蓝海探索——方法篇
基本框架
数据库的选择.
因子评价方法…
因子蓝海探索——实例篇
自由现金流总市值比 …
基于 RCVB 的价值增强因子
流动性冲击因子
总结与展望
图表 1 多因子投资体系
图表 2 因子 BP 的历史 IC 表现
图表 3 挖掘 alpha 因子的途径
图表 4 FCFP 因子定义
图表 5 FCFP 因子五分位组合表现
图表 6 不同估值因子比较
图表 7 不同估值因子相对基准的历史表现
图表 8 估值因子收益相关性分析
图表 9 增强价值因子定义
图表 10 增强价值因子五分位组合表现
图表 11 多空组合表现统计量对比
图表 12 多空组合历史走势对比
图表 13 不同股票池多空组合表现
图表 14 EP 与 BP 的历史权重 .
图表 15 流动性冲击因子五分位组合表现
图表 16 流动性冲击因子五分位组合历史走势
图表 17 流动性冲击因子在不同加权方式下的表现
图表 18 流动性冲击因子的历史 IC 表现
图表 19 流动性冲击因子历史累积 IC 表现 .

Alpha 因子,红海 VS 蓝海

众所周知,alpha 因子、风险模型与组合优化是现代多因子量化投资体系不可或缺的三个重要组成部分。在这三个环节之中,风险模型与组合优化已有不少优秀的商业解决方案,并在投资界中也形成了一定的标准(如:Barra 的风险模型、Axioma 的优化器等),其背后相对完善、精确的数量金融理论背景使得这两个部分的应用日趋成熟。

1

然而,投资组合超额收益的来源——alpha 模型的构建却是一个仁者见仁智者见智的问题。选择哪些 alpha 因子,各个 alpha 因子的权重应如何配置,这些问题到目前都没有一个统一完善的解决方案。不仅如此,随着市场中主动量化投资主体的增加,特别是多因子模型的广泛运用,传统 alpha 因子的超额收益在不断下降,而波动性则有明显上升的趋势。下图展示了价值因子 BP 在最近 6 年多的时间里,月度 IC 的表现。可以发现 BP 的预测能力在开始的三年里保持了很高的水平,但从 2009 年下半年开始,因子的预测能力明显弱化,近三年来的表现更类似于一个普通的风险因子。

是什么让诸如 BP 这类的传统 alpha 因子失去了效力?是 A 股市场已经十分有效了吗?我们认为,中国的股票市场远没有达到欧美股市的有效程度,但却呈现出了高度竞争的状态。市场及存在于期间的投资者从数据和自身的经验中不断的学习,因此昨天的市场“异象”(或无效点),很快成为了今天的随机噪声!那么如何能保持投资组合超额收益的稳定性呢?对于多因子策略来说,一个很自然的选择就是不断发现新的、市场还未充分反映的 alpha 因子。由本文所开启的兴业证券 alpha 因子探索系列报告,将努力带领大家脱离传统因子的“红海”,而向着更广阔的“蓝海”领域进发!

2

因子蓝海探索——方法篇

在充分认识到新 alpha 因子对量化投资的重要意义的基础上,我们在本节中梳理挖掘评价 alpha 因子的方法,以便在统一的框架和方法论下对 alpha 因子进行系统地探索。

基本框架

要探索新的 alpha 因子,我们认为首先需要了解 alpha 因子的产生机制和逻辑基础。建立在 CAPM 理论及一系列数理模型基础上的现代金融学认为市场是有效的,然而大量的实证结果表明,有效市场理论是值得商榷的。从行为金融学的角度来看,市场的参与者并不是完全理性的,投资者的非理性行为偏差必然会导致某些市场异象的产生。上个世纪七、八十年代,美国的实证金融学者陆续证实,在美国股市中长期存在着小盘股效应和价值股效应。对这些市场异象的提炼、和深入研究最终导致了以获取异象背后的超额收益为目的的选股策略或 alpha 因子的产生。基于多数 alpha 因子诞生的逻辑,发掘新因子至少可以从两个角度着手进行。第一,从源头出发,以行为金融为基础,挖掘新的市场异象;第二,深入分析已知的市场异象,利用新的构建提炼方法,获得更为有效的 alpha 因子的表达方式。

3

在下面的因子实例中,我们将分别展示这两种方法的具体应用。

数据库的选择

数据库是我们挖掘新因子的重要对象。近年来,许多国外知名券商的量化研
究部都在数据库的质量以及独特性方面下了很大的功夫,因为因子的独创性,很多时候就来自于数据库的独特性。

一般来说,我们可以把所用的数据库分为两大类。一类是传统数据库,主要包括财务基本面数据、交易数据以及研究员一致预期数据;而另一类则相对独特,例如高频交易数据,文本挖掘类数据等等。对于数据库和因子挖掘的关系,我们的观点是:发现新 alpha 因子的关键在于对市场异象的深入挖掘,独特的数据库是有益但非必须的;传统数据库中依然有大量宝藏有待我们深入地去挖掘探索。

因子评价方法

我们的因子评价测试方法遵循一般的框架。我们在中证 800(或全 A 股)的范围内测试因子的预测能力,在剔除符合一定条件(当天不交易、被风险警示、因子值缺失等)的股票基础上,构建五分位等权组合,从 2007 年至今逐月再平衡。通过计算各分位组合、多空组合的风险收益统计量,以及因子 IC 的表现,系统的评价因子的表现和特点,对因子的使用给出具体建议。

因子蓝海探索——实例篇

在本节中,我们将给出 alpha 因子探索的三个实例。其中前两个是利用了原有的市场异象,但改进了利用和提炼因子的方式。第三个因子则从挖掘新的市场异象的角度出发,做出了一些初步的尝试。

自由现金流总市值比

 因子逻辑与定义
估值效应是一个广泛且长期存在的市场异象,传统的 BP、EP 等因子是利用这一异象的代表。在前面的文章中我们已经发现,传统估值因子的效率正在不断弱化,怎么样才能在这一背景下更好地利用估值效应呢?一个自然的想法就是构建能够更好反映公司价值的指标。

自由现金流(Free Cash Flow,FCF)作为代表公司可以自由支配现金数量的会计变量,具有很多良好的性质。首先,由于该指标的信息来自于现金流量表,相较于权责发生制下的会计收益,FCF 很难被操纵和伪造;其次,FCF 从现金流的角度更好地衡量了一个公司的盈利能力。

有鉴于此,我们类比 EP、CFP 等估值因子的结构,构建基于 FCF 的估值因子:FCFP。具体因子的定义可见下图:

4

 因子表现分析

  1. 从五分位组合的表现来看,因子在 Top 组合上的表现十分抢眼,年化 IR 可以达到 1.10。Bottom 组合的表现不是十分令人满意,五等分下,第二组的表现是最差的,因子呈现一定的非线性特征;

5

  1. 在价值类单因子中,FCFP 的回测效果最好;

6
7

  1. FCFP 与其他价值因子收益的相关性较低,在一定程度上提供了额外信息,可以作为多因子模型的有益补充。

8

基于 RCVB 的价值增强因子

 因子逻辑与定义
依然聚焦于估值效应,传统观点告诉我们,EP、BP 等估值因子的值越高,相应股票价值被低估的越多,最终估值修复将带来的超额收益也就越明显。可问题是,估值因子的值越高一定意味着股票价值被低估的越多吗?

事实上,这个问题的答案并不是一定的。试想一下,如果一支股票的风险本身较高,这时投资者在对该股票应用估值模型时往往会使用较高的贴现率,这就会导致股票当前的市值较低,从而使得 EP、BP 等估值因子的值偏高。然而在这种情况下,估值因子的高低是对股票本身风险大小的正常反映,我们所期待的估值修复现象很可能就不会出现了,也即估值指标将会失效。

要解决上述问题,一个直接的想法就是尝试衡量某个估值因子失效的概率。
实践中,我们利用估值因子与个股贝塔之间的截面相关系数(Rank Correlation of Value and Beta,RCVB)来表征:

9

可以看到,RCVB 的取值越高,说明估值因子与贝塔之间的相关性越高,那么由于高风险而导致低估值的可能性也就越高,估值因子失效的概率也就越大。下面我们就利用 RCVB 这一工具来构建增强的价值因子。考察历史上收益相关性较低的两个估值因子:EP 和 BP。若 RCVB_EP 大于RCVB_BP,这就说明在当前时点,EP 的选股效果比 BP 差的概率比较大。这时一个比较好的选择是,在因子权重上低配 EP 而超配 BP。换句话说,根据 RCVB 的大小在 EP 和 BP 之间动态分配权重构建复合价值因子 Value_RCVB,我们可以更有效的利用估值效应!增强价值因子的具体定义如下图所示:

1

 因子表现

  1. 五分位组合的年化超额收益率保持了良好的单调特性,其中 Bottom 组合长期稳定地跑输市场;

2

  1. 增强后的复合价值因子显著地优于单因子及简单等权的复合因子,较低的换手率使得 Value_RCVB 在实际投资中的价值也更为突出;

  1. RCVB_F 在不同市值水平的选股范围内都取得了良好的投资效果。

4
5

流动性冲击因子

 因子逻辑与定义
股票的流动性与其预期收益率之间的关系,长久以来都是实证金融学者重点
研究的一个领域。传统认为,股票的非流动性水平越高,投资者持有该股票就会要求更高的风险溢价,从而使得低流动性的股票平均来看有更高的收益率。

然而,上述的分析存在一个不易察觉的问题:流动性差的股票虽然可能有显著的超额收益,但这些股票往往市值很小,且交易成本很高,所以回测中的收益很可能仅仅只是纸面富贵。那么,流动性这个因子还能不能作为多因子体系中的一员呢?有没有什么解决的办法呢?在这里,我们转变了以往直接处理流动性绝对水平的观点,从股票流动性的相对变化幅度入手,考察流动性冲击对股票预期收益率的影响,得到了更为稳健的结果。

我们的逻辑是,股票当前非流动性水平相对于其历史平均水平的变化率是股
票预期收益率的正向预测因子,我们称其为流动性冲击因子(LSF)。因子的具体
定义分两步。第一步,定义股票的非流动性水平:

6

不难看出,流动性冲击因子 LSF 在一定程度上消除了市值对因子的影响,同时所选的资产也不再一定是流动性水平差的股票。

 因子表现

  1. 五分位组合的超额收益率呈现出了良好的单调性,多空组合的年化 IR 接近 2;

  1. LSF 的选股效果基本不受市值因素的影响,能够适应不同的股票池,以及不同的加权方式;虽然因子换手率相对较高,不宜单独构建策略,但仍可作为多因子模型的有效补充。

从流动性冲击因子的历史 IC 走势也可以看到,该因子的表现一直以来都是比较稳健的,在测试期间多数的月份内都保持了较高的 IC 水平。

9

总结与展望

作为兴业证券金融工程部 alpha 因子探索系列的第一篇,在本文中我们首先指出了避免红海竞争,探索因子蓝海的重要意义;而后系统地给出了我们在挖掘新 alpha 因子时所应用的方法框架;最后,我们以最近发现的三个新 alpha 因子为例,展示了探索 alpha 因子的整个过程。

作为多因子量化投资体系的核心,alpha 因子始终是广大投资者关心的热点问题。我们希望本系列的研究能够为机构投资者提供关于 alpha 模型最新的想法,不同的视角,并尝试挖掘更多的投资机会,带来更多的差异化竞争策略!相信每一个探索过 alpha 因子的研究人员都会明白,这个过程充满了艰辛。路漫漫其修远兮,吾将上下而求索!虽然找一个 alpha 因子真的好难,但我们愿意向着未知的远方不断前进,用我们的努力为您创造更多的价值!

作者:兴业证券金工团队