【020】细节是魔鬼:你会如何定义 HML ?


(astroman) #1

本文为我们的公众号【因子动物园】的第 020 篇独立原创文章,也是价值因子专题的第 005 篇文章。原文请戳

【020】细节是魔鬼:你会如何定义 HML ?​mp.weixin.qq.com图标

欢迎关注我们的公众号,获取更多关于因子投资文献和本土化实证研究。

30秒速览】Asness 等人指出,通过利用最新的价格信息并月度再平衡,可以显著提升价值因子(HML) 的表现。我们基于中证 800 成分股的实证研究表明,A 股市场也有类似的表现。此外,我们也要思考,是否所有基本面因子都可以通过这样的方法来改进。我们认为这是一个极富价值的问题,同时也是一个巨大的挑战,该问题的答案也许并不会那么地清晰,因为要回答它,既是科学,也是艺术。

1. HML 的标准定义

依据 Fama, and French (1993) 的标准定义,HML 因子在每年 6 月底,利用最新年报披露的账面市值比进行构建。这一定义方法随之作为标准规范,被学界一直沿用至今,尤其是在 French 会定期更新美国市场的因子数据,供研究使用的情况下。

但惯例就一定是最优的做法吗?

习惯怼天怼地的 Asness 再次表示不同意。

2. 对 HML 的调整

Asness, and Frazzini (2013) 指出,标准的 HML 有着巨大的信息损失。

我们先来回顾一下 Fama-French 的 HML 标准定义,其中的核心自然是账面市值比的计算。

BM^{a} = BV^{a} / MV^{a}

上式中, BV^{a}MV^{a} 代表上一期年报当期的账面价值和市值。

由于在每年 6 月底所有上市公司披露完年报后,才能使用去年的年报数据,因此,Fama-French 的 HML 定义中,几乎一直利用的是滞后的数据,数据的滞后期最多可达 18 个月。

这一点很容易理解。例如,如果要在今天计算该 BM^{a} 值,由于 2018 年的年报尚未完全披露,因此,需使用 2017 年的年报和 2017 年最后一个交易日的市值。显然,这就有接近 18 个月的滞后。这么长的时间内,股价可能发生大幅波动,从而导致账面市值比也出现巨大变化。

因此,Asness, and Frazzini (2013) 指出,这样的定义方法并不是最优的,完全可以改进。

改进方法主要有两种。第一种方法下,分子仍然使用上一年年报的账面价值,但分母改用最新的市值数据,同时仍然每年 6 月底调仓。第二种方法则更加激进,分子和分母与前一种方法相同,但每月调仓一次,以充分利用最新的价格信息

基于约 60 年的全球股市数据,他们给出了 3 种方法下的 HML 因子相对于 Fama-French 五因子模型的累计超额表现,如下图所示:

![](data:image/svg+xml;utf8,)

图 1 :全球市场不同 HML 因子的累计 alpha .数据来源:Asness, and Frazzini (2013).

图中,虚线为经典的 FF 式 HML 因子,黑线为第一种改进方法,灰线为第二种改进方法。可见,利用了最新价格信息且高频调整的 HML 因子,表现要优异得多。

而基于时间序列的多因子回归显示,HML 因子对市场组合敞口非常小,对规模和短期反转因子暴露也不大,对动量的敞口显著但方向不尽相同,利用滞后数据的 HML 因子对动量有显著的正暴露,而利用最新价格的 HML 因子,对动量的暴露则是负的。从 alpha 的角度看,也有很明显的差异,原始 HML 因子的 alpha 为负,而新 HML 因子的月度 alpha 超过 3% ,非常地惊人!

![](data:image/svg+xml;utf8,)

表 1 :不同 HML 因子的多因子回归分析.数据来源:Asness, and Frazzini (2013).

此外,HML 的不同版本之间的相关性是很高的。这一点,通过它们相互之间的线性回归可以很容易看到,模型的 R 方几乎都达到了 0.9 。特别地,换一个角度看,经典的 HML 因子,大体可以看作利用了最新价格信息的版本,再加上对动量的部分正暴露。

3. A 股市场的新 HML 因子

当然,我们都知道,我们的 A 股往往与众不同,因此,即便从美股和其他发达国家市场来看,利用最新的价格数据的 HML 因子表现好不少,但我们仍然需要拿 A 股的数据进行一番检验,才能得出踏实靠谱的结论。

为了排除小市值股票的干扰,我们选择基于中证 800 成分股来构建因子。特别地,本文在几个细节上与经典定义及 Aseness, and Frazzini (2013) 的处理有所不同。

首先,简便起见,我们没有采用依据市值和分析指标做交叉分组的方式来定义因子,而是直接依据单因子分为 5 组,计算市值加权的多空组合的收益率。这一处理必然会带来一些偏差,但考虑到我们的样本为大中型股票,且按照市值加权,该处理对总体结论的影响并不大。

其次,基于动量在我国市场并不显著而短期反转高度显著这一特征,在多因子分析中,我们剔除了动量,只保留了 1 月短期反转因子。

再者,按照规定,A 股上市公司需在 4 月底之前披露完上一年年报。因此,我们将按年度再平衡的因子的调仓日期设定为每年 5 月的第一个交易日,而非 6 月底,以避免不必要的时滞(顺便说一句,这一点也是我们对国内主流数据库的因子数据不太满意的原因之一,在 A 股复现论文时,刻舟求剑并非最明智的选择)。

最后,考虑到上市公司不仅仅会披露年报,在改进方法中,我们更主要考虑的是账面价值和市值都取最新可得数据的版本,这一算法比前述 Asness, and Frazzini (2013) 的方法更加及时。

图 2 展示了 A 股市场上上述 3 种 HML 因子从 2007 年 2 月至今的累计收益:

![](data:image/svg+xml;utf8,)

图 2 :A 股市场不同 HML 因子累计收益走势.数据来源:因子动物园,betalpha,Wind.

与 Asness, and Frazzini (2013) 的发现一致,利用了最新信息并月度调仓的因子表现明显比另外两种方法好很多。只利用滞后信息的因子表现十分糟糕,年化收益仅 1.06% ,尚不及同期无风险收益。利用最新价格信息但仍然年度再平衡的因子,年化收益为 5.32 % 。相比之下,充分利用最新信息的方法下,年化收益达到了 10.54 % ,为前者的近两倍。

![](data:image/svg+xml;utf8,)

表 2 :不同 HML 因子之间相互回归结果统计.数据来源:因子动物园.

表 2 展示了 3 种定义的 HML 因子相互之间的回归结果。HMLm 、HMLa 和 HMLa_LY 分别代表利用最新数据且月度调仓、利用最新价格数据并年度调仓以及传统的只利用滞后数据并年度调仓的 HML 因子,表中回归系数下方的括号里仍然是对应的 t 统计量。从中可以得到几点有趣的发现。

  • 首先,解释变量的 t 统计量非常高,由于是单变量回归,R 方相应也就非常高。这一点表明,不管具体定义如何,HML 还是 HML ,本质不变。
  • 其次,回归系数非常接近 1 ,尤其是 HMLa 和 HMLm 之间,这进一步说明无论具体如何定义,HML 因子的内涵是不变的。
  • 最后,也是我们最为关心的,HMLa 和 HMLa_LY 的截距项都不显著,表明二者没有实质性的区别。而 HMLm 则有显著为正的 alpha ,尤其是相对于传统的 HMLa_LY ,alpha 高达 0.826%/月(年化 9.91%) 。

表 3 则进一步展示了多因子回归模型的结果。

![](data:image/svg+xml;utf8,)

表 3 :不同 HML 因子的多因子回归结果统计.数据来源:因子动物园.

表 3 也给了我们几个有意思的发现。

  • 首先,加入市场组合超额收益(MKT_RF)、规模(SMB)和短期反转(STR)因子后,HMLm 和 HMLa 的 alpha 的显著性并未改变,HMLm 仍然有显著为正的 alpha ,但水平稍微缩小,HMLa 仍然由不显著的负 alpha ,且由于剥离了对反转的负暴露,该 alpha 稍微变大了一点。
  • 其次,如同我们此前的文章讨论过的,短期反转因子非常抢眼,有着显著为正的 alpha ,且 HML 和 SMB 对其的暴露都是显著的。
  • 最后,HMLa 对短期反转的暴露为负,而 HMLm 对短期反转的暴露为正。我们在此前的文章分析过,动量对短期反转有显著的负暴露,因此,这一观察与 Asness, and Frazzini (2013) 发现的 HMLa 对动量有正暴露,而 HMLm 对动量有负暴露,本质上是一致的。由 (2) 式也可见,HMLa 对 HMLm 的暴露为 0.902,略小于 1 ,对规模因子的暴露为正但绝对值很小,对反转因子的暴露则显著为负。因此,HMLa 大体可看做 HMLm 并做空短期反转。考虑到 A 股市场上短期反转非常强势,HMLa 表现显著弱于 HMLm 也便在情理之中了。

4. 表现差异的分解

我们可以从两个角度来对不同 HML 因子的表现差异进行拆解。

首先,由于账面价值变化通常较为缓慢,因此,HMLm 和 HMLm 的股票池差异,主要是自上一个年报期以来价格大幅变动的股票,特别地,HMLm 会买入更多近期大跌的股票,并做空更多近期大涨的股票。也因此,HMLm 对反转因子会有更多的正暴露。但与此同时,价格的变化本身并不是导致账面市值比高或低的唯一原因,因此,HMLm 与反转因子也不完全相同。HMLm 与 HMLa 的差异,对反转因子的暴露约为 0.3 。

接下来,我们再从更加精细的角度来对不同 HML 因子间的表现差异进行分解。

依据它们的构造方法,上述 3 个 HML 因子的差异主要在于两个方面:

  • 其一,自然是利用更新的信息,尤其是价格信息。
  • 其二,则是更高频的再平衡。

当然,还包括这两个因素的结合/交互。

具体而言,HMLa 和 HMLa_LY 的差异完全来自前者利用了最新的价格信息,而后者没有,二者约 4.2% 的年化收益差异便直接体现了新信息的价值。

而 HMLm 和 HMLa 的差异有 2 点,一是再平衡频率,二是 HMLm 在分子中也利用了可得的最新数据(一方面是利用季报,另一方面是对于较早披露年报的公司,会提前用到最新一期的年报)。

为了更好地分解收益来源,我们也计算了对 HMLa 采用月度再平衡的因子表现。结果颇令人惊讶,年化收益达到了 12.75% ,比 HMLm 还要高 2.2% ,这表明信息不一定都是越新越好,因为其中可能包含着噪音。而相比年度再平衡的 HMLa,超额收益高达 7.4% 。

当然,月度再平衡的额外收益,也依赖于因子组合本身的表现。对于完全利用滞后信息的 HMLa_LY ,改为月度再平衡后,年化收益上升幅度约为 2.0% ,当然,相比其本身 1.06% 的收益率,相对涨幅还是很可观。

因此,改进方法的超额收益来源大部分来自更高频的再平衡,另有一部分来自对新信息的利用

5. 结语

Fama, and French (1993) 关于 HML 的经典定义中,利用过往年度的账面价值和市值来计算 HML 因子,时滞可能长达 18 个月。该因子近年表现不甚理想,也因此受到了一些批判。Asness, and Frazzini (2013) 指出,通过利用最新的价格信息并月度再平衡,可以显著提升 HML 因子的表现。我们基于中证 800 成分股的实证研究表明,A 股市场与美股等发达市场类似,通过利用更高频的信息,可以大幅提升价值因子(HML)的表现。

与此同时,可能更为重要的是,我们需要思考,是否各种涉及到财务数据/价格数据的因子,尤其是类似的估值、盈利能力等因子,是否都可以通过利用更及时的信息来提升其表现?

我们猜测,这个问题的答案可能是模糊的。总体上,与 HML 类似,利用更及时的信息应当有助于改善这些因子的表现,但与此同时,最新的信息尤其是价格数据中,也可能包含着较多噪音,且高频再平衡也不可避免地会带来更高的交易成本。这两方面的权衡可能随具体因子而不同。如何平衡这两个方面,可能不仅仅是科学,也是艺术。但无论如何,对此进行深入探究,应当是大有裨益的。

若您也对因子研究感兴趣,不妨关注我们哦!

![](data:image/svg+xml;utf8,)

【因子动物园】公众号二维码

![](data:image/svg+xml;utf8,)


参考文献:

  • Asness, Clifford, and Andrea Frazzini. “The Devil in HML’s Details.” The Journal of Portfolio Management 39.4 (2013): 49-68.
  • Asness, Clifford S., Andrea Frazzini, Ronen Israel, and Tobias Moskowitz. “Fact, Fiction, and Value Investing.” Journal of Portfolio Management 42.1 (2015): 34-52.
  • Barillas, Francisco, and Jay Shanken. “Comparing Asset Pricing Models.” Journal of Finance 73.2 (2018): 715-754.
  • Fama, Eugene F., and Kenneth R. French. “Common Risk Factors in the Returns on Stocks and Bonds.” Journal of financial economics 33.1 (1993): 3-56.
  • Fama, Eugene F., and Kenneth R. French. “A Five-factor Asset Pricing Model.” Journal of Financial Economics 116.1 (2015): 1-22.