近期热点

创金合信基金首席:结构性行情下的量化投资-风格轮动与随机森林

由qxiao创建,最终由qxiao 被浏览 23 用户

**会议:**开源证券2022年资本市场峰会

**日期:**2021年11月5日

**主办:**开源证券金融工程魏建榕团队

**主题演讲:结构性行情下的量化投资 **特邀嘉宾:**董梁博士,创金合信基金首席量化投资官

图片{w:100}

发言实录:

大家早上好,谢谢建榕总的介绍,也非常感谢开源金工组织这场论坛!在现在疫情的环境下非常不容易。我演讲的主题是:结构性行情下的量化投资。今年行情跟去年变化很大,共同点是都是结构性的行情,去年有几个行业走的特别强,比如说消费、生物医药、还有新能源,今年在春节之前还是延续了去年的行情,不过春节之后出现了大的风格切换,接下来5月份到7月份走了一波成长股比较强的行情,然后7月之后成长股的大回调,半导体一直到最近一星期左右才开始反弹,周期股在8月下旬9月上旬快速拉升,9月下旬双限之后,给市场的冲击是非常大的,操作的难度加大了很多。

图片{w:100}

在结构性行情下,买宽基指数很难有很大的回报,如果希望重仓几个热点行业或者风格,取得全年稳定的回报,难度也增加了很多,基本上会经常受到热点轮动的打击。还有一个就是关于量化,特别是量化私募,在整个市场上的角色的一系列讨论,主要从7月份成交量上来以后,再加上9月份周期的空跌,到底量化占了多少交易量?到底最近所谓的“A字型”行情(突然的快速拉升达到顶点之后迅速崩塌的行情),量化私募有多大的贡献?感觉量化成为了一个背锅侠,其实这也不完全是空穴来风,就像刚才说的,量化整体的规模这两年成长非常多,确实成为了市场上非常重要的一股力量。尤其是量化有趋势跟踪的特性,对行情的推波助澜的作用确实不可小觑。现在经济明显属于放缓、下行的趋势之下,这种结构性行情在未来的一段时间估计还会延续。这种行情之下,作为量化投资管理者,应该做什么样的定位,我们有一些思考,这里就跟大家汇报一下。

图片{w:100}我们主要从几个角度考虑,一个是在行业轮动方面做一些工作,争取一定程度上获取结构性行情带来的Alpha。另外,跟行业轮动接近,在风格上做轮动,获取一定的Alpha。此外,这种热点切换很快的行情之下,我们是不是可以加快交易速度来捕捉交易性机会?

图片{w:100}首先看一下,过去20年来申万一级行业,在当年表现比较好的9个行业,在第二年的表现。红色表示当年收益率排名前9,第二年收益率还是排在前9,是持续性的行业;绿色是当年排在前9,第二年排在后9;橙色是当年排在前9,次年排在中间位置。可以看到,规律性并不是特别强。有一个规律是很明显的,在同一年里,红色跟绿色的数量肯定是反比的,因为红色表示持续,绿色表示反转。有一些年份反转性非常强,比如像2012年2013年,大部分行业,前一年靠前第二年就跑到后面去了。最近两三年相比之下还算可以,比如2018年2019年有不少红色的行业,但是2020年春节之后,像休闲服务、食品饮料排到后面了。所以说,在过去20年里,行业轮动是一个常态。

图片{w:100}

在这种情况下,如果简单地采用追涨或抄底的方法,能不能获取稳定的超额收益?我们构建了两个组合,一个叫“TOP组合”,即选当年前9的行业作为次年持仓,持有至次年年底,计算组合收益及相对沪深300、中证500的超额收益,另外一个是“BOTTOM组合”,即选当年收益后9的行业作为次年持仓。可以看到,这个也没有太强的规律性,跟前面的图是相辅相成的。“TOP组合”在2015年到2019年,相对于沪深300都没有跑赢。沪深300相当于中证500在2015年到2019年有Alpha,所以“TOP组合”相对中证500有一定的超额收益,在2020年2021年表现还可以。“BOTTOM组合”最近几年跑输大盘指数比较多。所以简单的追涨或抄底,很难获取稳定的超额收益。如果想收获行业上的Alpha,必须进行一定程度的轮动。

图片{w:100}行业轮动的逻辑,分为宏观、中观、微观三个方面。宏观层面,行业的发展受宏观大环境影响非常大,包括全球流动性、行业所处的生命周期、发展阶段、货币政策、财政政策以及产业政策,比如7月下旬教培产业的调控、互联网平台的调控、9月份的双限、持续的碳中和,宏观政策对行业的影响非常大。另外,中观逻辑主要是产业的生命周期,包括产业政策,处于初创、成长、成熟、衰退期的各个行业和龙头的股价,一定是有差异的。我们把宏观、中观的逻辑,通过一些指标直接映射到个股之上,因为宏观、中观的逻辑,最终都会在个股基本面上有所反映,通过基本面指标来捕捉宏观、中观的逻辑。微观上,我们通过行业投资性价比的方式选择行业,再选择行业的龙头股。

首先,宏观、中观会影响行业的景气度,然后把个股基本面应用到行业上面,决定行业的空间和安全边际,此外我们需要做趋势性投资,一些行业或者个股的宏观中观逻辑再好,但是股价就是不行,一般来说我们的模型是不会去选这些股票的。另外,对于拥挤程度也要有一定关注,今年的一些重大转折节点,都跟拥挤度有一定的关系,拥挤度可以反映交投的热度、公募基金持仓的提升速度等方面。比如茅台在春节前几个交易日就从2400涨到2600,这种热度肯定是交易过热的现象,包括周期股9月中旬的交易热度,都在一定程度上反映拥挤程度。

图片{w:100}

我们总结宏观、中观和微观的逻辑,搭建一个行业性价比投资的框架。最终,我们的目标是在承担尽量少的风险之下,获取尽量多的收益,争取以大数定律的方式来取得超越市场的表现。通过我们模型反应的速度,争取把回撤控制在比较小的范围之内。组合方式就是按照性价比对行业进行排序,选出排序最高的行业构造持仓,定期或不定期根据性价比进行调整,达到轮动的效果。轮动不意味着频繁地进出,跟行情的走势有很大关系,比如像2020年持续性比较强的情况下,在一季度行业轮动模型食品饮料、生物医药的机会,一年下来换手可能也不是特别高,但今年因为热点切换很快,作为一个趋势跟踪的投资方式,其交易频率就会高一点。

图片{w:100}

具体来说,我们主要是从景气、趋势、拥挤度这几方面构建。景气主要是宏观、中观以及行业生命周期的重要数据来支撑。比如说今年新能源行业景气度一直都非常高,我们估计在新能源的大背景下,可能在未来若干年它的景气度都会是一个比较高的情况。如果一个股票或行业的景气度非常好,但却走不出趋势,相当于大盘没有超额收益,对我们来说它的投资价值是比较低的,我们需要通过一些量化指标来计算。通过几个方面的量化指标,然后得到行业之间的相对排名。

图片{w:100}具体到这些量化指标,景气方面我们用了一致预期ROE、营业收入、净利润环比变化的历史分位数和预期差。趋势方面我们用行业相对Wind全A指数的超额收益的信息比例来衡量,用若干时间窗口指标的加权平均,主要衡量是否能够持续稳定地获取相对于Wind全A的超额收益。拥挤度主要是用换手率的一些指标,基金季报公布的行业持仓分布的提升或减少程度,以及行业估值的历史方位数来作为拥挤度指标。一般来说,拥挤度高的行业会过热,离反转的时间点会接近一点。我们将景气、趋势、拥挤度量化之后,会做截面的处理,使其可以做标准化的比较。把三大类下的指标加权平均得到三个大类指标,再将三大类指标加权平均得到行业的打分,这是我们搭建行业评分的架构。

图片{w:100}

我们用电子行业相对于计算机行业的行情作为性价比投资例子,黑色的线是两个行业价格相对强弱的比值,红色的线是电子相对计算机行业景气度的变化,有一定的波动性,不过可以看到黑线的走势和红线景气度,在打的趋势上是有一定相关性的。

图片{w:100}

为什么要选择量化的方式做行业轮动?市场已有一些行业轮动基金,但大多数还是用主动的方法来做。我们觉得量化的行业轮动基金是有一些特点的。首先,它的数据处理能力比较强,很多数据是每日更新的,这样的话可以给模型带来及时修正的效果。其次,量化投资可以排除人类进行投资时感情起伏带来的负面影响。另外,量化数据处理能力大,所以可以在多只股票多个行业上同时进行布局,可以靠概率获得高胜率。

图片{w:100}

目前有28个申万一级行业,二级行业数量有104个,有4000多只股票,所以在构建景气度、趋势、拥挤的时候,数据量是比较大的。因为主要是从个股聚合到行业上,量化相对于主动的行业轮动,在数据处理方面有一定的优势。

图片{w:100}

此外,因为用到每日交易数据,所以对于趋势的变化是比较敏感的。以最近一次比较大的风格或行业的切换做例子,图中是9月中旬的几个重点行业,在双限之后,我们这个行业轮动体系打分的变化,下面的柱状图是所有的行业打分变化,这几个颜色分别代表9月13号周期股还在赶顶时候的得分,然后9月14号、9月15号到9月16号,在4天之内性价比得分,在不少行业上都有比较大的变化。将几个重要的行业摘出来放在右上角曲线图里,主要有食品饮料、有色金属、采掘、生物医药。有色金属和采掘属于周期,它们的得分在9月16号之前是处于比较高涨的状态,在双限的消息发出后,可以看到它趋势很快发生了改变,趋势开始下跌,有色和采掘的行业排序,也出现了比较快的下降。同时,食品饮料大概在一个礼拜之后开始出现了反弹,因为它是相对的产品,所以这种打分对于行业趋势的反应相对比较快。

图片{w:100}

再举一个例子,跟刚才有一点接近,这是今年春节前后的变化,三个红色的矩形框里,分别是生物医药、休闲服务、食品饮料。可以看到,春节前后大约一周时间,行业轮动模型的打分就出现了比较大的变化,像食品饮料从春节前正得分变为春节后的比较大的负得分,得分增加比较快的是左边的几个周期性的化工、钢铁和采掘。如果能够用量化方式进行行业打分,然后严格地按照得分来进行配置,这样可以克服在投资上的主观偏见。今年很多顶流基金经理表现相对弱一些,一个重要原因是他们在去年取得顶流的地位,是因为重仓了生物医药、休闲服务、食品饮料这些行业,他们对于这些行业是有感情的,他们的能力圈及研究的深度主要在这些行业里面,所以很难在短短一个礼拜之内,他们对于这些行业的判断会出现大的转变。但是因为量化行业轮动的打分已经出现了很大的变化,如果严格地根据得分进行投资,确实会克服一些这样的缺点。

图片{w:100}

另外,行业轮动是靠概率取胜。主动的行业轮动基金因为研究深度的问题,很难把所有行业所有个股用相同的时间、精力研究的非常透彻,一般来说基金经理都有自己的能力圈或者自己最舒适的一些行业或板块,有可能会出现行情离开他们所熟悉的行业和板块。作为量化行业轮动,因为每个行业对模型来说都是差异不大的,可以在所有的28个一级行业、104个二级行业里面进行公平的轮动,这样是有可能取得比较稳定的胜率的,我们的行业轮动策略。以所有行业的平均为基准,基本上是在2015年跑输了一点,其他年度都取得超额收益,月度胜率基本可以达到67%左右。

图片{w:100}

过去7年左右的时间里,相对于沪深300和中证500,量化行业轮动取得比较明显的超额收益。

图片{w:100}

接下来讲一讲风格轮动和短期交易,上图是在沪深300中16个Barra风格因子的超额收益曲线,可以看到风格因子的回报存在一定的周期和轮动。

图片{w:100}

为了看清楚一点,我们把几个大家关注度相对比较高的风格因素拿出来,有价值、成长、反转和动量。动量在过去一年里,超额收益为2%左右,不过在今年2月份和7月份都出现了比较大的回调,最近一个多月又出现比较明显的回调。另外,很明显地,成长与价值是负相关的。所以风格上有一定的趋势性,也有一定周期性,之间又有一定的相关性。

图片{w:100}

所以在Barra风格因子上,是否可以开发一个风格轮动模型来进行预测。我们通过个股上的指标,包括技术指标、基本面指标,通过个股在Barra风格因子上的暴露,把个股的指标通过加权的方式映射到风格之上,然后在风格上的技术和基本面指标,开发出量化模型来预测风格的轮动。最终我们把风格上预测的Alpha通过暴露映射到不同的个股之上,这个工作我们在今年上半年已经做,上图是我们实盘的表现。从今年4月底开始作为一个模块,加入到我们实盘的量化模型里边,可以看到从4月底到7月下旬表现还是不错的,这一段是市场行情比较持续的一段时间,当然7月底之后也出现了比较明显的回调,不过我觉得长期来看,这样的模型是有可能带来一定额外增量的。

图片{w:100}

最后讲一下短期交易,今年特别是7月下旬之后,热点切换速度是很快的。比如中国铝业从8月下旬开始到9月中旬出现快速的拉升,然后9月20号左右双限出来,下滑的速度也是非常快。在这种情况下,一些月度调仓的基金,就不能对这种快速切换做出反应,所以可能要加快交易的速度。我们还是要用量化模型来进行短期交易。

图片{w:100}

我们用了随机森林的方法。根据经验,随机森林方法在金融价格预测里表现还是不错的。我们用一种随机森林的方式来搭建短期交易模型,用的数据是日间和日内的量价、资金流数据。

图片{w:100}

还以中国铝业为例,上图是一个高点反转的模式,首先我们识别这个模式,比如说昨天是最近三周的高点,今天出现了下跌反转。在这个图的范围之内,3、4个月的时间里面,实际出现了若干次,并不是说一旦出现高点反转,我们的模型就一定会给一个很负面的打分,就认为会出现下跌。可以看到在7月下旬的打分是比较负的打分,但是在8月份跟9月初,甚至是9月10号左右的三个短期高点下降,量化模型打分并不是负的。但是到9月14号的高点,我们的模型给出一个相当负面的打分。在这种情况下,如果有周度交易甚至日度交易的条件,是有可能做出反应的,因为它大幅下跌还是在若干交易日之后。

图片{w:100}

最近一年中,将短期交易模型的单日IC计算出来,包括若干的图形识别,取截面结果,可以看到,短期交易模型单日的IC累积曲线相对是比较平滑的。在3月份之后表现一直都比较稳定。对于行业和风格的切换相对不太敏感,这也是为什么我们开发的短期交易模型是一个重要的因素。我今天的演讲就到此结束,谢谢大家!(全文结束)

风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。发言嘉宾对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表嘉宾所在公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。

(纪要整理:王志豪)

\

标签

量化投资随机森林