统计学习寻找噪音中的秩序_慕本Milburn_对冲基金文章翻译计划029


(hbworld) #1

原文章来自慕本 Milburn Ridgefield Corporation网站,本文为原文章的中文翻译。本文仅用于交流学习使用,不得用于商业用途。如对相关著作人造成侵害,请立即联系译者及时删除。

原文标题:Millburn’s Machine Learning, Now 100%, Continues to Perform: Statistical Learning Finds Order in the Noise

原文时间:2019年3月

作者:Hamlin Lovell,TFHJ

翻译:雷闻


自2013年的慕本策略演变的最新阶段开始,其旗舰多元化策略已经实现了接近1的夏普比率。这些策略也显著优于大多数传统CTA,包括在过去五年中的每一年都取得了正表现。除此之外,慕本最擅长的市场——相对价值商品策略(现在软封闭)已经产生了一些真正非凡的回报。投资者显然对这一表现表示赞赏。在此期间,管理资产规模稳步增长,目前已超过65亿美元。

和往常一样,慕本的流程旨在将公司的大量市场知识(数十年的系统性交易全球期货和外汇市场的经验)与理解数据的技术结合起来。然而,今天,这一过程的特点是将更常用于单一公司证券的强大的机器学习技术(有时被称为统计学习)应用于宏观市场。而且,与附加策略或者子策略非常不同,这种方法是以回报和交易成本预测的形式整体用于信号生成的。

新千年标志着早期的转变

一些CTA至今仍大体上或完全致力于传统趋势跟踪(我们将其定义为使用纯技术或价格数据,仅使用基于动量的模型)。虽然慕本是趋势跟踪的最初创新者之一——其根源可以追溯到1971年——有趣的是,它也是最早以显著方式摆脱传统趋势跟踪的管理期货公司之一。慕本在2000年中期开始减少趋势跟踪的配置,取而代之的是基于基本面、行为学和其他非价格数据的独立的、假设驱动的、单一策略的模型的信号。

从数据中获取更多信息

因此,2013年转向基于统计学习的综合多因子框架,将各种模型融合在一起,与其说是偏离,不如说是偏向公司认为的更好的技术的方向发展,以部署和利用已经喂给模型的越来越多的数据。“在过去的十年里,我们清楚地认识到,数据爆炸可能对市场的理解产生重大影响。这意味着简单的基于规则的使用动量的方法在未来可能不会奏效。虽然一些同行正朝着提供趋势beta的方向前进,但我们在早期就做出了继续寻找alpha的决定,这意味着我们将大量投资于一个可以更好地利用一系列数据(包括价格和非价格)的框架。但我们也希望有一个内置的有适应能力的流程,以更好地适应我们在市场上看到的不断增长的变化节奏。慕本的联合首席执行官兼交易执行董事巴里 古德曼(Barry Goodman)表示:“我们认为这是我们优势的源泉。”

今天:100%机器学习

到2013年年中,多因子框架的初步实施阶段已经完成。六年前的今天,慕本使用这个多因子和多数据统计学习框架进行了数十亿资产管理规模的交易。在机器学习的世界里,这种规模和经验可能使慕本成为期货和外汇交易领域的领导者之一。

虽然2013年7月是一个里程碑,但该公司现在处于另一个里程碑的边缘。截至2月,该公司已逐步淘汰传统趋势,完全支持其统计学习框架,通过其主要的多/空多元化、多市场和商品项目,完成了该公司从基于规则向纯数据驱动方法的过渡。

重新分类

随着时间的推移,CTA们变得越来越多样化,关于慕本应该如何分类的问题出现了。慕本对趋势追随者的滚动beta一直在向下发展,如图1所示,说明了从基本的动量方法的稳步远离。

![](data:image/svg+xml;utf8,)

认识到慕本对趋势跟踪的贝塔系数随时间呈下降,法国兴业银行几年前将该公司从趋势指数中剔除。虽然类似于经典的CTA,交易有流动性的主流市场,而且如许多投资者所寻求的,与传统股票和其他对冲基金投资保持低至接近零的相关性,但该公司可能很容易被归入多因子定量或定量宏观类别,正如被归入管理期货类别。古德曼承认:“策略分类标签实际上是公司不太关心的事情。”

“我们希望为投资者提供某种类型的业绩。一般来说,我们正在寻找与投资者投资组合中的其他投资不相关的阿尔法,因此多元化特征是关键。但我们也在努力构建一种不依赖特定市场环境才有机会获利的策略,”他继续说道。

不同形势下的绩效归因

这一点在历史上得到了证实,在非趋势或“震荡”的市场中,公司回报流中的真正差异已经出现。在这里,慕本已经能够产生一些非常好的结果。在反转过程中,慕本能够将损失降到最低,如图2所示。这一点至关重要,因为根据慕本的分类,自2013年以来,市场一直处于非趋势形势中,大约80%的时间。

![](data:image/svg+xml;utf8,)

机智地和机会主义地趋势跟踪

“我们当然不会放弃动量,我们确实希望能够在趋势发生时及时发现它们。我们仍然相信,在理解市场的前瞻性价格变动方面,动量是有指导意义的。所以我们构建的每一个模型都包含了价格动量。慕本首席投资官兼古德曼的联席首席执行官格兰特•史密斯(Grant Smith)表示,大多数传统的趋势跟踪CTA采用的相同范围的趋势输入也都被提供给了我们的模型。

“但与传统方法相比,我们的不同之处在于,我们将其留给流程,以根据背景来确定这些趋势输入何时具有预测性,何时不具有预测性。在某些情况下,动量可能根本没有用处。关键问题是:你如何识别这些时期?“他继续说。

危机阿尔法?
由于CTA回报的历史属性明显依赖于金融市场回报的模式和路径,因此CTA行业正在远离“危机阿尔法”的叙述。虽然2018年2月的股票市场逆转使慕本的定位与典型CTA的定位有些一致,但在2018年底,慕本实际上在抛售期间实现了一些强劲的利润;例如,其多市场计划在2018年9月20日至12月24日期间实现了6.90%的收益,这是一个标普500指数下跌超过19%的时期。慕本的表现与传统的趋势追随者等CTA形成了鲜明对比,后者在这一时期通常亏损。因此,尽管没有明确的保证,在趋势逆转同时发生的重大风险释放事件的情况下,慕本的方法确实保留了获利的可能性。

整体地应用统计学习

机器学习是答案,但它有很多种味道。根据公司的多样化方法,所使用的统计学习技术在不同的模型中有所不同,一般来说,不会优先考虑特定的技术。

“应用机器学习的方法几乎是无限的。不同的技术、不同的训练集、不同的数据输入、每种技术中不同的算法、不同的再训练频率等,因此有着非常多的应用艺术。这不是“剪切粘贴”。古德曼说:“我们已经在这方面工作了七年多,采取了一种风险管理、多样化的方法——我认为这是我们迄今为止取得成功的关键,而其他人则试图深入使用这些统计方法。”

有些经理可能只将机器学习应用于投资组合的特定部分或某些功能。与那些使用机器学习技术来选择信号或对独立模型进行加权的人不同,与那些只使用机器学习技术来执行更高效交易的人不同,慕本将其多因子方法完全应用于回报预测和执行成本预测;每个预测都100%来自这些机器学习技术。

非价格数据输入增长

![](data:image/svg+xml;utf8,)

“研究机器学习用语中的新因素或‘特征’是我们过程中最重要的维度之一。自2013年以来,我们一直在以稳定的速度增加新的因子,现在使用的大约是2013年7月使用的数字的6倍,”史密斯说。

在一个典型的模型中,价格数据可能构成40%或更多的输入,反映出该公司对价格作为回报预测的潜在良好信息的持续信念。然而,非价格数据在一个典型模型中代表了一个越来越大的输入比例。例如,这可能包括更传统的基本面数据或市场结构数据,但公司正在越来越多地评估所谓的“另类”数据源的有效性。

然而,在某些意义上,在价格和非价格之间分割数据是有点人为的,因为每一个数据都是由另一个数据决定的——两者都可以是背景或时期依赖的。

这可能导致信号,有时与简单的价格驱动趋势跟踪信号非常不同。图4中的图表将慕本机器学习方法的交易信号与传统趋势跟踪方法的交易信号进行了比较,并以布伦特原油交易为例。在一些数周和数月的时间段内,慕本的持仓似乎或多或少与趋势追随者保持一致,但在其他时间段,如7月中旬,慕本持有与趋势模型相反的仓位,以期在更为动荡的时间段内找到利润。在某些情况下,比如在10月份开始的强劲反转期间,慕本的多因子方法能够更快地采取行动,比公司的趋势跟踪策略快了近一个月建立空头头寸。

![](data:image/svg+xml;utf8,)

数据:质量超过数量

慕本还认为,随着时间的推移,传统数据和另类数据之间的区别将变得模糊。这家公司经常和供应商接触,这些供应商将曾经的“非结构化”数据(如卫星图像)转化为可通过其框架进行评估的结构化数据。慕本预计这一趋势将继续下去,提供越来越多的数据集进行评估。

考虑到全球可用数据量呈指数级增长,使用五年前6倍的输入数据可能不会像听起来那样戏剧性。慕本的数据输入以该公司称为的“可测量的节奏”来扩展,因为这个不断增长的数据集库必须经过仔细的管理。例如,一些数据集被拒绝,因为它们可能没有足够长的历史记录,或者即使足够长的历史记录也可能不具有可比性和一致性。

“对我们来说,这一切都是关于数据,但与其说是关于数量,不如说是关于质量。我们不太担心数据源是标记为传统的还是另类的。我们关心的是:数据是否干净;是否可以验证;我们是否有足够的历史来让模型“学习”;但最重要的是,它对回报预测过程有价值。这些都是我们测试的相对简单的标准”史密斯说。

商品策略
明确的相对价值或“价差”交易目前只用于商品市场。这些为公司“商品计划”产品保留的价差策略受到了合理的容量限制,因此慕本在2018年初软关闭其广受欢迎的“商品计划”产品。去年,“商品计划”产品的回报率超过23%,主要是由于价差策略,尽管大宗商品的直接交易利润也很高。在任何情况下,相对价值交易使用的信号和执行成本引擎与直接市场中使用的相同。这意味着在一个组件或一个部门中所做的改进通常适用于所有其他组件。

大数据?

虽然该公司对所用数据的确切性质和数量守口如瓶,但他们强调要避免使用“大数据”标签。“我们的方法并不是给机器几十万或几百万个深奥的数据输入,然后让它运行。在大多数情况下,如果我向你展示我们使用的数据来源列表,你会认为在对回报产生潜在影响方面是非常合理的。除了我们已经使用了几十年的动量输入之外,许多这些数据源已经在慕本使用了十年或更长时间。所以,我们很有信心他们能增加价值。我们自2013年以来一直使用的框架中的差异在于背景方法,”古德曼说。

背景量化、噪声和人为输入

慕本认为,背景方法是从信息中提取alpha的更好方法。“作为研究人员,我们对市场的背景理解的整个想法是非常直观的,事实证明,对我们的投资者也是如此。我认为没有人会争辩说,原油库存数量的释放可能会对同一市场的近期价格变动产生一些潜在影响。但也许7月份公布的库存数字可能意味着与4月份观察到的相同数字不同,这是因为炎热季节和驾驶季节。还有什么可能影响价格?史密斯说:“在股市飙升的背景下,4月份公布的存货数量上升,或许价格会做出某种反应,而与股市下跌时的反应相反。”情绪、季节性和动量数据也可以以各种方式组合在一起。

“因此,尽管数据之间的相互关系具有直观的意义,但问题是如何以一种稳健、科学的方式梳理这些关系或影响。我们构建的框架就是为了精确地做到这一点,”史密斯继续说道。

但这并不容易,尤其是在金融市场的背景下。“解决金融市场的回报预测与预测你在Netflix上可能喜欢什么电影,或者预测你在亚马逊上可能喜欢买什么书截然不同。金融市场非常嘈杂,从这种噪声中提取信号比其他行业更困难。在我们看来,这需要真正的市场知识,以及投资的各个方面的经验。”古德曼说。算法技术的参数需要更多的定制,并以独特的方式组合,以获得一个稳健的预测。

虽然模型100%基于机器学习,但这不是黑箱方法,由人的主观监督。“人需要定义输入和参数,包括风险承受能力,并评估数据质量,然后才能扳动开关,让机器尝试寻找关系。但人要识别复杂的、有条件的、多因素的、多数据的相互关系,就需要大量的试验和错误,而计算机能够更快、更准确地识别这些相互关系,”古德曼说。

动态调整和交易成本

虽然风险预算和模型参数的设置是由研究人员(借助定量工具)完成的,但100%的主动信号和市场中的主动交易是统计学习过程的直接结果,以全自动化的方式。在针对每个市场有相对稳定的风险预算的框架内,统计学习过程做接管,几乎实时地确定要使用的风险预算的多少。该过程将原始收益预测(由每个市场的一组学习模型生成)与执行成本预测结合起来,以确定是否提前进行交易、推迟交易或将交易拆分为多个部分。

“只有当系统认为有机会在交易成本后获得利润时,才会执行信号。这可能意味着更深、更具流动性的市场可能具有更低的障碍,交易会更频繁,而流动性较低的市场可能更经常受到交易成本的控制,”史密斯说。

慕本远离高频,但他每天24小时根据新数据流不断地对数据进行采样、调整信号和返回预测。直通式处理(STP)可以将订单直接传输给执行经纪人,并有助于处理更大的交易量,因为研究发现提高信号频率有好处。

当然,交易成本预测也依赖于一个完整的机器学习框架,它可能会有很大的变化——这取决于一天中的时间、订单的深度以及模型考虑的其他条件。虽然成本本身很重要,但系统准确预测成本的能力也是关键。

其结果是一个最好描述为“灵巧”的策略,集中于“亮度调节开关”的方法,以便在任何特定时间尽可能靠近最佳仓位。当投资者检查仓位变动时,虽然平均持有期仍在20天的范围内,但即使在几天内,仓位也会从多头转为空头,反之亦然,这并不少见。

投资范围、分散化和风险控制

传统趋势跟踪的一个论点是,对于每个市场,动量总是一个微弱的信号(基于夏普比率)。曾经认为,传统趋势跟踪策略主要依靠分散化来产生一个体面的投资组合水平夏普,现在只需要一个更广泛的投资领域,以复制历史上的分散化收益并保持其历史业绩。因此,一些CTA坚持传统模式,但改变了其市场配置,或开始将趋势跟踪到更加冷僻的市场。

相比之下,慕本的创新主要是在模型上,而不是市场上。它并没有动态地改变太多的市场权重,也没有在历史上增加许多新市场。

**“这些技术非常强大,但我们在如何应用它们方面很谦虚。**我们的目标不是过度设计或过度优化。风险管理对我们来说至关重要,我们仍然相信控制风险最可靠的方法之一是通过分散化。因此,将投资组合放在一起,首先我们认为这是一个深思熟虑但相对简单的风险预算框架,试图大致均衡每个项目的交易板块的风险分配,然后在每个板块内,在相关的交易市场上进行分配。保持在这些预算的范围内会有所帮助,”史密斯说。

由于模型和信号的分散化,以及“亮度调节开关”的方法试图在每个市场中保持最佳仓位,而不是进行二元转换,因此公司通常在任何时候都会在每个交易市场中拥有一些非零的仓位。

该公司最多元化的项目交易100种全球工具,为分散化提供了良好的机会,但鉴于每种工具每天可以进行多次交易,也提供了许多成功交易的机会。尽管迄今为止该公司不得不避开一些更为冷僻的市场,如电力和其他市场,但研究仍在进行中。

![](data:image/svg+xml;utf8,)

投资者沟通

随着公司策略的发展,公司与投资者沟通的方式也在发展。传统的趋势追随者可以很容易地解释,他们在最近的价格行动中已经做出了建仓和逆转,但考虑到动态变化的权重的多重输入,慕本很难准确地解释是什么导致了仓位的变化。

克雷格·吉尔伯特(Craig Gilbert)有数学背景,2011年从Two Sigma加入了慕本,正如慕本的研究转向了统计学习一样,他指出,该团队已经努力使这些策略对投资者来说是可以理解的。“对于定量策略,过程中总会有一部分是不透明的。但是大部分的过程——所有围绕不透明位的元素——都可以解释。我们认为,了解这些要素——如风险控制、操作程序、数据来源和清理、投资组合构建、信号组合——同样重要。”

为了提供帮助,该公司再次大量依赖于数据,制作详细的可视化和动画来演示机制,目的是使该方法不再神秘化。投资者还可以看到每一个市场的信号,并可以跟踪这些信号是如何随着时间的推移而发展到今天的。

虽然解释市场中特定信号的精确起源可能更困难,“不透明”部分,但该公司确实有自己的工具来帮助在个案基础上做到这一点。但魔法部分在于神秘。

“根据定义,统计学习方法试图比人类更有效地揭示历史数据中的模式或趋势。在某些情况下,这些技术正在揭示真实的、健壮的、具有统计意义的模式,而人类完全不可能发现这些模式。所以,我们解释“为什么”的自然欲望有点忽略了这一点,吉尔伯特说。

此外,即使存在一定程度的不透明性,大多数投资者也会对建立在某种程度上的直觉基础上的过程感到欣慰,同时了解到在某种程度上,机器将接管并做繁重的工作。“我们的研究人员往往不太担心为什么我们有特定的持仓,因为他们对这个过程有信心。对于投资者来说,由于进入模型的输入是有计划的,而且通常是相当常识的,我们认为与其他定量方法相比,对输出的信任也应该更高,”古德曼说。

互补的高影响的招聘

慕本的资产增长和强劲的业绩显然使它成为一个有吸引力的雇主,招聘也提高了以满足新的挑战。慕本的人才培养方法涉及公司的各个领域。“当然,我们追求的是聪明人,但也非常注重正确的文化适应。从研究的角度来看,如今常见的,甚至与十年前不同的是,每一位受雇于建模团队的人都有很强的数学和统计分析技能,并且有能力利用机器学习技术,”慕本的总裁兼首席运营官格雷格·巴克宾德说。

虽然慕本的招聘团队经常从亚马逊和谷歌等公司的目标大学中招聘人才,甚至是慕本的量化同行,但慕本的研究人员可能在较小的水池中会成为更大的鱼。史密斯说:“我们认为,我们提供了一个环境,让研究人员能够有更快速和直接的影响……新的研究人员不会发现自己只是在修补边边角角。”

但正因为每个团队成员都能产生重大影响,所以对员工的选择非常谨慎。正如史密斯所阐述的,“对于从事研究和开发的员工,尽管我们一直在寻找,但我们还是有选择地雇佣他们。我们的偏好是能添加技能集的人才,这些技能集可能与我们现有的技能集互补,并且/或者现有团队可以通过多种方式加以利用。因为我们在开放和透明的环境中工作,所以我们认为这种方法是有意义的。”

慕本还在技术上投入了大量资金。首席技术官兼交易联席总监Manu Kambhampati在11年前加入该公司,致力于使该公司在业务的各个方面保持领先地位。Kambhampati说:“在我们所做的每件事中,我们都致力于构建一个高度弹性、可扩展、零死机时间的环境。这就是我们今天的流程所要求的。有时这意味着利用“现成”的产品,但有时我们会根据需要定制包装。就像我们的信号传递过程一样,一切都是特定于环境的。”

这转化为专有和开源软件包的混合,其中许多都经过了高度和专门的修改。

而且它起了作用。巴克宾德说:“这种构建研发团队的理念,加上高效的研究和技术框架,使我们能够支持我们的发展,同时避免了雇佣研究人员队伍带来的管理挑战。”

资产和策略容量

员工们一直在慕本“吃自己做的菜”。超过4亿美元,约占公司资产管理规模的7%,是目前和以前的员工、他们的家庭成员和相关实体的资产。这些资产尽可能与慕本的外部投资者一起投资,除了较低的费用外,没有优惠条件,确保了良好的一致性。

这些共同投资从最高级的员工一直到最低级的员工,为每位员工提供了在公司多元化计划中投资(公司增强)退休养老金储蓄的机会。这是一项被大量利用的福利,表明了员工对公司的信心。

随着资产的稳定增长,策略容量问题出现了。尽管该公司在商品项目的软关闭中表明,它在保护现有投资者方面训练有素,但至少在短期内,它认为其主要的多元化和多市场项目不存在此类能力问题。虽然慕本的首席信息官史密斯(CIO Smith)相对不置可否,但该公司目前的模拟结果显示,即使不考虑未来研究以提高可扩展性,该公司的业绩仍保持在100亿美元以上。因此,尽管不是无限的,但仍有很大的空间支持资产增长——从业绩、净流入或两者兼而有之。

该公司的UCITS战略是在目前已被Generali Investments收购的MLIS(Merrill Lynch Investment Solutions)平台上推出的,其交易几乎与其多元化计划同等,为股票、货币、固定收益和商品的四个部门的每一个部门提供风险敞口。考虑到策略的流动性和多样性,除其他外,仅需进行细微的修改,以适应UCITS的规定,这意味着对旗舰的跟踪误差几乎为零。

尽管该公司一直为众多投资者服务,但机构开始加大投资力度,包括一些规模最大、最复杂的养老基金和保险公司。古德曼说:“当然,这些投资者被我们的回报所吸引,被我们的稳定和寿命所吸引,以及被公司的适应能力并保持领先地位的能力所吸引。”

尽管慕本的美国投资者基础继续占据其资产管理规模的最大份额,但随着该公司的品牌在强劲表现的顺风中变得更加明显,欧洲、亚洲和澳大利亚的利益(和资产)也在增长。“在全球范围内,我们看到投资者开始改变看法,要么寻求多样化,要么越来越多地重新考虑他们投资组合CTA部分的方法。我们认为我们提供了一个独特的选择,”吉尔伯特说。

展望:新办公室、新模型和新市场

今天慕本有一定的兴奋,因为团队进入曼哈顿市中心的明亮新办公室,位于46街西55号,就在美国大道旁边,布莱恩特公园以北四个街区。

从研究的角度来看,框架继续提供大量的机会,研究正沿着增加因子、增加统计学习技术和改进执行的三个维度进行。

从一个新的市场角度来看,该公司是越来越多的CTA之一,他们将与中国当地的量化经理人建立合资企业,以帮助扩大对中国大陆人民币投资者的期货发行。这一策略始于慕本国际模型在中国本土期货市场的简单应用。业绩一直强劲,监管变化意味着,非中国投资者很快就能进入该项目。

此外,一些中国本土期货市场本身也向国际投资者开放,例如铁矿石(在大连商品交易所交易)和原油期货(在上海国际能源交易所交易)都在2018年向外国人开放。慕本预计这一趋势将继续下去,他们认为,在本地交易这些市场的经验将使他们在国际项目中率先开始这些工具的交易。

目前,已露端倪的是这些模型在战术性股票证券交易中的应用,以一系列基于行业的战术方法的形式,最终是单只股票的形式——目前,这只是一点点的开始,但却有远大的前途。概念验证已经建立,与战略投资者的讨论已经开始。慕本独特的传统、文化和流程可以为股票和信贷的量化交易提供新鲜和不同的视角。

古德曼说:“这家公司已经走了很长的路,但我们觉得我们只是处于早期阶段。”


读者可以阅读以下相关文章:

雷闻:统计学习结合趋势跟踪_慕本Milburn_对冲基金文章翻译计划025​zhuanlan.zhihu.com图标雷闻:机器学习金融,行不行?_AQR_对冲基金文章翻译计划026​zhuanlan.zhihu.com图标雷闻:对冲基金文章翻译计划001_英仕曼_投资管理中的机器学习​zhuanlan.zhihu.com图标