对冲基金文章翻译计划001_英仕曼_投资管理中的机器学习


(astroman) #1

作者:格雷汉姆 罗伯森

翻译:雷闻

原文发表时间:2018年11月

原文章来自英世曼网站,本文为原文章的中文翻译。本文仅用于交流学习使用,不得用于商业用途。如对相关著作人造成侵害,请立即联系译者及时删除


本材料仅供机构投资者、合格投资者和投资专业人士使用。不用于零售公开渠道。

机器学习是一个广泛的、全面的术语,适用于各种计算机算法,旨在识别数据中的能够重复的结构和关系,而无需明确说明要查找的内容。我们之前已经就这一领域在工程、计算机科学、统计学和数学等学科的发展及其在量化策略中不断进步的应用撰写过文章。事实上,大多数机器学习技术已经并且正在金融以外发展,但我们相信,随着时间的推移,机器学习在投资方面的应用将继续增长。在英世曼,我们将机器学习应用于多个领域,而不仅仅是我们的定量交易策略。本文概述了它在投资方面的广泛应用。

1 直接从数据中学习

在我们30年的定量投资历史中,我们的研究人员一直在“告诉”计算机趋势是什么样子,然后要求他们在尽可能多的市场中找到这些模式。**(笔者注:例如技术指标)**然而,机器学习允许计算机采取一种更自由的方式,旨在识别价格数据中的可预测模式,而不必给出有关潜在关系的具体指导。这与传统的定量投资有很大的不同,我们已经开始看到它的增值潜力,帮助我们发现市场上更多的多样化机会。从长远来看,这究竟对投资者意味着什么?我们的行业正处于回答这个问题的早期阶段,但我们觉得有一件事是很清楚的:机器学习帮助我们通过一个不同的,而不是总是线性,的透镜来看待世界。

机器学习技术的一些例子
深度学习——使用人工神经网络的算法,被设计成模拟人脑的生物网络,通过大量的数据集训练来“识别”一系列的刺激。这些网络已用于图像识别和围棋等游戏领域。它们还可以用来学习财务数据集中的预测模式。
自然语言处理——书面或口头语言或对话的理解。一些技术可以用可重复和无偏见的方式衡量公司财务报告正面或负面情绪,并给出数值分数。**(笔者注:证券分析师对于财报的分析通常是不可重复和带有个人偏见的)**这些数值分数有助于在交易模型中输入信号。

英世曼已经在这一领域进行了几十年的研究。在20世纪90年代,这项研究就被冠以如“遗传算法”和“神经网络”等流行语。然而,直到最近,这项研究的结果仍然与原始计算能力和数据密度的要求格格不入。随着这些领域的重大进展,以及基础理论的改进,自2014年以来,我们已经在一些不太以趋势为风格的客户项目**(笔者注:推测来看,这里客户项目类似于一个私募基金发行的产品)**中以各种形式积极应用机器学习。

最近,一套被限制以主要类似动量的方式工作的机器学习算法,被纳入了英世曼的旗舰趋势跟踪策略中。

2 发现市场数据中的非线性趋势

定量研究通常以发现输入数据(如历史价格变动、利率或公司收益)与资产价格未来变动之间的线性关系为基础。尤其是趋势跟踪,通常被视为过去价格变动和未来价格变动之间的简单线性关系。如果市场在最近一段时间窗口内上涨,那么它更有可能继续上涨而不是下跌,反之亦然。如果它在陡峭地下降,它更有可能继续陡峭地下降,而不是逐渐下降。

因为这种关系在过去一直很牢固,所以当把历史市场价格作为输入时,许多机器学习算法会“发现”趋势,并将趋势作为预测未来价格的第一种方法。这并不奇怪。最初,我们的目标总是观察这种“发现”的趋势跟踪形式是否以及如何与我们多年来理解的现有交易行为不同。我们开发并继续在多策略项目中使用的第一个真正的机器学习模型被构造成与我们现有的信号正交,也就是说,在统计上独立,因此不会使项目的动量敞口增加一倍;如果一个更简单的模型是可行的,那么在交易中使用一个更复杂的模型就没有价值了。

这些早期的机器学习算法所擅长的是在数据中建立更微妙的非线性关系。也就是说,在价格数据中,重要的不仅是价格在过去一年里上涨的量,而且是价格运行的路径。经过四年的交易和持续的研究,我们相信这些模型在不受约束的情况下,可能有助于识别包括趋势在内的方向性的市场行为,其方式可以与现有模型互补。因此,我们认为,它们显然适用于我们寻求从市场方向的可预测性中获益的所有策略。(笔者注:笔者在13年研发了类似的机器学习模型,通过识别价格的运行路径来预测价格未来的走势。和当时主流的技术指标策略相比,风险收益比的优势不明显,但是相关性在0.5左右,能够分散策略组合的风险。所以完全赞同英世曼的观点)

3 机器学习可以支持系统化投资策略的其他方面

然而,有趣的是,我们发现机器学习方法的实用价值不仅仅在于对潜在市场运动或者alpha的预测。另一个关键领域是交易执行领域,其重点始终是为客户实现最低成本的市场准入,同时使市场影响最小。对投资者来说,机器学习最广泛的潜在好处可能来自它处理大量数据的能力。图1给出了目前通过市场生成的大量数据的一个例子,英世曼在2018年10月25日的一天内获取了超过15亿次的价格更新。

![](data:image/svg+xml;utf8,)

如果现在是数据泛滥的时代,那么机器学习算法就有可能显著提高投资者处理和分析市场信息的能力。

更具体地说,有一些机器学习算法也可以帮助在不同的市场路径之间进行决策。英世曼在开发期货和外汇市场执行的内部算法方面投入了巨资。然而,对于单只股票的交易,我们通常使用第三方算法,其中银行和经纪人提供了大量的算法。投资者将意识到狙击手、游击队、TWAP和VWAP等形形色色的名字,而每个供应商通常都提供各种控制措施,以允许在速度和侵略性等领域的算法具有更大或更小的自主权,或访问所谓的“暗池”流动性。

我们相信,为了让我们自信地代表我们的基金提供最佳执行,我们需要“学习”这些不同算法的所有排列组合的交易成本。而这些交易成本可能随时间、地区或市场规模而变化。历史上,这可能是作为一系列复杂的实验来管理的,通过实验运行中的评估。但是,这种方法是低效的,并且不能快速适应环境或数据的变化。

幸运的是,我们试图解决的问题是概率论中所谓的“多臂强盗”问题。所谓的“多臂强盗”问题,首先想象一排老虎机,而每一个都可能有不同的中奖概率**(笔者注:而赌徒并不知道哪个老虎机中奖概率最高,只能靠不断下注和尝试,来发现中奖概率最高的老虎机)**。在这个问题上,赌徒面临的挑战是找出玩哪个机器,以及多久玩一次,以便最大限度地提高中奖概率。在第二次世界大战期间,同盟国希望解决这类问题,以期在资源分配方面有所帮助;事实证明,传统的分析框架很难解决这类问题,因此数学家彼得·惠特尔建议把这个问题扔到德国,让那里的科学家浪费时间!直到最近,机器学习才开发出实用的算法方法,而英世曼正尝试采用这种方法来支持客户交易执行的有效分配。

4 学术和业界关系发挥重要的作用

由于机器学习仍处于投资应用的早期阶段,因此金融专业人员必须与学术界密切合作,以开发这些方法。在英世曼,我们经验丰富的团队由科学家、计算专家和投资专家组成,为整个企业提供带头和最先进的基础设施。我们与牛津大学工程科学系的牛津-英世曼研究所(OMI)密切合作,支持机器学习方面的前沿学术研究。

OMI机器学习研究小组的学者们在成功开发现实应用方面有着悠久的历史,例如在远程传感器网络和飞行中的喷气发动机监控方面。OMI在2018年夏季庆祝其成立11周年。我们与OMI的深厚关系使英世曼能够从非金融学科的机器学习方法可以转移到定量投资的领域中受益。当然,有效的管理和治理是关键,选择正确的数据、最合适的算法和最佳的交易执行可以使或破坏算法为投资者增加价值的能力。

随着时间的推移,机器学习在金融领域的应用将继续增长,其在策略中的作用已经确立。我们正进入一个信息快速增长的时代:数据可得性可能会继续按数量级增长,在我们看来,庞大的计算能力将更加常规化。事实上,有些人会说我们已经在那里了,数据驱动研究的新领域的机会也很多。随着该领域的不断发展,我们坚信机器学习的智能应用具有真正的潜力,有助于投资者抓住新的和多样化的市场机遇。

这是对一篇最初于2017年9月发表的文章的更新。


![](data:image/svg+xml;utf8,)

格雷汉姆 罗伯森

英世曼的客户组合管理负责人

格雷汉姆 罗伯森是英世曼的客户组合管理负责人,主要负责客户沟通。在2011年加入英世曼之前,格雷汉姆在KBC另类投资管理公司制定了资本结构套利策略,并为Vicis Capital建立了股权衍生品相对价值模型。他在瑞士信贷(Credit Suisse)开始了固定收入的职业生涯,后来转到德国商业银行(Commerzbank),在那里建立了相对价值团队,随后成为信贷战略主管。格雷厄姆拥有牛津大学地震学博士学位和爱丁堡大学地球物理学学士学位。