think的知识库

量化投资蒙特卡洛回测 Tactical Investment Algorithms

由think创建,最终由think 被浏览 21 用户

Overview

说到量化投资和研究,很多人有一个基本认知,就是通过数据观察和分析,提出假设,然后通过回测来验证假设。通过验证之后,再上实盘验证。当然,其中有一些深入的细节。比如回测可以是样本内+样本外。这里有篇学术论文,其中一个观点就是大部分人跑的回测都没什么意义。论文的作者是前AQR的机器学习负责人,康奈尔大学的机器学习教授,畅销教科书《 Advances in Financial Machine Learning》作者。论文题目:TACTICAL INVESTMENT ALGORITHMS。

摘要

根据历史证据,有三种基本方法来测试投资策略的有效性:a)向前走法;b)重采样法;c)蒙特卡罗方法。到目前为止,在学术界和实践者中最常见的方法是向前走的方法。这种选择隐含着这样一个假设,即给定的投资策略应该在所有市场环境中有效。我们将这种假设称为“全天候”假设,以及基于该假设的策略投资策略。

全天候假设不一定是真的,许多投资策略在零利率环境中举步维艰就证明了这一点。这就产生了识别适合特定市场体制的投资策略的问题,即“战术投资策略”。本文认为,针对合成数据集的后验测试应该是开发战术投资策略的首选方法。我提出了一种新的资产管理公司组织结构,作为一个战术策略工厂,符合蒙特卡罗回溯测试范式。

简介

两个主要的认识论局限性阻止了金融成为一门科学。首先,金融学不符合波普尔的可证伪性标准,因为金融理论无法在实验室中进行受控实验。诸如“价值和动量因素解释了股票的超常表现”这样的说法,即使事实证明是错误的。所有的研究者都是由未知数据生成过程(DGP)产生的单一实现路径(价格时间序列)的结果。我们无法从同一个DGP中得出数百万条替代路径,并且在控制环境条件的情况下,评估价值和动量因素有多少解释力。

影响金融业的第二个认识论限制是非平稳性。金融系统是非常动态和复杂的,随着时间的推移,情况会迅速变化。由于监管、预期、经济周期、市场机制和其他环境变量的变化,金融因果机制并非一成不变。例如,即使价值和动量因素确实能解释20世纪股票的超常表现,但由于最近的技术、行为或政策变化,情况可能不再如此。也许价值和动力只在某些不再存在的条件下起作用。因此,金融经济学家提出的主张通常是基于轶事信息,并不符合科学理论的标准。

由于这些认识论上的局限性,研究人员依赖于回测来开发投资策略。回测在一般假设下推断投资策略的性能,即未来的观测值将来自产生过去观测值的同一DGP。在本文中,我解释了不同类型的回溯测试方法,以及每种方法背后的具体假设。我还认为,一种特殊的后验方法可以帮助解决金融学的认识论局限性,使金融理论更接近科学标准。

三种回测

一般来说,我们可以区分三种类型的回测。首先,前进法(WF)在历史完全重复的假设下评估投资策略的性能。WF的第一个警告是,过去的时间序列仅仅反映了DGP产生的一条可能的路径。如果我们用时间机器,DGP的随机性会产生不同的路径。由于WF回溯测试不能代表过去的DGP,所以没有理由相信它们代表了未来的DGP。因此,WF更有可能产生描述性(或轶事)而非推论性陈述(见López de Prado[2018],第11章)。WF的第二个警告是,DGP从未声明过:如果DGP发生变化,研究人员将无法在该策略赔钱之前停止使用该策略,因为她从未了解使该策略工作的条件。

第二种回溯测试是重采样方法(RS),它解决了WF的第一个警告。RS在假设未来路径可以通过对过去观测值的重采样来模拟的前提下评估投资策略的性能。重采样可以是确定性的(例如,刀切、交叉验证)或随机的(例如,子抽样、引导)。

因为RS可以产生许多不同的路径,其中历史只是一种可能性,它允许我们考虑与DGP一致的更一般的场景。例如,通过一个RS回溯测试,我们可以引导该策略的Sharpe比率的分布,这比WF推导的单路径Sharpe比率信息更丰富。虽然过拟合WF回溯测试并不重要,但过拟合RS回溯测试则更困难。然而,在有限的历史样本上重新取样可能不会产生代表未来的路径(见López de Prado[2018],第12章)。

第三种回溯测试,蒙特卡罗方法(MC),解决了WF的两个警告。MC方法在假设未来路径可以通过蒙特卡洛模拟的前提下评估投资策略的性能。MC要求对DGP有更深入的了解,从观察或理论的统计分析中得出(例如,市场微观结构、制度过程、经济联系等)。例如,经济理论可能认为两个变量是协整的,而实证研究可能指出表征协整向量的值的范围。因此,研究人员可以模拟数百万年的数据,其中协整向量在估计范围内取许多不同的值。这是一个更丰富的分析,而不仅仅是从一组有限的(可能是不具代表性的)观测值中重新取样(见López de Prado[2018],第13章)。

蒙特卡洛回测的一个实例

考虑一位希望设计做市策略的研究人员。市场微观结构理论告诉我们,不知情交易者由于暂时的市场冲击而导致短期均值回归,知情交易者对市场价格产生永久性影响。知情交易者以[ [公式] ]到达市场,而不知情的交易者以[ [公式] ]到达市场,两种利率都可以用泊松过程建模。通过对历史时间序列的统计分析,给出了一个区间的波动,可以用来模拟各种情景下的长序列。对于给定的[ [公式] ]和[ [公式] ]组合,MC允许我们推导出最优的做市策略,即在蒙特卡洛回测中使夏普比率最大化的获利了结和止损水平。相比之下,WF和RS将对造市策略的整体性能进行回溯测试,而不允许我们估计特定对的[ [公式] ]和[ [公式] ]的性能,也不允许我们为每个特定对推导出最优的做市策略。

图表1显示了在各种获利回吐和止损情景下交易策略的性能,其中基础价格遵循Ornstein-Uhlenbeck过程,半衰期为零漂移和单位方差噪声(见López de Prado[2018],第13章)。半衰期如此之小,以至于在一个小的获利回吐和大的止损组合中,业绩最大化。换言之,最佳的交易规则是将存货持有足够长的时间,直到产生少量利润,即使冒着遭受5倍或7倍未实现损失的风险。夏普比率很高,达到3.2左右的水平。在这种情况下,最糟糕的交易规则是将短期止损与大幅获利回吐结合起来,这是做市商在实践中避免的情况。在网格的对角线中,表现最接近中性,获利回吐和止损是对称的。

{w:100}{w:100}

图表2显示了当半衰期从5增加到10时会发生什么。性能最高和最低的区域分布在网格上,而Sharpe比率降低到2左右或以下。这是因为,随着半衰期的增加,自回归系数的大小也会增加,从而使过程更接近随机游动。对于足够长的半衰期,即使是获利回吐和止损水平的最佳组合,也会产生难以接受的低风险回报率。

{w:100}{w:100}

蒙特卡洛回测的四个独特优势

与WF和RS相比,MC有四个关键优势:第一,MC后验有助于解决金融学的第一个认识论局限性,因为它们允许研究人员进行随机对照实验。诚然,这些实验需要假设一个特定的DGP,但至少DGP是明确声明的(不像在金融期刊上发表的WF回溯测试)。在MC回溯测试中,研究人员声明了她发现的假设。如果投资者认为真正的DGP不同,她只需要提出一个替代DGP并重复分析。我们可以将MC回溯测试视为Ersatz测试的一种特殊情况,在这种情况下,统计方法是在已知模型的计算机生成数据上进行测试的(Jarvis等人。【2017年】)。

其次,MC回溯测试有助于解决金融学的第二个认识论局限性,因为研究者不需要假设DGP是不变的。相反,发现被连接到特定的DGP,其中可以随着时间从不同的DGP获取实现。换言之,MC回溯测试允许我们开发“战术投资策略”,而不是在WF或RS的帮助下开发的“战略投资策略”。特定DGP产生实现的概率可以进行统计评估,这使得研究人员可以根据情况的变化来调试或停用战术策略。

第三,MC回溯测试可以合并先验知识,它注入的信息超出了我们从有限的一组观察中所能学到的信息。当这些先验知识被经济理论所驱动时,MC提供了一个强大的工具来模拟最可能的情景,即使其中一些情景在过去没有被观察到。与WF或RS不同,MC回溯测试可以帮助我们开发战术策略,以便部署在黑天鹅面前。

第四,MC回溯测试的长度可以根据需要进行扩展,以达到目标置信度。这有助于MC回溯测试避免使用有限数据集所固有的不确定性。

蒙特卡洛回测的批评

投资者有时对MC回测持怀疑态度,因为它们计算的是基于合成数据的投资策略的性能,而这些数据可能无法代表真正的DGP的未来实现。这种怀疑是错误的,有两个原因:(a)估计DGP不一定比预测市场更难。一方面,假设统计方法可以带来成功的投资结果,但另一方面,统计方法无法识别DGP,这在认知上是不一致的;(b)WF和RS使用的观测值在未来不太可能再次出现,就像模拟的那样,MC生成的路径不一定不太可能。

另一个问题是研究人员可能会选择对投资策略特别有利的DGP。这种担心也是错误的:MC方法明确声明了性能模拟的基础假设,因此如果DGP对策略不现实地有利,投资者可以反对。相比之下,WF和RS方法通过选择模拟所使用的历史数据集来暗示这些假设,混淆了选择偏差和确认偏差的危险性。

DGP示例

蒙特卡罗从估计的总体或DGP中随机抽取新的(未观察到的)数据集,而不是从观察到的数据集(就像引导程序一样)。蒙特卡罗实验可以是参数的也可以是非参数的。参数蒙特卡罗的一个例子是区域转换时间序列模型(Hamilton[1994]),其中样本来自于备选过程,n=1,…,n,并且在时间t从过程n提取的概率P(t,n)是从中提取先前观察的过程的函数(Markov链)。期望最大化策略可以用来估计在时间t(转移概率矩阵)从一个过程转移到另一个过程的概率。这种参数化方法允许研究人员匹配观测数据集的统计特性,然后将其复制到未观测到的数据集中(见Franco Pedroso等人。[2019年])。

参数蒙特卡罗的一个潜在警告是DGP可能比有限的一组代数函数可以复制的复杂。在这种情况下,通过使用变分自动编码器、自组织映射或生成对抗网络,非参数蒙特卡罗实验可能会有所帮助(De Meer Pardo[2019])。这些方法可以理解为潜在变量的非参数、非线性估计(类似于非线性PCA)。一个高维的神经网络编码器是如何在低维空间中表现的。变分自编码器有一个额外的性质,使其潜在空间连续。这允许成功的随机抽样和插值,反过来,他们作为生成模型的使用。一旦变分自动编码器学习了数据的基本结构,它就可以在给定的离散度内生成与原始样本的统计特性相似的新观测值(因此有了“变分”的概念)。自组织映射与自动编码器的不同之处在于它应用竞争学习(而不是纠错),并且它使用邻域函数来保持输入空间的拓扑特性。生成性对抗网络训练两个相互竞争的神经网络,其中一个网络(称为生成器)负责从分布函数生成模拟观测值,另一个网络(称为鉴别器)的任务是预测给定真实观测数据的模拟观测值为假的概率。这两个神经网络互相竞争,直到它们收敛到一个平衡点。训练非参数montecarlo的原始样本必须具有足够的代表性,以了解DGP的一般特性,否则应首选参数montecarlo方法。更多详情见López de Prado[2019年]。

战术策略工厂

WF和RS回溯测试方法试图找到“全天候”策略,即与特定DGP无关的、在所有市场条件下部署的战略投资策略。战略(全天候)投资策略的概念与市场会经历一个过程的事实不一致,在这个过程中,一些策略预计会起作用,而另一些策略则会失败。考虑到市场是适应性的,投资者从错误中吸取教训,真正的全天候策略存在的可能性相当小(全权委托的投资组合经理经常使用这一论点)。即使存在全天候策略,它们也很可能是跨一个或多个区域工作的策略种群中相当微不足道的子集。

与WF和RS回溯测试相比,MC回测帮助我们定义投资策略对每个DGP特征的精确敏感性。一旦我们了解了什么特征使策略起作用,我们就可以策略性地部署它,同时监控市场条件的真实性,并得出适当的事前风险分配。当以这种方式使用时,MC回测允许我们交易策略而不是市场。在这种投资范式下,公司将开发尽可能多的战术投资策略(López de Prado[2018],第1章),然后只部署那些经认证可在普遍市场条件下工作的策略。这些策略是特定于DGP的,而不是特定于仪器的:当这些仪器暂时遵循与该策略相关的DGP时,相同的策略将随时间在不同的仪器上部署。战术策略工厂(TAF)方法与战略策略工厂(SAF)方法的主要区别在于,TAF的目标是开发DGP特定的策略,这些策略不需要一直工作。相反,TAF的策略只需要在DGP期间工作,而DGP的策略已经过认证。

DGP标识

MC回测允许研究人员将策略选择问题归结为DGP识别问题。这是有利的,因为找到一个在所有可能的DGP上都能很好地工作的策略比估计什么是当前的DGP更具挑战性(后者又决定了应该在给定时间点运行的策略)。另外,从数学的角度来看,识别与特定DGP相关的最佳策略是一个定义明确的问题

一种实用的方法可以用来识别目前流行的DGP:首先,通过MC回溯测试,为各种DGP开发多种战术投资策略。其次,选取近期市场表现样本。第三,评估从所研究的DGP中提取近期市场表现样本的概率。这种概率可以通过不同的方法来估计,例如Kolmogorov-Smirnov检验、Wasserstein距离或Kullback-Leibler散度。由此产生的概率分布可用于在TAF开发的策略中分配风险。换句话说,部署了一组最优策略,而不仅仅是最有可能的最优策略。

在实践中,仅需最近几次观测就可估计概率分布,以缩小可能的DGPs。原因是,我们正在比较两个样本,其中合成样本由潜在的数百万个数据点组成,并且通常不需要太多观测就可以丢弃与最近观测结果不一致的DGPs。

另一种可能性是创建一篮子证券,其回报分布与给定DGP的分布相匹配。在这种替代实现中,我们不是估计一个证券遵循DGP的概率,而是创建一个综合证券(作为一篮子证券),给定的策略对其是最优的。

运行优化策略集成的一个优点是集成策略不对应于任何特定的DGP。这使得集成策略能够从一个DGP到另一个DGP,甚至可以从一个从未见过的DGP中获益。

结论

在本文中,我认为MC回测为金融研究人员提供了进行随机对照实验的可能性。在没有金融实验室的情况下,这已经接近波普尔式的可证伪标准。

MC回测可以理解为策略在特定环境条件下的性能认证,类似于工程师如何认证一种设备的性能。与WF和RS方法相比,MC回测告诉我们战术投资策略的部署条件。这些信息也有助于投资者确定策略最易受攻击的情况、何时应停用该策略以及应为其分配多少风险。

考虑到市场是适应性的,投资者从错误中吸取教训,真正的全天候策略存在的可能性相当小(全权委托的投资组合经理通常会运用这一论点)。即使存在全天候策略,它们也很可能是跨一个或多个区域工作的策略种群中相当微不足道的子集。因此,资产管理公司应该采用TAF范式,从而通过MC回测开发尽可能多的战术投资策略。

论文原文

/wiki/static/upload/4b/4bad0bb2-0aca-4584-ac56-1a40cac5aa0b.pdf

\

标签

量化投资回测验证实盘验证机器学习
{link}