`

Pricing American options under rough volatility using deep-signatures and signature-kernels

创建于 更新于

摘要

本文将深度神经网络与签名核方法结合,扩展了基于路径签名的美式期权(最优停止问题)定价框架,专门针对非马可夫粗波动率模型下的定价难题。通过在粗Bergomi与粗Heston模型上的数值实证,展示三种签名方法(线性签名、深度签名与签名核)在获得期权价格上下界方面的有效性和性能差异,表明深度签名法在减少上下界间隙上具有显著优势,兼具较低计算时间,且签名核方法在样本量受限时表现稳定,丰富了粗波动率环境下定价方法的理论与数值工具箱 [page::0][page::2][page::14][page::15].

速读内容


文章研究目标与背景 [page::0][page::1][page::2]

  • 针对非马尔科夫粗波动率模型(粗Bergomi、粗Heston)下美式期权的定价问题,提出基于路径签名、深度神经网络和核学习的最优停止问题求解方法。

- 由于路径签名具备捕捉非平稳路径的强表达能力,适用于粗波动率这类非Markov过程的高维优化问题。
  • 本文继承和扩展了先前利用线性签名函数逼近的工作,加入了深度学习与签名核方法,提升定价估计精度并缩小上下界间隙。


签名方法框架与数学基础 [page::6][page::7][page::8][page::9]

  • 介绍路径签名及其张量代数性质,路径签名可实现函数的稠密逼近,具备算法可行性和理论收敛保证。

- 线性签名学习依赖截断签名,逼近精度受限于截断级别,且计算复杂度随截断指数增长。
  • 深度签名学习将深度神经网络网络叠加于签名特征之上,增强表达力,配合Leaky ReLU和ReLU激活优化截断签名上的回归问题。

- 签名核方法通过核技巧无截断地使用完整签名信息,但面临核矩阵计算和Goursat PDE数值解的较高计算成本。

量化实现与数值实验设计 [page::12][page::13][page::14]

  • 深入介绍粗Bergomi和粗Heston波动率模型结构,定义美式期权离散最优停止问题与截断方案。

- 说明三种方法的具体实现细节,包括签名截断级别、网络结构、优化器(ADAM)、超参数设置及采样方案。
  • 核方法使用Nyström近似降低核矩阵维度,加速核岭回归求解。


数值结果分析 [page::14][page::15][page::16]

  • 三种方法均有效计算期权价格上下界,深度签名法在上界表现明显更优,训练和线下计算时间较少。

- 线性与签名核方法获得更优的点估计与下界表现,但签名核计算成本最高。
  • 深度签名方法相对于训练数据规模表现不稳定,而签名核方法在样本数量较小时更为稳健。

- 不同相关系数$\rho$和Hurst指数$H$下价格区间和对偶间隙分析,近似误差主要源于时间离散和非马可夫性。

量化因子重要性分析 [page::18][page::19]

  • 基于深度签名模型的特征重要性评估显示,标的价格状态$X_t$及多级签名积分特征对定价贡献最大,且度量了特征扰动后模型性能下降程度。

- 该分析有助于理解非马可夫路径信息中哪些组成部分对价格决定影响最大。

理论贡献与收敛性证明简述 [page::20][page::21]

  • 证明了基于深度签名的最优停止时间策略及对偶Martingale近似在截断层数与网络复杂度趋于无穷时收敛至真实价值。

- 讨论了利用log签名替代签名仍保持该理论性质的拓展手段。
  • 利用路径签名的全局逼近性质合理化深度神经网络函数空间的泛函逼近能力。


深度阅读

详细分析报告:Pricing American options under rough volatility using deep-signatures and signature-kernels



---

1. 元数据与概览


  • 标题:"Pricing American options under rough volatility using deep-signatures and signature-kernels"

- 作者:Christian Bayer, Luca Pelizzari, Jia-Jie Zhu
  • 发布日期:2025年6月12日

- 发布机构:未明确指定,但作者团队背景与金融数学、数学优化紧密相关。
  • 主题:针对非马尔可夫性且粗糙波动性 (rough volatility) 模型的美式期权定价,提出并分析基于路径签名 (signatures) 的深度学习和核方法。


核心论点与目标



报告核心在于将近年来基于路径签名的最优停止问题(American/Bermudan期权定价)的数值方法,进一步扩展到深度神经网络 (Deep-signatures) 和基于签名核的核回归 (signature-kernel learning) 技巧,以更好地应对粗糙波动率模型(如rough Bergomi和rough Heston),这类模型非马尔可夫且具有长记忆特性。报告展示了三种方法(线性签名、深度签名、签名核)在这类模型中美式期权定价的性能对比,并得出:
  • 这些方法均能提升定价下界和上界的精度,显著缩小定价区间(dual gap)。

- 深度签名方法在估计上界和整体精度方面表现尤为突出。
  • 核方法在小样本时表现出更好的稳定性,适合数据较少时使用。

- 通过数值实验和理论证明,这些方法均可达到渐近一致性。

关键词突出签名方法,非马尔可夫最优停售,粗波动,深度学习,核学习等现代交叉领域的研究热点。[page::0,1,2]

---

2. 逐节深度解读



2.1 引言


  • 关键论点:传统的最优控制理论及动态规划方法虽可应对非马尔可夫系统,但理论复杂且不易计算。路径签名作为一种强泛化的路径特征提取工具,使得非马尔可夫最优停止问题具备了可近似和可计算的空间。

- 推理依据
- 马尔可夫模型中,控制策略可作为当前状态的函数表示,易于数值计算。
- 非马尔可夫系统中,策略需基于路径历史,函数定义域变为路径空间,增加维数和计算复杂度。
- 签名理论具备路径函数的唯一性与泛函近似能力,使路径函数的逼近成为线性或非线性(借助深度网络或核方法)形式成为可能。
  • 现有文献连接:Kalsi、Lyons等提出用签名函数线性化执行策略,此报告扩展非线性签名方法,解决更复杂的粗波动模型。

- 方法拓展:引入深度神经网络和签名核方法,以提高表达能力和部分解决维度诅咒。
  • 应用驱动:美式期权定价的问题天然是最优停止问题,粗波动模型更真实但无马尔可夫性,方法契合此问题。[page::1,2]


2.2 Monte-Carlo方法与传统算法回顾


  • 背景:描述最优停止问题及抽样设计,强调基于长期回归模型的Longstaff-Schwartz算法,和Rogers提出的对偶(martingale)方法提供上下界。

- Longstaff-Schwartz算法总结
- 离散时间设定条件下,利用截断的停时计算期权价值下界。
- 关键步骤是估计条件期望,传统基于有限维状态空间基函数,文中突出路径空间基函数的采纳(路径签名为重要基)。
  • 对偶方法总结

- 优化寻找某martingale校正项以获得价值上界。
- martingale表示为积分对控制过程的映射,路径签名作为路径的多样本基函数呈现并优化。
  • 共同点:两者都依赖于对路径函数的逼近,路径签名为提升非马尔可夫场景带来契机。

- 重要数学特征
- 通过拟合基函数组合解决路径依赖的条件期望或martingale。
- 典型优化采用最小二乘(线性)或最大值最小化(对偶)的目标函数。
- 归纳出通过大量样本对路径函数进行训练。

这一节设计了接下来的签名方法提供基础框架,强调更复杂非线性函数逼近需求。[page::3,4,5]

2.3 签名相关方法详解



2.3.1 线性签名学习


  • 特性

- 路径签名的迭代积分扩展具备代数结构,线性函数空间具备封闭性。
- 线性函数空间能密集逼近连续路径函数,理论保证了逼近能力和全局收敛。
  • 局限

- 截断签名的维度指数级增长,严重牵制计算及存储。
- 线性函数在处理高度非线性问题时表现有限。
  • 结果

- 逐渐的基于样本的训练,能在截断层数和样本量趋向无穷时以几乎处处收敛逼近真实期权价值。[page::6,7]

2.3.2 深度签名学习


  • 核心创新:在基础签名上加深度神经网络,使非线性映射能力大大增强,极大提升拟合效果。

- 结构设计
- 网络架构:从签名向量开始,多层非线性激活函数映射到输出。
- 激活函数非多项式确保通用逼近性质;网络深度宽度均灵活调整。
  • 理论保证

- 证明在深度和宽度极限情况下,深度签名学习能完备逼近最优停止规则和对偶martingale。
  • 数值实现

- 利用ADAM优化器,Leaky ReLU等现代深度学习工具,分步骤训练层叠模型。
  • 实际优势:深度方法能更好捕获粗波动模型的复杂路径依赖非线性特征,缩小上下界差距。[page::8,9,10,20,21]


2.3.3 签名核学习


  • 基本观点

- 将签名视为嵌入Hilbert空间的特征向量,构造与之对应的正定核(signature kernel)。
- 通过核回归和核岭回归方法进行路径函数估计,无需截断签名,不丢失信息。
  • 数值挑战

- 核的点积通过求解复杂的Goursat PDE实现,计算代价高。
- 样本矩阵规模带来的计算复杂度大,用Nystrom近似进行降维。
  • 优缺点

- 优点:理论上不损失信息,较为稳定。
- 缺点:计算开销较大,尤其求解核矩阵和逆矩阵。
  • 应用:适合数据样本较少及稳定性要求高的场景。

- 方法总结:通过高效核近似技术对符号核实现可控计算,保证最优停止问题的回归结果。 [page::10,11,12]

---

2.4 粗波动性模型中的美式期权定价


  • 粗波动模型介绍

- rough Bergomi模型:采用fractional Brownian motion驱动的log-volatility过程,具有Hurst指数$H<0.5$ ,路径极为粗糙。
- rough Heston模型:基于Volterra型CIR过程,具有同样粗糙的波动率过程。
  • 定价问题表述

- 离散时点的最优停止问题,目标为找到关闭于交易时刻的停时以最大化贴现期权收益。
- 重点价格美式看跌期权,具体为$\phi(x)=(K-x)^{+}$ 。
  • 计算实现

- 细节涉及路径模拟(调用外部库),签名/核的计算(iisignature,sigkernel包等),以及模型参数设定。
- 不同方法在状态空间和路径空间的表示选择有所差异,基于局部Markov性调整提升效率。
  • 计算设置

- 使用了长时间跨度(1年),多次行权(12次),年化利率和相关参数综合考虑实际市场环境。
  • 方法实现细节:重点强调采样数目,大批量训练及复用权重缩减训练持续时间等细节。

- 结果预期
- 获得有效且精确的期权价格区间,兼顾效率与精度。
- 不同方法在不同指标上体现出优势互补。
[page::12,13,14]

---

3. 图表深度解读



3.1 表格1-3:美式看跌期权价格对比(rough Bergomi,rough Heston)


  • 内容描述

- 表格分别展现不同Hurst指数的rough Bergomi模型和rough Heston模型中,多个行权价下的欧式期权价格(E),已有文献结果(如[GMZ20]),以及三种签名方法(线性签名[LS签名], 深度签名[DNN], 签名核[Kernel])的价格点估计和可信区间 (Confidence Interval)。
- 末列给出三者最优之间的价格区间相对宽度(即dual gap)。
  • 趋势与解读

- 深度签名法一般提供更紧的上界,整体dual gap最低(约1%甚至更低),表现最佳。
- 线性和核方法在点估计和下界方面稍有优势,表明它们以较少计算代价提供了良好下界估计。
- dual gap明显低于传统方法与以往文献,实现了更精确价格。
- 不同模型及参数下,方法表现随Hurst指数(roughness)以及行权价格变化,可观察深度签名方法对高非线性特征的表达优势。

3.2 表格4:计算时间比较


  • 内容描述:三种方法在主流硬件上的训练耗时(分钟级别),离线计算(签名或签名核)耗时汇总。
  • 解读

- 核方法签名核计算代价最高,离线耗时耗费远超其他方法(达数千秒)。
- 线性签名方法训练简单,离线也需要较长时间计算签名。
- 深度签名方法离线计算较快,训练时间适中尤其在上界问题中性能优秀,综合效率较高。

3.3 图1:λ(核方法正则化参数)对定价估计的影响


  • 描述:显示正则化参数区间内,点估计与实际下限估计的随λ变化趋势(log尺度),区间内自适应选择。
  • 解读

- 定位合适的λ以平衡过拟合和欠拟合,保证点估计不过度偏离稳定下界。
- 说明调优正则化对于核方法至关重要。

3.4 图2:训练样本规模M对定价稳定性的影响(rough Bergomi, H=0.07)


  • 描述:比较了深度签名和核方法在不同样本数量下下界和上界的估计及其蒙特卡罗误差(颜色阴影区)。
  • 解读

- 核方法在小样本时表现更稳定,方差更小,更适合小样本环境。
- 深度签名在双界上均明显优于核方法,且随样本增多性能提升明显,但在小样本时波动较大。

3.5 图3:不同相关系数ρ对期权定价的影响


  • 描述:粗波动模型中美式期权价格及定价区间与ρ变化的关系,分两组H=0.07和H=0.8。
  • 解读

- 相关为0时区间最宽,相关绝对值大时定价区间较窄,说明模型相关性越强,定价难度越小。
- 三种方法点估计趋同于区间中心,验证方法合理性。

3.6 图4:dual gap与时间离散步数(1/Δt)和Hurst指数的关系(rough Bergomi)


  • 描述:不同Hurst指数(Roughness)条件下,dual gap随时间离散密度变化的趋势(log-log图)。
  • 解读

- H越接近0.5(Markovian临界),收敛速度越快,dual gap下降越迅速。
- H极小(极粗路径)时收敛较慢,dual gap较大,体现粗路径模型计算复杂度更高。
- 符合rough路径理论预期。

3.7 图5:signatures中不同组合的特征重要性(rough Bergomi)


  • 描述:通过打乱单一签名组合样本并测量模型误差变化,评估不同签名成分对定价影响大小。
  • 解读

- 标准路径特征如$Xt$ 和方差特征$vt$(以及二阶迭代积分)贡献最大,证明模型在一定程度捕获经典状态变量。
- 高阶积分项如对积分$\int vudXu$等也是重要记忆信息承载者。
- 为解释模型提供了路径特征重要性排序。

---

4. 估值分析


  • 估值目标:对美式期权价格求解最优停止界限,计算其价格上下界。

- 方法论
- 基于模拟的最优停止,利用路径签名构造状态空间特征。
- 分别通过 Longstaff-Schwartz 基础方法(线性)深化为深度神经网络和核岭回归两类非线性特征逼近。
  • 关键参数

- 截断签名层次K、样本数量M、时间剖分数N和正则化参数λ。
- 神经网络层数、隐藏层宽度、激活函数选取及优化周期的调整。
  • 估值方法互补性

- 线性方法便捷有效,算法稳定。
- 深度网络能够拟合非线性更丰富的函数,尤其适合对偶问题的上界估计。
- 核方法理论优越,适合小样本场景,缺点是计算代价大。
  • 估值结果

- 三种方法联合使用下,上下界区间显著缩小,估值更为可信。
- 深度签名法单独表现最佳的dual gap和计算时间平衡。

---

5. 风险因素评估


  • 模型风险:粗波动模型下非马尔可夫特性导致估计高度依赖路径特征的有效提取与表达,一旦签名截断层数或训练样本不足,信息丢失风险存在。

- 计算风险:核方法在大样本、高维路径上计算瓶颈明显,需要特殊核近似方法缓解。
  • 优化风险:深度神经网络训练过程非凸,易陷入局部最优或过拟合,早期停止和正则化策略局部调整必要。

- 数值误差:时间离散层次影响定价精度,粗路径性导致误差收敛慢,需足够离散精度降低偏差。
  • 潜在缓解:采用截断层数调整、权重正则和多次独立训练平均降低误差;Nystrom核近似减少核计算瓶颈。

- 数据风险:真实市场数据量有限时,核方法更稳定,深度方法受限需有效防控训练波动。

---

6. 批判性视角与细微差别


  • 假设条件谨慎性:虽然理论归纳了深度签名与核方法几乎完备的泛函逼近性质,实际计算及样本复杂度使得所需截断层数和网络参数规模具有挑战。

- 计算复杂度:核方法尽管信息无损,但实际成本和PDE求解能力限制适用范围,特别是高维路径和细粒度时间离散。
  • 结果稳定性:深度网络训练结果稳定性具有不确定性,小样本表现欠佳,实际应用对超参数和初始化敏感。

- 估值区间宽度:尽管大幅收窄,但在极粗路径(极小Hurst)条件下dual gap依然不容忽视,方法优化空间仍存在。
  • 模型选择的灵活性:报告未对具体参数选择做过多稳健性分析,如不同市场环境下的推广存在不确定性。


---

7. 结论性综合



本报告围绕美式/倍尔曼期权定价的最优停止问题,针对粗波动模型的非马尔可夫、高维路径依赖性挑战,系统介绍并拓展了以路径签名为核心的先进数值方法:线性签名学习、深度签名学习及签名核方法。
  • 学术贡献:提出了将深度神经网络和核方法引入签名基数化的最优停止策略,实现了对极具挑战性的粗波动模型下最优停止问题的有效求解。理论上证明了三种方法在充分的网络规模与样本数量条件下,都能达到渐进渐近一致性。

- 数值表现:深度签名方法在多组参数和模型(特别是rough Bergomi和rough Heston)下,显著缩小了dual gap(上下界区间),取得了最小竞价区间和平衡计算时间的优势。线性和核方法则分别在训练稳定性和数值机械性能有其优点,三种方法优缺点互补。
  • 具体图表解析表现

- 表格1-3验证了理论上的收敛性,展示了具体价格估计和置信区间。
- 表4计算时间数据清晰显示方法时间效率差异和计算成本。
- 图1调优正则化参数,保证了模型的平稳和泛化能力。
- 图2-5通过样本规模、模型参数、特征重要性分析了方法的运行机制和敏感度。
  • 整体评价:报告提供了路径签名与现代机器学习技术结合的新视角,推动了粗波动模型美式期权数值定价前沿。同时也指出了现阶段面临的算法稳定性和计算复杂度挑战,为后续研究奠定了基础。

- 实用建议:视样本大小和计算资源决定方法选择,采用深度签名方法为优推荐,但在小数据量或资源受限时,核方法可作为备选。线性签名方法仍具备快速基线参考价值。

综上,该报告是路径签名在金融衍生品定价,尤其是粗波动模型最优停止问题应用领域的一次系统且深入的理论与实证贡献。它不仅丰富了金融数学中的非马尔可夫最优控制数值工具箱,也有望为实际市场环境下的波动率衍生品定价和风险管理提供有效计算手段。[page::0-21]

---

重要图表示例





图1:不同正则化参数λ下,rough Heston(左)与rough Bergomi(右)的期权价格估计随λ变化趋势及选择



图2:样本规模M变化时不同方法的点估计及上下界稳定性,左为primal,右为dual



图3:相关系数ρ变化对期权价格区间影响,在两种不同Hurst参数下的表现



图4:dual gap随时间离散步数增长的对数线性关系及不同Hurst指数的收敛特性



图5:粗波动模型中不同签名特征成分对定价的重要性评估,左primal,右dual

---

以上为报告的详尽剖析,涵盖理论基础、算法细节、模型选择、数值比较及图表解读,系统回顾了三种签名方法在粗波动模型美式期权定价中的最新进展及性能评估。

报告