Option pricing under non-Markovian stochastic volatility models: A deep signature approach
创建于 更新于
摘要
本论文提出了一种基于深度签名变换的新方法,用于在非马尔可夫随机波动率模型下定价欧式期权。通过将资产价格动态重写为粗路径随机微分方程(RSDE),并采用签名表示将非马尔可夫模型变换为经典马尔可夫框架,结合神经网络分别构建线性与非线性签名表示,提供了理论收敛保证和数值示例,验证了方法对传统OU、mGBM及非线性粗波动模型的有效性和高效性[page::0][page::1][page::21]。
速读内容
研究背景与方法梳理 [page::0][page::1][page::2]
- 经典期权定价依赖于Markovian假设,用PDE和Feynman-Kac定理求解,但复杂非马尔可夫波动率模型难以适用。
- 论文通过粗路径理论,将非马尔可夫随机波动率模型中的资产价格过程转化为RSDE。
- 利用时间扩展布朗运动的路径签名,将RSDE用无限维线性或非线性签名表达式表示,转为经典SDE并恢复Markov性质,进而采用经典PDE工具估价。
线性签名表示及截断收敛分析 [page::4][page::5][page::6][page::7]
- 空间$v, I$通过线性签名系数$\ell, p$表示,RSDE重写为系数依赖签名的经典随机微分方程。
- 对无限维签名截断为$N$阶有限维,获得近似PDE及截断误差界限。
- 证明截断误差以阶乘速度收敛,且对应PDE解误差同样收敛至零,保证数值稳定性。
非线性签名表示:深度神经网络方法 [page::8][page::9]
- 对于复杂非线性路径依赖模型,构建神经网络$\mathcal{N}^v$近似波动率签名,定义非线性深度签名表示。
- 误差分为神经网络逼近误差和截断误差,两者共同影响估价精度。
- 相关理论保证非线性近似误差可被控制,结论类似于线性签名表示。
数值实验与模型验证
线性签名模型:OU及mGBM过程 [page::11][page::13][page::14][page::15][page::16]
- 明确给出OU和mGBM波动率模型签名系数的解析表达式,使用Monte Carlo基准验证重建精度。
- 线性签名截断阶数越高,重建精度与期权定价误差均明显收敛,OU模型表现优于mGBM。
- 马尔可夫波动率模型中,SDE仿真和 PDE求解两方案均可用于期权估价,低阶截断时,PDE方案更为准确且更节省计算资源。

| 截断阶数 | OU过程重建误差E(v,v) | OU过程重建误差E(I,I) | mGBM重建误差E(v,v) | mGBM重建误差E(I,I) |
|---------|-----------------------|-----------------------|--------------------|--------------------|
| N=1 | 5.04e-2 (3.65e-2) | 6.31e-2 (5.54e-2) | 1.75e-1 (1.21e-1) | 2.43e-1 (2.02e-1) |
| N=2 | 1.13e-2 (8.29e-3) | 1.49e-2 (1.37e-2) | 4.93e-2 (3.57e-2) | 6.14e-2 (5.35e-2) |
| N=3 | 2.05e-3 (1.52e-3) | 2.92e-3 (2.69e-3) | 3.21e-3 (1.66e-3) | 2.97e-3 (2.63e-3) |
| N=4 | 3.13e-4 (2.33e-4) | 4.78e-4 (4.40e-4) | 2.19e-3 (3.64e-4) | 1.04e-3 (6.41e-4) |
- 期权定价误差随签名截断阶数提升明显下降,SDE路径仿真表现稳定,PDE数值解在低阶截断时优越,尤其对于不同价内价外情况下的表现差异明显。

| 模型 | 截断阶数 | SDE误差ITM | SDE误差ATM | SDE误差OTM | PDE误差ITM | PDE误差ATM | PDE误差OTM |
|------|---------|------------|------------|------------|------------|------------|------------|
| OU | N=1 | 4.62e-1 | 1.06e+0 | 1.02e+0 | 6.89e-1 | 8.48e-1 | 4.36e-1 |
| OU | N=5 | 9.63e-2 | 7.56e-2 | 6.69e-2 | 2.27e-1 | 9.76e-2 | 5.19e-2 |
| mGBM | N=1 | 9.07e-1 | 1.10e+0 | 1.03e+0 | 7.00e-1 | 8.78e-1 | 4.67e-1 |
| mGBM | N=5 | 7.51e-2 | 9.35e-2 | 4.61e-2 | 2.68e-1 | 1.42e-1 | 2.76e-2 |
非线性深度签名模型:rHeston和rBergomi过程 [page::17][page::18][page::19][page::20]
- 构建两类神经网络结构,分别学习非线性签名映射$\mathcal{N}^v$与线性签名系数$\mathcal{N}^\ell$。
- 深度签名表达的非线性方式对复杂路径依赖熵展现更高拟合精度,在所有截断阶数均优于线性方法。
- 提高截断阶数也带来误差显著下降,但对于期权定价误差,非线性和线性方法差距缩小,说明定价对路径重建误差不敏感。
- 三阶截断即足够在实务中实现较高精度。


结论总结 [page::21]
- 本文首次系统提出结合粗路径理论、签名变换及深度学习技术解决非马尔可夫随机波动率的欧式期权定价问题。
- 理论上完成了从非马尔可夫模型到经典PDE框架的转换,给出线性和非线性签名表示的收敛保证。
- 数值上,经典模型和非线性粗波动模型均能稳定收敛,深度非线性签名方法展现出明显优越性和实用价值。
- 为复杂随机波动率环境下的期权定价与风险管理提供了新范式,具备推广至更广泛应用场景的潜力。
深度阅读
金融研究报告详尽解读报告
一、元数据与报告概览
- 报告标题:Option pricing under non-Markovian stochastic volatility models: A deep signature approach
- 作者:Jingtang Ma, Xianglin Wu, Wenyuan Li
- 发布日期:2025年8月22日
- 主题:关于非马尔可夫随机波动率模型下的期权定价问题,提出基于深度signature的方法,解决非马尔可夫过程路径依赖带来的分析和计算难题。
- 核心论点:
- 对于非马尔可夫随机波动率模型,经典的偏微分方程方法无法直接适用,因为期权价格不仅依赖于当前状态,还依赖整个路径历史。
- 通过将资产价格过程建模为粗路径随机微分方程(RSDE),利用signature变换将粗路径转换为时间延拓布朗运动signature的线性或非线性组合,将RSDE转化成经典SDE,重构为马尔可夫过程,进而使传统的期权定价方法(如Feynman-Kac PDE法)可用。
- 提出深度signature方法,采用神经网络逼近signature表示,适用线性和非线性两种情况,并证明算法的一致性和收敛性,数值试验验证方法的有效性和灵活性。
总体上,该报告开创了将signature理论与粗路径理论结合应用于非马尔可夫随机波动率期权定价的路径,形成具有理论严谨性和计算效率的新的期权估值框架。
---
二、逐节深度解读
1. 引言与研究背景(第0至2页)
- 问题描述:
- 期权定价等价于计算期望 \(\mathbb{E}[\Phi(X)]\),其中资产价格过程\(Xt\)服从随机波动率模型。
- 经典随机波动率模型一般是马尔可夫过程,利用Feynman-Kac定理通过偏微分方程(PDE)方法高效求解。
- 非马尔可夫模型(特别是粗波动率模型)因路径依赖特性,传统PDE方法失效,计算极具挑战。
- 技术路线:
- 使用粗路径理论,以Lyons lift将积分过程提升为粗路径,构造对应RSDE。
- 通过signature变换将粗路径用无限次signature序列线性或非线性组合表示,使得原始非马尔可夫模型转换为经典SDE,等价于马尔可夫过程。
- 既有文献中部分方法依赖于弱几何粗路径和Lipschitz近似,存在近似误差未量化;报告提出精确signature无限序列表示,避免近似带来的精度损失。
- 提出基于深度学习的signature逼近:深度线性signature方法(用神经网络拟合时间依赖系数)和深度非线性signature方法(直接输入signature,用神经网络拟合非线性依赖关系),两者均有严格收敛性证明,非线性方法表现更优。
- 核心贡献总结:
1. 将经典PDE方法推广至非马尔可夫波动率模型下的期权定价,利用signature与粗路径理论桥接路径依赖与传统理论。
2. 创新神经网络方法逼近signature表示,包括线性与非线性两种,带来可操作的数值解法。
3. 严密证明signature截断与PDE解的收敛性,给出可靠的误差控制理论。
---
2. RSDE与signature表示(第3至8页)
2.1 RSDE模型化与线性signature表示(第3至6页)
- 模型定义:
- 资产价格过程满足SDE:\[dXt = f(t,Xt)dIt + g(t,Xt)vt dBt\]
- 其中\(It = \int0^t vs dWs\),\(vt\)为波动率,可为非马尔可夫过程,\(W\)与\(B\)独立布朗运动。
- 粗路径提升:
- 利用Itô粗路径提升 \(\mathbf{I}t = (It, \mathbb{I}t)\),将过程转换成RSDE形式,\[
dXt^{\mathbf{I}} = f(t,Xt^{\mathbf{I}}) d\mathbf{I}t + g(t,Xt^{\mathbf{I}}) \mathbf{v}t^{\mathbf{I}} dBt
\]
- RSDE解与原SDE解分布相同,保留原金融模型含义。
- signature表示法:
- 用time-extended Brownian motion signature \(\widehat{\mathbb{W}}t^{\infty}\) 表示路径。
- 假设波动率与积分过程可线性表示为 \[
vt = \langle \ellt, \widehat{\mathbb{W}}t^{\infty} \rangle, \quad It = \int0^t \langle \ells, \widehat{\mathbb{W}}s^{\infty} \rangle dWs
\]
- 其中\(\ellt\)是时间依赖的系数张量,满足绝对收敛条件。
- RSDE重写为经典SDE:
\[
dXt^{\mathbf{I}} = \langle qt^f, \widehat{\mathbb{W}}t^{\infty} \rangle dWt + \langle qt^g, \widehat{\mathbb{W}}t^{\infty} \rangle dBt
\]
- \[
qt^f = f(t,Xt) \ellt + \partialx f(t,Xt) f(t,Xt) \int0^t \langle \ells, \widehat{\mathbb{W}}s^{\infty} \rangle dWs \ellt,
\quad qt^g = g(t,Xt) \ellt
\]
- 时间不依赖系数的线性signature表示(Proposition 2.1):
- 对一些经典模型,存在时间不变系数\(\ell\),且\[
It = \langle \mathbf{p}, \widehat{\mathbb{W}}t^\infty \rangle
\]
- RSDE可写为\[
d\widetilde{X}t = \langle \widetilde{q}t^f, \widehat{\mathbb{W}}t^\infty \rangle dWt + \langle \widetilde{q}t^g, \widehat{\mathbb{W}}t^\infty \rangle dBt
\]
- 其中\[
\widetilde{q}t^f = f(t,\widetilde{X}t) \ell + \partialx f(t,\widetilde{X}t) f(t,\widetilde{X}t) \mathbf{p} \sqcup \ell, \quad \widetilde{q}t^g = g(t,\widetilde{X}t) \ell
\]
- \(\sqcup\)为张量的shuffle乘积。
- 路径条件下的马尔可夫性:
- 给定完整布朗运动\(W\)路径后,动态可视为仅受独立布朗运动\(B\)驱动的马尔可夫过程。
- 利用Feynman-Kac定理,条件期望可用对应PDE解表示。
- 对应PDE:
- PDE为\[
-\partialt u = \frac{1}{2} \left( \langle qt^f \sqcup qt^f + qt^g \sqcup qt^g, \widehat{\mathbb{W}}t^\infty \rangle \right) \partial{xx}^2 u, \quad u(T,x) = \Phi(x)
\]
2.2 Signature截断及收敛性分析(第6至7页)
- 截断实际操作:
- 实际不可能完整使用无限signature,采用截断操作\(\pi{\leq N}(\cdot)\)保留前N层级signature。
- 截断SDE和PDE分别定义(见公式15、16页)
- 误差界定与收敛定理:
- 定理2.1给出了截断误差的阶乘衰减界,误差上界为\[
O\left(\frac{(2C)^{N+1}}{(N+1)!}\right)
\]
- 命题2.2量化了系数\(qt^f, qt^g\)的截断误差,涉及函数\(f,g\)和其导数的有界性。
- 定理2.2证明了PDE解的截断误差会随截断阶数\(N \to \infty\)趋零,具体误差上界依赖时间\(T\)及截断阶,
\[
|u(0,x) - u^N(0,x)| \le (\sqrt{T^2+T} + \sqrt{T}) \cdot O\left(\frac{C^{N+1}}{(N+1)!}\right)
\]
2.3 非线性signature表示(第8至9页)
- 非线性模型的突破:
- 对于复杂非线性路径依赖的波动率,不能保证存在线性signature表示。
- 利用神经网络\(\mathcal{N}t^v(\widehat{\mathbb{W}}t^{\le N}; \phiv)\)逼近波动率路径的非线性signature表达。
- 非线性RSDE:
\[
d\widehat{X}t^{\mathbf{I},N} = \widehat{q}t^{f,N} dWt + \widehat{q}t^{g,N} d Bt
\]
\[
\widehat{q}t^{f,N} = \left( f(t,\widehat{X}t^{\mathbf{I},N}) + \partialx f(t,\widehat{X}t^{\mathbf{I},N}) f(t,\widehat{X}t^{\mathbf{I},N}) \int0^t \mathcal{N}s^{v,N} dWs \right) \mathcal{N}t^{v,N}
\]
\[
\widehat{q}t^{g,N} = g(t,\widehat{X}t^{\mathbf{I},N}) \mathcal{N}t^{v,N}
\]
- 误差定义与估计(定理2.3):
- 定义神经网络逼近误差\(\mathcal{E}t^{\mathcal{N},v} = \inf{\phiv} \mathbb{E}[|vt - \mathcal{N}t^v(\widehat{\mathbb{W}}t^N; \phiv)|]\)。
- 该误差包含神经网络参数不足产生的误差和signature截断误差两部分。
- 误差传递到PDE解(定理2.4):
\[
|u(0,x) - \widehat{u}^N(0,x)| \le (\sqrt{T^2 + T} + \sqrt{T}) \cdot O\left(\sup{t\in[0,T]} \mathcal{E}t^{\mathcal{N},v}\right)
\]
---
3. 数值例证(第9至20页)
3.1 线性signature数值方法(第9至14页)
- 研究波动率模型:
- 表1列举四个模型:OU过程、均值回复GBM(mGBM)、粗Heston(rHeston)和粗Bergomi(rBergomi)。
- 这里主要实现对OU和mGBM的线性signature解析公式,rHeston和rBergomi的线性及非线性signature用神经网络逼近。
- 时空离散与数值计算框架:
- 采用均匀时间网格和空间网格,时间间隔 \(\Delta t = T/J\),空间间隔 \(\Delta x = (xL - x0)/L\)。
- SDE离散按公式22,PDE用稳定的Crank-Nicolson方案,空间二阶中心差分。
- 示例3.1 — OU与mGBM的线性signature表示准确度:
- 解析构造signature系数\(\ell\)和积分系数\(\mathbf{p}\)(第11-12页详细张量展开,充分说明signature系数结构复杂且富含模型参数)。
- 通过蒙特卡洛仿真生成真实路径,比对signature表示的路径恢复误差,使用平均绝对误差(MAE)指标评估,图1和表2呈现了不同截断阶下路径恢复误差。
- 结果解读:
- 随截断阶数增加,路径拟合误差大幅降低。
- OU过程拟合效果优于mGBM,说明signature拟合敏感于波动率模型的复杂程度。
- 期权价格估计精度:
- 利用离散SDE和PDE分别计算对应期权价格,均以蒙特卡洛未截断真实路径价格作为基准,计算定价误差。
- 图2及表3展示不同截断阶次下,价差随截断提升快速收敛,显示出基于signature的线性表示具备很高的数值合理性和效益。
- PDE方法在低阶截断时较SDE更准确,适合实际计算降低成本。
3.2 深度学习方法对非线性signature的数值实验(第16至20页)
- 神经网络架构:
- 网络包含:128通道卷积层(核5)、两层128隐藏单元LSTM、三层大小为32、ReLU激活的全连接层。
- 两类神经网络:\(\mathcal{N}^v\)非线性signature拟合波动率\(v\);\(\mathcal{N}^\ell\)预测线性signature系数\(\ell\)。
- 示例3.2 — rHeston与rBergomi波动率过程拟合:
- 使用神经网络拟合上述粗波动率路径的signature表示,比较非线性和线性两种方法的拟合误差和最终期权定价误差。
- 图3表明非线性方法误差显著优于线性,不论截断阶数如何,且截断阶数提升均带来准确率提升。
- 然而,尽管路径拟合误差存有差距,在最终定价误差(图4)中,两种方法表现相近,且截断到较低阶数即可满足实际需要。
图表深度解读
- 图1(第14页):
- 展示了OU与mGBM模型中,截断阶数\(N=1\)至5的路径拟合MAE分布。
- 误差呈阶乘级下降趋势,中位数与四分位差明显减小。
- OU模型误差整体小于mGBM,说明波动率更平滑或线性模型易拟合。
- 表2(第15页):
- 汇总路径拟合的整体MAE及标准差,数值直观显示截断阶升高误差减小。
- 图2(第16页):
- 分别显示SDE和PDE方法下,不同截断阶数及期权虚实程度对定价误差影响。
- PDE偏向低阶截断表现更佳,SDE更稳定但计算复杂。
- 图3(第19页):
- 非线性与线性signature对rHeston和rBergomi路径的拟合误差对比,非线性大幅优于线性。
- 图4(第20页):
- 非线性和线性signature方法对期权定价误差的评估,三种期权虚实程度,误差均随截断阶数下降。
- 两方法结果趋近,显示定价相对鲁棒。
---
4. 结论与贡献总结(第21至22页)
- 总结:
- 提出深度signature方法成功解决非马尔可夫随机波动率模型下的欧式期权定价难题,桥接非马尔可夫路径依赖与经典期权理论。
- 线性signature表示在马尔可夫且模型简洁时有明确解析式,非线性signature通过深度学习灵活逼近复杂模型。
- 数值验证深度signature方法快速收敛,非线性模型精度优异,结合精细理论误差界定确保数值可靠。
- 框架兼容更复杂市场环境,具备深远拓展潜力。
---
三、关键术语与概念解析
- 非马尔可夫随机波动率模型:波动率过程依赖于过去整个路径信息,而非仅当前状态,导致无法用维数有限的马尔可夫过程描述。
- 粗路径理论(Rough Path Theory):研究路径依赖随机系统的数学框架,通过提升平稳过程为几何rough路径,允许定义积分和微分结构。
- signature变换:一种对路径信息做无损特征提取的卷积变换,将路径转换为无限维张量序列capturing路径所有分段积分信息,具备线性化路径空间的能力。
- RSDE(Rough Stochastic Differential Equation):带粗路径驱动的随机微分方程,拓展传统SDE,使其涵盖非马尔可夫及弱正则路径。
- shuffle乘积:signature空间的张量代数运算,反映组合路径的积分结构,是拟合和展开signature的数学利器。
- Feynman-Kac定理:将偏微分方程的解与对应随机过程的条件期望建立联系,是连接PDE和蒙特卡洛的桥梁。
- signature截断与收敛:实际计算中只用有限项signature,系统误差随截断级别阶乘衰减,保证最终误差可控。
- 神经网络逼近signature:利用深度网络强大的表示能力拟合复杂非线性函数关系,实现非线性signature表示的数值可行性。
---
四、估值方法分析与风险评估
- 本文重构非马尔可夫模型为经典SDE,可借助传统的PDE估值工具,避免纯蒙特卡洛带来的高计算负担。
- 通过signature表示将无限维路径数据映射为张量空间,在截断后仍能通过带参数的PDE形式实现标准数值求解(Crank-Nicolson等)。
- 误差分析覆盖signature截断误差、神经网络拟合误差和整体估值误差,三者融合保证量化估值精度可控。
- 风险因素主要来自截断层级不够导致的路径信息缺失,神经网络近似的训练不足,以及模型参数估计误差等。
- 报告未给出具体风险缓解方案,但理论上增加截断层级和优化网络训练能有效控制风险,且数值实验验证了方法稳定性。
---
五、批判性视角
- 本文在理论上推动粗波动率模型期权定价方法,突破传统PDE限制,但对于非常复杂的非线性signature表示,神经网络的训练效果和泛化能力尚需实践检验。
- signature截断阶数虽有阶乘衰减误差界,但实际计算时截断阶数受制于计算资源,截断误差依然是重要考虑。
- 报告假设波动率过程为\((\mathcal{F}
- 神经网络架构选择和超参数调优细节给出较少,模型泛化和稳定性依赖于这些实现细节。
- 本文以一维布朗运动为主,未来多维模型扩展与高维signature的计算复杂度仍需解决。
---
六、结论性综合
本文系统提出并理论证明了基于signature变换的深度学习方法,成功将非马尔可夫随机波动率过程驱动的期权定价问题转化为经典马尔可夫框架下的SDE与PDE求解问题。
关键创新包括:
- 公式化:将波动率积分过程加工为Itô粗路径,精准定义RSDE以捕获路径依赖。
- signature表示:用无限signature序列线性或非线性组合表示非马尔可夫特性,使问题可用经典数理金融工具处理。
- 截断理论:细化signature截断误差界,证明截断PDE解误差趋零,保证实用性。
- 深度学习逼近:提出线性和非线性两种神经网络方法,扩展signature表示空间,使复杂非线性路径相关特性可学可用。
- 数值实验:包括经典马尔可夫模型(OU与mGBM)和粗波动率模型(rHeston与rBergomi)的路径重构和期权定价,涵盖路径拟合误差和定价误差,实验验证方法收敛性、准确性和计算效率。
图1、图3展示路径拟合误差显著下降趋势,尤其深度非线性signature优势明显。图2、图4则表明,理论计算误差控制得当的情况下,SDE蒙特卡洛与PDE网格方法均能高效准确地估值欧式期权。
综上,作者给出的深度signature理论框架与算法极大拓宽了非马尔可夫随机波动率模型的期权定价工具箱,为后续更复杂金融衍生品及高维路径依赖问题提供了有力数学与计算支撑。
---
参考溯源
- 主要理论阐述和模型定义见第0-7页[page::0,1,2,3,4,5,6,7]
- 非线性signature及深度学习逼近及其误差估计见第8-9页[page::8,9]
- 数值计算细节与算法实现见第9-17页[page::9,10,11,12,13,14,15,16,17]
- 实验结果分析和图表见第14,16,19,20页[page::14,16,19,20]
- 结论与研究贡献总结见第21页[page::21]
- 重要证明附录见第23-27页[page::23,24,25,26,27]
---
此报告详尽分析了非马尔可夫随机波动率模型下期权定价的数学建模、数值方法、理论收敛性保障及深度学习创新应用,兼具理论深度与实践指导价值。