`

Deep learning for quadratic hedging in incomplete jump market

创建于 更新于

摘要

本报告提出了一种基于深度学习的方法,解决不完全跳跃扩散市场中的最小方差定价与对冲问题。基于随机微积分与Stackelberg博弈框架,明确推导了最优对冲投资组合、期权价格及等效鞅测度。通过结合前馈和LSTM神经网络的算法,在三种市场模型(包括不完全市场的Merton模型和Kou模型)中进行了测试。结果显示该算法性能良好,且基于最小方差原则的对冲策略相较Merton原则能更有效地降低损失,同时期权价格通常偏高。算法还展示了对多维输入和时间维度的良好扩展性,为实际金融市场中跳跃风险管理提供了切实可行的数值工具 [page::0][page::4][page::20][page::29][page::32].

速读内容

  • 研究背景与目标 [page::1][page::2]

- 以Merton模型为代表的跳跃扩散模型广泛应用于期权定价和对冲,然而实务中多数市场不完全,存在跳跃风险的不可完全对冲问题。
- 报告基于最小方差对冲理论与Stackelberg博弈框架,推导最优初始投入及投资组合,实现期权的最小均方对冲误差[page::0][page::3][page::4].
  • 理论框架与主要结果 [page::3-13]

- 在跳跃扩散模型中,资产价格遵循包括布朗运动和复合泊松跳跃的随机微分方程。
- 通过伊藤-勒维公式及鞅表述定理,建立期权价格的伊藤表示,确定对冲组合反馈形式,公式如下:
$$
\widehat{\pi}(t) = \frac{F(t)\alpha(t) + \sigma(t)\beta(t) + \int \gamma(t,\zeta)\kappa(t,\zeta) \nu(d\zeta) - X(t)\alpha(t)}{X(t)(\sigma^2(t) + \int \gamma^2(t,\zeta)\nu(d\zeta))}
$$
- 最优初始投入$\widehat{z}$为某种等效鞅测度$Q^$下的期望值,且$Q^$为最小方差等效鞅测度,具有明确表达式和正测度性质。
- 该最优解符合随机微积分和博弈论框架,且与Schweizer最优度量一致[page::7][page::10][page::12][page::13].
  • 典型模型实例 [page::14-21]

- 对欧式看涨期权,使用广义Clark-Ocone公式求解伊藤表示系数$\beta$和$\kappa$。
- Black-Scholes完全市场下,等效测度退化为已知的风险中性测度,最优对冲具有解析表达式,损失为零。
- Merton跳跃扩散模型中,基于不同的定价原则(最小方差与Merton自身原则),计算出的期权价格显著不同,最小方差原则价格更高但对冲风险较小。对比曲线显示$Z^*$(最小方差测度)的跳跃特征强于$Z^{M}$(Merton测度),体现更保守的风险管理。
- Kou双指数跳跃模型因跳跃分布的复杂性,最优测度难以明确表达,但深度学习算法仍能有效计算对冲组合及期权价格。
- 分析了不同参数(跳跃强度$\lambda$, 跳跃均值$\mu$, 波动率$\sigma$, 跳跃方差$\delta$)对期权价格的影响,揭示跳跃参数对价格的敏感度高于连续成分[page::14][page::20][page::21].
  • 深度学习算法设计与实现 [page::22-25]

- 设计了结合前馈网络和两层堆叠LSTM网络的深度学习架构,输入时间序列数据(布朗运动增量与跳跃过程增量)估计初始资产价值$x0$和时间动态对冲比率$\pit$。
- 训练过程基于离散时间财富动态的均方损失优化,利用Adam优化器进行反向传播参数更新。
- LSTM能够捕捉时间依赖和跳跃动态,适应非Markovian模型特征,且在多维跳跃风险下表现优于简单前馈网络。
- 算法执行流程符合Stackelberg游戏顺序思想,先估计投资组合,再调整初始投入[page::23][page::24].
  • 数值实验与性能分析

- 在Black-Scholes完全市场中,算法初始价值收敛到理论期权价格0.5,投资组合估计与理论解高度吻合,损失降至近零水平。


- 多维布朗运动下的不完全市场,算法仍能可靠逼近价格和对冲组合,表现出对输入维度扩展的良好适应性。


- Merton跳跃扩散模型中,参数设置为$\alpha0=0.2$, $\sigma0=0.2$, 跳跃强度$\lambda=5$,跳跃均值$\mu=-0.2$,标准差$\delta=0.05$。算法训练收敛较慢,损失和价格初值依然稳定收敛。终端财富与期权损失分布展现出比Merton传统策略更对称、无大额亏损的优点,反映了更安全的风险管理。



- 针对三维复合泊松过程与混合分布跳跃,算法表现高度一致,体现良好多维跳跃输入扩展能力。

- Kou双指数跳跃模型下,尽管理论明确定价要求存在挑战,深度学习方法依然取得收敛和可用结果。


- 时间维度扩展实验显示,算法对交易时长T增加敏感,表现有所下降;对时间步数R增加则有一定提升,建议充分细化时间离散以获得较佳性能。

- BS与Merton模型在不同时间和步数条件下的损失与价格误差对比总结如下:

| 模型 | 时间步数 (R) | 到期时间 (T) | 损失 (Loss) | 价格绝对误差 |
|-------|--------------|--------------|----------------|--------------|
| BS | 40 | 1.0 | 2.917e-5 | 0.0103 |
| BS | 80 | 1.0 | 1.716e-5 | 0.0094 |
| Merton| 40 | 1.0 | 8.527e-5 | 0.0085 |
| Merton| 80 | 1.0 | 4.914e-5 | 0.0072 |

- 算法有望通过更高算力支持下细分步长、更多训练轮次进一步提升[page::26][page::29][page::32][page::33][page::34].
  • 量化对冲策略总结 [page::2][page::7][page::23]

- 利用LSTM深度学习结合Stackelberg博弈视角,首次在跳跃不完全市场中同步估计最优初始投资和动态对冲组合。
- 对冲策略反馈形式明晰,依赖于资产价格及其伊藤表示中的导数项$\beta(t)$、$\kappa(t,\zeta)$,本质为动态调整仓位以最小化方差风险。
- 算法支持高维布朗与复合泊松跳跃的输入,体现出优异的维度和时间尺度扩展能力,为复杂金融工程量化对冲提供有效实用工具。
- 量化策略性能优于Merton经典方法,尤其在风险管控对称性和大额损失降低方面有显著改进。

深度阅读

金融研究报告详尽分析报告



---

1. 元数据与概览


  • 标题: Deep learning for quadratic hedging in incomplete jump market

- 作者: Nacira Agram, Bernt Øksendal, Jan Rems
  • 发布时间: 2024年7月19日

- 主题领域: 金融数学,期权定价与套期保值,深度学习方法,跳跃扩散模型,不完全市场
  • 核心论点与结论:

本报告提出一种基于深度学习的算法,专门解决包含跳跃扩散的不完全市场中最低方差(quadratic hedging)期权定价和套期保值问题。方法基于严格的随机微积分推导,结合Stackelberg博弈框架,明确推导出最优套期保值组合、期权价格及对应的等价鞅测度(EMM)。算法采用前馈与LSTM神经网络的组合,被分别应用于三个市场模型中,其中两个为不完全市场,基准为经典的Black-Scholes(BS)模型。研究结果表明,最小方差原理导出的期权价格通常高于Merton原则的价格,但损失较低,显示更稳健的套期保值策略。本文还详细比较了该方法与Merton模型在经典市场中的异同。

---

2. 逐节深度解读



2.1 引言(Introduction)


  • 本节回顾跳跃扩散模型的经典文献,尤其是Merton (1976)模型及其假设跳跃服从对数正态分布而跳跃风险可分散的前提。同时介绍Kou (2002)的双指数跳跃分布模型及Madam和Seneta (1990)的方差伽玛模型,各种模型均支持引入不连续跳跃过程。

- 近年来,机器学习特别是深度学习在随机控制理论方面获得突破,通过时间离散化并在各步通过神经网络拟合控制变量,解决多维PDE和BSDE问题。
  • 由于套期保值深度依赖时间序列,强调采用循环神经网络RNN,尤其是长短时记忆网络LSTM的优势,因其能处理非马尔科夫过程并具备长期记忆特性,适用于复杂非线性数学模型和金融时间序列的预测。

- 本文的深度学习方法基于Han等学者的研究框架,利用Stackelberg博弈视角统一处理套期保值定价问题。文中引用了大量关于机器学习在金融中的最新发展以支持方法的合理性[page::1][page::2]

2.2 市场模型与最低方差问题设定


  • 聚焦于单一跳跃扩散风险资产的价格动力学,描述其随机微分方程(SDE),变量包括Brownian运动和补偿Poisson随机测度,且模型具备多维噪声(Brownian motions和Poisson measures),对任意维度具有扩展性。

- 资产价格定义为:

\[
d S(t) = S(t^-)[\alpha(t) dt + \sigma(t) dB(t) + \int{\mathbb{R}^} \gamma(t, \zeta) \tilde{N}(dt, d\zeta)]
\]
  • 无风险利率假设为零,投资组合动态和财富过程用自融资策略表示,财富满足:


\[
d X(t) = X(t) \pi(t)[\alpha(t) dt + \sigma(t) dB(t) + \int
{\mathbb{R}^
} \gamma(t, \zeta) \tilde{N}(dt, d\zeta)], \quad X(0)=z
\]
  • 套期保值问题定义为寻找初始资本 \( z \) 及投资组合 \(\pi\) ,最小化期末平方平均误差:


\[
J(z,\pi) = E\left[\frac{1}{2}(X(T) - F)^2\right]
\]

其中 \( F \) 是到期支付的期权随机变量,目标是找到 \(\hat{z}, \hat{\pi}\) 使得 \( J(\hat{z}, \hat{\pi}) \) 最小,实现最低方差套期保值[page::2][page::3]

2.3 Stackelberg博弈框架及优化解


  • 问题被解释为Stackelberg博弈:先由领导者选择初始资本\(z\),后由跟随者选最优投资组合\(\pi\) ,领导者依据跟随者反应动态选择最优初始资本。

- 采用已有不连续半鞅市场上的理论,结合(Černý and Kallsen, 2007)结果,明确证明最优套期保值策略可表示成一线性反馈形式,与初始资本无关,先确定最优策略再求初始资本。
  • Schweizer (1996)证明存在“方差最优测度” \(\tilde{P}\),可使最优初始资本为:


\[
\hat{z} = E{\tilde{P}}[F]
\]
  • 本文进一步证明对于跳跃扩散模型,所构造的测度为真正的概率测度(非符号测度),且给出明确构造[page::4]


2.4 等价鞅测度(EMM)构造与最优策略推导


  • 指定满足成鞅条件的测度族 \(Q^{\theta0, \theta1}\) ,以局部鞅 \(Z(t)\)的表达式给出,满足鞅条件的技术条件也明确。

- 利用Hille-Yosida生成元方法,表达财富与期权价值的联动,运用Ito-莱维表示定理将期权支付过程分解为布朗运动增量和Poisson跳跃增量的可预测过程。
  • 利用该分解,优化平方误差的积分表达式,对投资比例 \(\pi\) 的积分表达式使用点态优化(pointwise minimization)得到最优反馈策略:


\[
\hat{\pi}(t) = \frac{F(t)\alpha(t) + \sigma(t)\beta(t) + \int \gamma(t, \zeta) \kappa(t,\zeta) \nu(d\zeta) - X(t) \alpha(t)}{X(t)(\sigma^2(t) + \int \gamma^2(t, \zeta) \nu(d\zeta))}
\]

其中 \(\beta\), \(\kappa\) 来源于期权支付的martingale分解[page::6][page::7]
  • 进一步通过引入随机积分因子 \(Yt\),解得最优财富动态方程,明确找到积分因子满足的参数 \(\rho, \lambda, \theta\) ,使得该因子成为解该SDE的积分因子,对策与测度转换之间的联系清晰[page::8][page::9][page::10]


2.5 最优期初资本的表达及测度意义


  • 最优期初资本 \(\hat{z}\) 具体表达式推导完备,展示了其是最优财富过程在末端的二次误差导数为零点条件。

- 此资本 \(\hat{z}\) 可转换为以已构造的等价鞅测度 \(Q^\) 下的期望:

\[
\hat{z} = E_{Q^
}[F]
\]
  • 此外,证明\(Q^\)即方差最优测度\(\tilde{P}\) ,其为正测度且为鞅测度,完全符合无套利原理。

- 重点阐述方差最优定价原则是线性的泛函映射,可利用Riesz定理将其表示为某签名测度的期望,且在跳跃扩散模型下该测度为真正概率测度[page::11][page::12][page::13][page::14]

2.6 具体案例:欧式看涨期权与Black-Scholes模型


  • 对欧式看涨期权,给出期权支付函数及其近似\(C^1\)平滑版本的Malliavin导数方法,推导布朗运动及跳跃方向上的导数(\(\beta, \kappa\))表达式,为最优策略参数计算提供明确思路。

- 说明了即使函数不可微可用平滑逼近处理,Malliavin导数结合Markov性质和链式法则可计算期权敏感性。
  • 对Black-Scholes市场中多维布朗运动情形也给出应用说明,通过有效波动率合成等价简化为单一布朗运动的敞口。

- 递推得到相关价差的损失为0,验证最优解的有效性。
  • 通过该模型,期权定价和套期保值组合有明确闭式解,作为深度学习算法性能的衡量基准[page::14][page::15][page::16][page::17]


2.7 Merton跳跃扩散模型


  • 详细阐述Merton模型设定,经典复合Poisson过程跳跃,跳跃幅度服从对数正态分布。

- 阐述Merton经典定价原则,假设跳跃风险可多样化,风险中性测度下跳跃成分保持不变,得到对应Radon-Nikodym导数和闭式期权价格表达式。
  • 该定价产生不对称收益风险特征(极少数跳跃导致大损失)。

- 本文基于最低方差原则重建模型,得到不同的等价鞅测度,期权价格和套期保值策略均不同于Merton的,体现更对称的损失结构。
  • 描述计算中有关参数 \(\beta, \kappa\) 的展开及其用概率分布拟合综合跳跃幅度的表达。

- 该定价公式提供了Monte Carlo计算版本,用以获得实际数值解。
  • 特别指出理论上可能出现的计算技术细节(如对数定义域限制)及实践中通过替代表达避免此问题。

- 图1直观地比较了Merton和方差最优测度下的Radon-Nikodym导数轨迹,展示了两者的跳跃特性差异[page::17][page::18][page::19][page::20]

2.8 价格参数敏感性分析(图2、图3)


  • 通过参数\(\lambda\)(跳跃强度)、\(\mu\)(跳跃均值)、\(\sigma\)(波动率)、\(\delta\)(跳跃幅度标准差)对期权价格的影响进行数值实证。

- 结果显示随着这些参数的增大,期权价格均上涨,且最低方差原则导致的价格高于Merton传统定价。
  • 对比两种模型价格的敏感性和差异度,发现复杂参数的变动对结果波动产生显著影响,尤其是跳跃强度和跳跃均值的交互作用明显。

- 图形通过彩色热力图展示三类参数组合下价格差异,辅助理解两种定价机制的实质性区别[page::20][page::21]

---

3. 图表深度解读



3.1 图1(第20页)


  • 描述: 显示Merton模型经典测度 \(Z^M\) 与方差最优测度 \(Z^\) 的一条轨迹样本。

- 解读与趋势: 清晰展现 \(Z^\) 轨迹中的向上跳跃特征明显,而 \(Z^M\) 没有或较少。
  • 联系文本: 证明方差最优测度捕捉了跳跃风险的表现,体现了新的定价策略对跳跃成分更敏感的特点。

- 局限性: 单条轨迹示例,不能体现整体统计特征,但已足够说明趋势差异。



3.2 图2 & 图3(第21页)


  • 描述: 两个图分别针对参数组合(\(\lambda,\mu\))和(\(\sigma,\delta\))绘制期权价格(分别为Merton与方差最优定价)及两者差异的热力图。

- 解读:
- 图2显示跳跃强度与跳跃均值较大时两种价格差异扩大,且差异在低跳跃强度高均值区域尤为显著。
- 图3反映波动率与跳跃方差对价格影响较小,但高波动率结合稳定跳跃幅度增大时价格差异相对明显。
  • 联系文本: 支撑文中对参数对价格差异影响的阐述,反映跃变强度和频率对套期保值价格的重要性。






3.3 神经网络结构图(第24页)


  • 描述: 展示双层LSTM结合线性层和Softplus激活实现的深度学习架构,输入包括初始价值、隐含状态、财富更新,最后输出投资组合策略 \(\pi\)。

- 解读: 结构体现了时间序列问题解决的递归依赖,LSTM的隐层记忆管理使信息跨时步传递,解决回溯依赖。
  • 联系文本: 表明深度学习紧密结合问题的随机控制结构,在线更新策略,能捕获非线性动态。




3.4 BS模型训练结果(第26页)


  • 描述: 包括loss收敛图、初始价值趋势及一次市场样本路径的财富、股票价格、套期保值组合和期权支付。

- 解读:
- Loss快速收敛至接近零,初始值趋于理论价格0.5,说明模型训练稳定性良好。
- 套期保值组合轨迹与理论Black-Scholes replicating portfolio高度吻合,验证拟合效果。
  • 联系文本: 验证深度学习方法在完整市场环境下的正确性与高精度,作为基准模型。




3.5 BS多维布朗运动模型(第28页)


  • 描述: 反映同样训练指标但在多维布朗运动输入的非完全市场背景下,loss和初始值的曲线及典型市场路径。

- 解读:
- 模型仍能稳定收敛至理论价格,loss收敛表现略有波动,表明算法能适应高维噪声输入。
- 套期保值组合仍尽可能贴近理论轨迹,凸显算法在维度扩张时的扩展性。
  • 联系文本: 支持算法的多维噪声输入适应力,体现不完全市场的处理能力。




3.6 Merton模型训练结果(第29页)


  • 描述: loss、初始值收敛趋势与典型路径展示。loss较BS模型收敛缓慢且振荡,初始值围绕理论价0.52上下波动。

- 解读:
- 由于跳跃与下跌风险,训练更为复杂且不稳定,尤其在财富接近零时计算出现数值波动。
- 期货组合波动更剧烈,损失波动较大但整体趋势向下,显示套期保值风险缓解但成本增加。
  • 联系文本: 突出跳跃扩散对模型训练和稳定性的挑战,以及深度学习方法的适应和性能表现。




3.7 误差分布对比(第30页)


  • 描述: 采用直方图展示使用Merton经典策略与本文最小方差策略下,终端财富与期权支付的差异分布。

- 解读: Merton策略偏向小盈利但伴随大幅负损失,分布带明显偏态;本文策略分布较为对称且避免极端负损失,表现为风险更均衡。
  • 联系文本: 强化对最小方差套期保值策略风险调节效果的量化认知,解释策略为何成本略高但更安全。




3.8 Kou跳跃模型训练结果(第32页)


  • 描述: loss和初始值收敛曲线及典型行情路径示意,跳跃双指数分布,参数参考美国股市行情。

- 解读:
- 尽管跳跃复合且波动重尾,模型训练流畅且快速收敛到期权价格预测0.4987,略高于Black-Scholes理论价。
- 证明深度学习方法适用于难以用经典蒙特卡洛方法定价的复杂模型,且跳跃正负并存导致价格比传统模型更稳健。
  • 联系文本: 提供可行数值算法,有效拓展跳跃扩散期权定价的适用范围。




3.9 时间离散度和期限敏感性分析(第33-34页)


  • 描述: 不同时间步 \( R \) 与到期期限 \( T \) 对模型表现影响的多个性能指标表格,包括损失、期权价格误差及组合预期 \( L^2 \) 距离。

- 解读:
- 随着 \(T\) 增大,算法表现明显下降(误差增大),归因于误差累积和有限样本估计难度。
- 增加离散步数 \(R\) 一般提升损失和价格估计准确度,但在组合 \(L^2\) 距离上效果表现出一定波动,提示更复杂的动态影响。
- Merton模型中对数变换的辅助离散化虽规避负财富问题,但非线性削弱学习效果,建议跳跃模型采用更细离散较大步数。
  • 联系文本: 说明深度学习在高维非线性动态系统的适应能力,且需权衡计算资源与模型预测精度。


---

4. 估值方法分析


  • 主要估值采用最低方差原则(minimal variance pricing),与经典无套利测度定价不同,需解决非完备市场下风险最小化问题。

- 分析基于跳跃扩散的Ito-Levy分解,通过求解套期保值误差最小化的最优反馈投资组合策略配合用户风险支付。
  • 估值实质为在最优生成的方差最优等价鞅测度 \(Q^\) 下对期权支付取期望,明确将风险中和原理扩展至不完备跳跃市场。

- 明确采用Stackelberg博弈模型分层优化,先解投资组合控制变量,再解初始资本,反映实际市场中投资者与市场交互逻辑。
  • 深度学习算法辅助估计无解析闭式解的最优策略和价格,尤其针对Merton和Kou等不完备跳跃模型。


---

5. 风险因素评估


  • 跳跃风险本质导致市场不完备,直接影响套期保值的非完美性及残差风险。

- Merton模型假设跳跃风险完全可分散,在实际市场中该假设弱,跳跃不可分散产生系统性风险。
  • Monte Carlo模拟和深度学习方法显示,在传统Merton策略下,损失分布偏态且存在极端大损失风险。

- 本文提出的最小方差方法降低极端损失概率,损失分布更对称,避免市场大幅跳跃导致的风险暴露。
  • 数值计算中跳跃幅度可能导致测度Radon-Nikodym导数定义域限制,可能出现负值,需采用替代表达形式以保证概率测度性质。

- 深度学习模型训练时,因财富接近0带来的数值不稳定,尤其在有负跳跃时,可能导致训练过程震荡。
  • 时间粒度粗影响数值准确性,太细离散粒度资源消耗大,需权衡。


---

6. 批判性视角与细微差别


  • 本文对现有文献(如Černý和Kallsen, Merton 1976)理论的重述和推广较充分,然而部分定理或构造在文中虽详细书写,但实际上已有文献支撑,侧重于便于阅读和应用。

- 深度学习方法虽表现强大,但训练依赖大量样本及迭代,训练过程受噪声和模型超参数显著影响,尤其跳跃市场的训练受到波动性与极端样本影响明显,导致训练较慢且震荡。
  • 在模型参数选择上,跳跃分布假设及实际市场是否完全吻合有待商榷,尤其跳跃幅度分布的非可逆区间可能产生技术和理论难点。

- 基于方差最优原则的定价策略经济解释较少,尤其与传统金融经济学中投资者效用函数及市场均衡视角的关系未展开深入讨论。
  • 数值实验证明模型对维度和时间的扩展能力,但算法稳定性和计算成本伴随模型复杂度显著上升,未有系统的敏感性分析和计算效率评估。

- 报告对风险因素和潜在限制识别明确,未过度宣传算法普适或性能,比较谨慎客观。

---

7. 结论性综合



该研究通过建立在坚实随机微积分基础上的最低方差套期保值理论,结合深度学习算法,成功处理了不完全跳跃扩散市场中欧式期权定价和套期保值问题:
  • 理论部分详尽推导了含跳跃扩散的金融市场中最优投资组合和初始资本的层叠结构解,明确构造了对应的等价鞅测度,用以实现期权价格的最小方差定价。

- 通过Malliavin微积分技术,给出期权支付增量细节参数,使算法能够有效且理论自洽地近似求解最优策略。
  • 采用多层LSTM深度神经网络设计创新,成功捕获跳跃路径和长时间序列依赖,实现非闭式模型下的最优套期保值。

- 数值实证涉及Black-Scholes、BS多维布朗运动、Merton及Kou跳跃扩散模型,深度学习模型在各模型中均表现出良好的拟合和稳定性,初始资本预测精准且套期保值策略较理论最优值贴近。
  • 与经典Merton定价相比,最小方差原则更注重损失的对称性和风险的控制,牺牲部分定价以降低极端风险。

- 规模扩展能力较好,在多维跳跃及多跳跃强度情景下依然保持稳定表现,具潜力应用于更复杂、非马尔科夫金融模型。
  • 但算法仍受训练稳定性和跳跃极端现象影响,未来需继续优化学习率调度、数值离散和样本生成,提升效率与适应性。


整体来看,本文结合随机分析与人工智能,填补了跳跃的不完全市场中量化套期保值的理论与数值实现之间的空白,提供了一条切实可行的新路径,具有重要的理论价值和实用潜力,为金融工程和计算金融领域贡献了创新模型和算法。

---

参考关键页码



本文的主要结论和论证引用页码如下:
  • [page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34]


---

报告