Neural Jumps for Option Pricing
创建于 更新于
摘要
本报告提出了一种神经跳跃随机微分方程模型(NJSDE),利用Gumbel-Softmax方法使跳跃过程可微分,从而可通过反向传播算法对跳跃参数进行训练。模型结合了神经网络的非参数拟合能力和跳跃扩散模型的经济结构,有效提升了期权定价的准确性。实证结果显示,NJSDE模型在模拟和真实标普500指数期权数据中均优于传统模型,在存在跳跃风险时表现最优;无跳跃时表现仍稳定,体现其鲁棒性和适应性[page::0][page::3][page::4][page::12][page::16][page::21][page::25]
速读内容
模型创新与方法论框架 [page::3][page::5][page::6][page::9]
- 提出一种集成跳跃过程的神经跳跃随机微分方程模型(NJSDE),跳跃强度参数通过神经网络估计,实现模型参数的非参数化。
- 采用Gumbel-Softmax方法使不连续跳跃过程可微分,解决反向传播算法无法直接用于跳跃过程的难题。
- 模型结构近似递归神经网络,利用蒙特卡洛方法估计欧式期权价格,参数校准通过最小化平方误差损失函数完成。

模拟数据中的表现对比与量化指标 [page::12][page::14][page::15][page::16][page::18]
| 模型 | BS | Heston | SVCJ | ANN | NSDE | NJSDE |
|---------|--------|--------|--------|--------|--------|--------|
| Heston模型 In-sample MAE | 0.4939 | 0.3817 | - | 0.9479 | 0.2280 | 0.2635 |
| Heston模型 Out-of-sample MAE | 0.6077 | 0.4710 | - | 0.6430 | 0.2409 | 0.2519 |
| SVCJ模型 In-sample MAE | 1.1969 | 1.0194 | 0.6885 | 1.1346 | 0.8543 | 0.6127 |
| SVCJ模型 Out-of-sample MAE | 1.3619 | 1.2059 | 0.9020 | 1.0572 | 0.9565 | 0.7698 |
- NJSDE模型在模拟含跳跃数据(SVCJ模型)下的定价误差最低,表现优于传统跳跃扩散模型和黑-舒尔斯模型。
- 在无跳跃模拟数据(Heston模型)下,NJSDE性能与NSDE模型相近,略逊于NSDE但优于ANN和传统模型。
- DM检验显示NJSDE模型显著优于大部分对比模型,在跳跃显著关系下表现尤为突出。


真实市场数据应用分析 [page::19][page::20][page::21][page::23]
- 使用标普500指数期权(SPX)2018-2022年数据,数据经清洗过滤,共计591,284份期权合约。
- NJSDE模型在真实市场数据上的定价误差(MAE和MSE)显著低于BS、Heston、SVCJ及ANN模型,表现最佳。
- NSDE未包含跳跃信息,在大样本数据中表现优于传统跳跃扩散模型,ANN模型训练数据限制导致过拟合,表现波动较大。
- 误差分析表明NJSDE模型在各个不同的行权价(虚实度)和到期时间段均维持稳定优异的表现。


量化因子和策略总结
- 本文侧重于期权定价模型创新,未直接涉及典型的量化因子构建或资产择时策略生成,故策略类型判为“other”[page::0][page::3][page::5].
深度阅读
报告详尽分析报告:《Neural Jumps for Option Pricing》
---
1. 元数据与概览
- 报告标题: Neural Jumps for Option Pricing
- 作者: Duosi Zheng, Hanzhong Guo, Yanchu Liu, Wei Huang
- 机构: Southern University of Science and Technology;University of Hong Kong;Sun Yat-sen University
- 联系邮箱: liuych26@mail.sysu.edu.cn;huangw7@sustech.edu.cn
- 发布日期: 未明确具体日期,但引用至2025年的文献,推断为近期研究成果
- 研究主题: 融合跳跃风险的深度学习模型用于期权定价,其核心在于通过神经网络估计跳跃扩散模型中的参数,进而提升定价准确性。
核心论点: 传统跳跃扩散模型虽能捕捉资产回报中的跳跃现象,但参数估计过程依赖结构假设且难以同神经网络直接集成。本文提出的神经跳跃随机微分方程模型(NJSDE)通过引入Gumbel-Softmax技巧,使跳跃参数可微,能够使用反向传播训练,从而在准确性上优于基准模型。模型适应性强,适用于含跳跃和无跳跃的市场环境,兼顾了经济解释力与数据驱动方法的灵活性。[page::0],[page::1],[page::3-4]
---
2. 逐节深度解读
2.1 引言部分
引言中回顾了经典的Black-Scholes模型及其不足,即不能解释波动率微笑和尖峰厚尾的收益分布特征。跳跃模型(如Merton,Duffie等)成功捕捉了价格和波动性的非连续跳跃部分,表现更贴合实证,但仍受限于固定结构假设。相比之下,人工神经网络(ANN)等非参数方法能直接从数据学习定价函数,但需大规模数据且理论支撑有限。近年来出现了结合结构模型与深度学习的混合模型,但其与传统模型间的内在联系尚浅,缺乏基础理论支撑。[page::1],[page::2]
2.2 神经微分方程和跳跃建模方法回顾
陈等(2018)提出神经常微分方程(NODE),将深度网络解释为离散化微分方程的形式。随后扩展至随机微分方程(如Wang和Hong的NSDE模型),让模型参数时间动态变化。但这些方法多关注连续模型,忽略跳跃过程。本文创新地将跳跃过程引入,同时解决了跳跃的非可微特性,填补了该空白。[page::2-3]
2.3 NJSDE 模型设计与Gumbel-Softmax方法
为克服跳跃过程与反向传播算法不兼容的问题,作者使用Gumbel-Softmax重新参数化跳跃过程,将离散采样转为可微的连续近似。具体而言,模型假设跳跃过程服从参数化的Poisson分布,限制最多跳跃次数$n$作为超参数。通过将跳跃数目概率$\pii$应用Gumbel-Max原理,再软化为Softmax函数形式,实现梯度传递。[page::5-6]
在建模核心上,NJSDE基于Duffie等的SVCJ模型,价格和波动率均包含跳跃项及布朗运动项,将原模型中的固定参数(漂移$\mu$,均值回复$\kappa$等)用多个神经网络$NNi$非参数估计,网络输入除基础变量外($St,K,t,rf$),可灵活学习动态函数形态。跳跃强度$\lambda$作为$NN7$估计,跳跃大小则使用再参数化技巧拆分为确定性神经网络输出与均匀随机变量乘积,确保全流程可微。[page::6-8]
此外,建立了自适应学习布朗运动间相关系数$\rho$(通过$NN8$),整个模型系统通过蒙特卡洛模拟估计期权价格,用递归形式表达类似循环神经网络,方便反向传播训练。[page::8-10]
2.4 模型校准与训练机制
采用蒙特卡洛模拟路径,结合欧式看涨期权定价公式,利用均方误差损失(公式13)进行拟合。梯度计算通过链式法则展开,包含模拟路径中随机项的导数,支持批量训练与高效优化。整个训练过程在BP算法框架下实现,规避了跳跃过程带来的不可微挑战。训练架构细节流程清晰,算法1对模拟步骤给出具体实现说明。[page::9-11]
---
3. 图表深度解读
3.1 表1及图2(Heston模型模拟数据)
- 内容描述:
表1对比了NJSDE、NSDE、ANN、Heston和BS模型在模拟数据下的定价表现,统计指标包含MAE和MSE,分别覆盖样本内与样本外。图2展示各模型在不同虚值程度(moneyness)与到期期限(DTM)条件下的均方误差趋势。
- 数据趋势:
NSDE和NJSDE在两阶段均表现最好,尤其NSDE内样本误差最小,且NJSDE紧随其后。样本外测试中,中位数误差均显著低于ANN和BS等。ANN表现较差,推测因缺少结构化约束和数据量不足。图2进一步揭示NJSDE和NSDE的误差对虚值区间和期限分布稳定且显著优于其他模型,特别是中长期限。
- 文本联系:
由此作者指出NJSDE模型可看作NSDE的推广,包含跳跃分量时带来增益,无跳跃时退化为NSDE,说明模型具有很好的泛用性及适应性。[page::12-15]
3.2 表3及图3(SVCJ模型模拟数据)
- 内容描述:
表3显示跳跃扩散模型下的定价表现,加入了SVCJ模型对跳跃的真实模拟。NJSDE显著降低误差,超越所有其他模型,表明对跳跃成分的捕捉效果优异。图3揭示NJSDE在不同虚值和期限组合下,同样保持低误差。
- 数据趋势:
虽SVCJ模型性能优于无跳跃模型,NJSDE仍有明显优势,凸显结构与神经网络结合的潜力和灵活性。ANN虽能拟合非线性,但跳跃复杂度加大限制其优势。统计检验中(表4),NJSDE显著优于SVCJ,性能提升具统计学意义。[page::16-19]
3.3 表5及图4(S&P 500期权真实数据)
- 内容描述:
表5报告真实市场数据中分不同到期与虚值区间的合约数量与均价分布。短期期权占多数,OTM期权交易活跃度高,价格随虚值、期限变动较大。图4绘制了2018-2022年不同期限与虚值期权的月度交易动态,突出了市场流动性集中和疫情期间的交易波动。
- 数据趋势:
短期及OTM期权交易占优,2020年疫情等事件带来交易波峰。不同期权价格与流动性表现符合市场基本规律,有利于后续模型验证基础。[page::19-21]
3.4 表6及图5(真实数据定价表现)
- 内容描述:
表6综合所有模型的真实数据拟合误差,NJSDE获得最低的MAE与MSE,显著优于传统模型。图5展开不同期限与虚值组合下的MAE表现,体现了NJSDE与NSDE对于短期期权优势显著,对深虚值和远期表现略逊于某些参数模型。
- 数据趋势:
真实数据中NSDE优于SVCJ,显示神经网络对大数据集的学习能力,且跳跃引入依然带来优势。ANN表现过拟合迹象,样本外误差较大。统计显著性检验(表7)一致支持NJSDE的优越性。[page::21-24]
3.5 关键图表展示
- 图1: 展示输入层($St, K, t, rf$)、神经网络层($NN1 \dots NN8$)与结构层(含$\Delta t$, 随机扰动等)如何组成递归框架,输出模拟未来价格$S_{t+\Delta t}$。结构清晰表明将神经网络与随机微分方程原理结合的设计核心。[page::9]
- 图2、3、5: 各模拟与真实市场数据下,不同期权虚值与期限类别的模型表现分布。突出展示NJSDE模型在大部分条件下均有稳定且出色的表现。图示采用多线条对比不同模型,辅助说明理论结果。[page::14,18,23]
- 图4: 月度交易量剖面,辅以期限与虚值分类,对市场环境和数据选择背景提供有力佐证。[page::21]
---
4. 估值分析
报告本身主要聚焦模型设计与定价误差对比,未直接应用传统估值法如DCF或倍数估值。模型估值环节即为期权价格计算,其中:
- 模型采用蒙特卡洛模拟结合递归结构计算期权价格的期望折现值,回归至欧式看涨期权价值定义。
- 关键参数(漂移,波动率,跳跃强度,跳跃大小分布等)由神经网络在线估计。
- 模型训练即校准过程,通过最小化观测期权价格与模型估计价格之平方误差实现。
- 反向传播技巧与Gumbel-Softmax近似保障了跳跃过程参数的可微分估计,实现多参数联合估计,避免传统跳跃模型的估计障碍。[page::6-11]
---
5. 风险因素评估
报告明确识别以下风险因素:
- 跳跃过程的非连续性与非可微性,使得传统基于梯度的方法不可用。Gumbel-Softmax的引入虽缓解此问题,但仍可能存在近似误差。
- 模型复杂度与过拟合风险,尤其在训练样本有限时,加入跳跃参数可能增加估计方差。模拟实验显示NJSDE在非跳跃场景下性能比NSDE略逊,提示适当正则化可能需要。
- 蒙特卡洛模拟本身的计算成本及误差,尤其路径数量与时间步长的选取,可能限制模型训练效率和精度。
- 数据依赖性与模型泛化能力,实证结果表明数据量充足时混合模型优越;数据稀缺时传统结构模型优势突出。
尽管识别风险,报告针对性缓解措施主要是模型设计层面(如网络分解、Richardson逼近等),无专门风险量化或缓解策略披露。[page::3-11,16-24]
---
6. 批判性视角与细微差别
- 创新性及贡献明确,但欠缺对计算复杂度的细致讨论:虽然报告提及计算代价和近似误差,但缺少具体的资源消耗与训练时长评估,限制实务落地评估。
- 数据量对模型表现影响显著,在小样本下ANN表现劣势,NJSDE复杂性可能加剧过拟合,需关注正则化或简化机制。
- 虽然Gumbel-Softmax引入为解决跳跃不可微性提供路径,但其为近似方法,有可能在高跳频或复杂路径下的稳定性不足。
- 深度学习模型本质为黑盒,模型解释性仍有限,尤其跳跃部分对经济含义的细节解释略显模糊。
- 实证中部分长端深虚值期权误差偏大,说明模型对极端价格行为缺乏充分拟合能力,有待进一步改进。
- 报告内部对NSDE与NJSDE关系描述较为乐观,需注意两模型在跳跃强度小或数据差异显著时表现不一,可能产生统计学上的差异。
---
7. 结论性综合
本文提出的神经跳跃随机微分方程模型(NJSDE),创新性地将跳跃扩散过程与神经网络深度学习完美结合,突破了跳跃过程不可微的壁垒,实现了基于反向传播的参数联合估计。核心贡献包括:
- 基于Gumbel-Softmax重参数化方法,成功将跳跃过程转化为可梯度学习的问题,保障了深度学习训练的可行性和准确性。
- 设计综合了经典结构化跳跃模型和灵活非参数神经网络架构,既保留了经济理论基础,也充分挖掘数据驱动的拟合能力。
- 在模拟数据与实证S&P 500期权市场中,系统展现了优于Black-Scholes、Heston、SVCJ、传统ANN及无跳跃的神经随机微分方程(NSDE)模型的定价准确性。
- 模型对不同到期期限和虚值状态下均表现稳健,特别在含跳跃场景下表现出显著优势,且具备良好的适应性和泛化能力。
- 统计显著性检验(Diebold-Mariano测试)充分支持了NJSDE模型的预测性能优势。
- 图表深度展示了模型结构与结果,直观体现多层神经网络如何与跳跃扩散过程共同作用于价差拟合。
整体而言,NJSDE模型为期权定价提供了经济解释性与机器学习精度的有机结合,克服了现有模型对于跳跃参数估计的瓶颈,拓宽了金融工程中科学建模与深度学习应用的边界,具有重要的理论价值和实际应用潜力。[page::0-24],[page::9],[page::12-24]
---
附:关键图表示例
- 图1 NJSDE模型结构示意图

- 图2 Heston模型定价误差分布

- 图3 SVCJ模型定价误差分布

- 图4 S&P 500期权市场交易量动态

- 图5 真实市场数据定价误差分布

---
溯源注记:引用页码均标注为[page::x],多页引用用逗号分隔,如[page::1,3].
---
至此,本报告完成。