`

Deep Gamma Hedging

创建于 更新于

摘要

本报告利用深度学习训练神经网络,学习在同时使用标的资产和对冲期权时的最优复制策略。结果表明,当期权价格符合Black–Scholes模型时,网络能成功学习该模型的gamma对冲策略,尤其在存在模型不确定性时表现优异。研究表明,实际应用中采用gamma对冲更多地是为了应对模型不确定性,而非减少交易成本。报告通过模拟不同交易成本和模型不确定性条件,验证了深度对冲策略的有效性和优越性,为理解gamma对冲的实用价值提供了新视角 [page::0][page::1][page::2][page::16].

速读内容

  • 研究背景与目标 [page::0][page::1]

- Gamma对冲策略通过调节复制组合的delta和gamma,以实现对衍生品的准确复制。
- 虽然在Black–Scholes模型中连续delta对冲已足够,实际市场广泛采用gamma对冲策略,本文探讨其原因。
- 利用深度学习方法计算最优交易策略,比较了gamma对冲与delta对冲在模型不确定性和交易成本条件下的表现。
  • 模型设定与神经网络设计 [page::2][page::3][page::4][page::5][page::6]

- 采用Black–Scholes公式估计期权价格,但假设标的资产价格存在随机波动率和漂移(模型不确定性)。
- 交易者在离散时间点调整投资标的和对冲期权的仓位,考虑了比例交易成本。
- 针对无交易成本情形采用多层前馈神经网络,有交易成本时引入GRU循环层以捕捉仓位历史信息。
- 使用两种损失函数:均值绝对收益损失(无模型不确定性)和最大绝对收益损失(模拟模型不确定性)。
  • 量化实验与策略表现分析 [page::6][page::7][page::8][page::9][page::10]-[page::15]

- 图2-3显示无交易成本下,深度对冲策略能精确复制gamma中性组合,且模型不确定性下策略收敛于经典gamma对冲。
- 引入不同等级的交易成本(无、正常、高)后,深度学习策略仍能有效调整仓位,体现平衡交易成本与对冲效果的能力。
- 多场景回测显示,深度学习同时使用标的和期权作为对冲工具的策略,在均值及最大损失损失指标上均显著优于单一标的delta对冲和传统gamma对冲。





  • 量化策略总结(深度gamma对冲)[page::4][page::16]

- 设计的神经网络基于时间和当前标的价格输入,输出同时包含标的和一个期权仓位。
- 交易策略以最小化损失(均值或最大绝对PnL)为目标,结合神经网络自主学习多资产动态对冲。
- 在模型不确定性假设以及有交易成本时,深度对冲策略趋近于经典gamma对冲,展示其鲁棒性。
- 在无模型不确定性时,最优策略允许偏离gamma对冲以降低交易成本,表现出较好的收益-成本平衡。
  • 绩效对比表(Loss Function值)[page::16]


| 损失函数 | 对冲策略 | 交易成本 p1=0% p2=0% | p1=0.005% p2=0.25% | p1=0.5% p2=0.5% |
|----------|--------------------|---------------------------|--------------------------|-------------------------|
| Cmean | Delta Hedging | 0.41 × 10⁻³ | 0.46 × 10⁻³ | 20.62 × 10⁻³ |
| | Gamma Hedging | 0.01 × 10⁻³ | 2.92 × 10⁻³ | 30.07 × 10⁻³ |
| | Deep: 1 Instrument | 0.63 × 10⁻³ | 0.90 × 10⁻³ | 9.12 × 10⁻³ |
| | Deep: 2 Instruments | 0.57 × 10⁻³ | 0.58 × 10⁻³ | 2.83 × 10⁻³ |
| Cmax | Delta Hedging | 6.17 × 10⁻² | 6.27 × 10⁻² | 15.34 × 10⁻² |
| | Gamma Hedging | 0.03 × 10⁻² | 0.97 × 10⁻² | 8.62 × 10⁻² |
| | Deep: 1 Instrument | 5.38 × 10⁻² | 5.37 × 10⁻² | 8.38 × 10⁻² |
| | Deep: 2 Instruments | 0.49 × 10⁻² | 0.73 × 10⁻² | 1.60 × 10⁻² |

- 结合两种损失函数,深度对冲策略使用两种工具组合均优于单一标的或传统策略,尤其在含交易成本时优势明显。
  • 主要结论 [page::16]

- 没有交易成本时,深度对冲能精确学习最优gamma对冲策略。
- 存在模型不确定性时,gamma对冲展现为应对不确定性的有效策略。
- 交易成本影响下,传统gamma对冲并非最优,深度学习策略能自动适应成本与风险权衡。
- Gamma对冲在实际中更可能被用于处理模型不确定性,而非单纯减少交易成本。
- 多工具对冲组合显著提升对冲效果,强调综合利用市场多种资产的重要性。

深度阅读

深度伽玛对冲(Deep Gamma Hedging)报告详尽分析



---

一、元数据与报告概览


  • 报告标题:Deep Gamma Hedging

- 作者:John Armstrong,George Tatlow
  • 发布机构:未详,撰写于2024年8月

- 主题:围绕“伽玛对冲”策略的深度学习方法研究,探讨利用深度神经网络在存在模型不确定性和交易成本条件下,如何求解最优复制和对冲策略。主要聚焦于金融衍生品定价对冲领域。

核心论点与目标
  • 报告通过训练神经网络,学习包含基础资产和对冲期权两种工具的最优复制策略。

- 在对冲期权的价格按照Black-Scholes模型定价时,神经网络能学到经典的Black-Scholes伽玛对冲策略,即使底层标的波动率不符合Black-Scholes模型。
  • 该模型表明市场实际采用伽玛对冲策略,是为了应对模型不确定性而非单纯减少交易成本。

- 通过模型比较不同交易成本和模型不确定性条件下最优策略表现,论证伽玛对冲相较于传统delta对冲的优势。
  • 报告不仅贡献于“伽玛对冲”理论,更拓展了深度对冲(Deep Hedging)方法的研究,通过加入多种对冲工具和风险模型不确定性,展现深度强化学习的强大潜能。


---

二、逐节深度解读



1. 摘要与引言(Abstract & Introduction)


  • 摘要中介绍了使用神经网络学习期权复制策略的创新方法,重点在于同时利用基础标的和对冲期权两种资产。核心发现是伽玛对冲经神经网络识别,意指伽玛对冲在实务中是处理模型不确定性的有效工具。

- 介绍部分回顾了经典伽玛对冲的定义和历史研究,说明在Black-Scholes模型中纯delta对冲已足够实现复制,但市场实践中仍广泛使用伽玛对冲。
  • 文献回顾提及伽玛对冲在离散交易时具有更高精度的收敛速度([KPKP92]等),并且理论认为伽玛对冲可减少重平衡频率以降低交易成本。

- 近期理论[AI23]表明伽玛对冲策略的收敛性独立于标的价格路径,只要路径满足一定正则性。这与delta对冲依赖于特定概率模型不同。
  • 两个新的伽玛对冲动机被提出:一是预测市场对价格变动的响应比预测标的价格更易;二是基于粗路径理论的数理工具相较于Itô微积分带来更强健的对冲效果。

- 本文利用深度学习,探索在复杂市场现实(交易成本和模型不确定性)下伽玛对冲的优势和最优策略表现[page::0][page::1]。

2. 文献回顾与研究贡献(文献综述)


  • 回顾了深度对冲领域的关键文献,[BGTW18]开创了深度强化学习框架进行动态对冲,后续工作针对市场现实数据稀缺、粗波动性模型或多组合对冲进行了扩展。

- 本文创新在于以伽玛对冲作为传统基准,更进一步融合模型不确定性进损失函数。
  • 通过实验比较发现:

- 既有模型不确定性也考虑交易成本时,深度学习策略接近伽玛对冲;
- 无模型不确定性时,偏离伽玛对冲策略能获得更好表现;
- 通过不同交易成本模型对比,伽玛对冲是渐近最优策略的理论依据有力支持[page::1][page::2][page::2].

3. 模型设定(Modelling Framework)


  • 研究对象为写出一个带有光滑欧式期权的头寸,卖方需要在有限交易时点上,通过$M$个标的资产(基础资产及对冲期权)动态调整仓位复制期权支付。

- 期权价格由Black-Scholes模型确定但股票价格动态可能与该模型偏离,体现模型不确定性。
  • 设定比例交易成本$p^\alpha$,PNL计算含交易成本调整。

- 交易策略函数$q^\alpha$基于历史标的价格路径设计,可由神经网络学习或经典对冲策略决定。
  • 采用两种损失函数:

- $\mathcal{L}^\mathrm{mean}$:平均绝对收益损失,用于无模型不确定性;
- $\mathcal{L}^\mathrm{max}$:最大绝对收益损失,增强对不同模型路径的鲁棒性[page::2][page::3].

4. Delta与伽玛对冲策略回顾


  • Delta为期权价格对标的价格的一阶导,Gamma为二阶导数。

- Delta对冲:保证整体投资组合delta为零。
  • 伽玛对冲:保证整体组合delta和gamma都为零,通常需两种资产对冲,期权1为标的($K^1=0$),期权2带有非零执行价$K^2$,用期权2消除gamma,用期权1调整delta。

- 具体仓位:
- Gamma中性仓位为 $qt^{2,\Gamma} = \frac{\Gammat^0}{\Gammat^2}$;
- Delta中性仓位 $q
t^{1,\Gamma} = \Deltat^0 - qt^{2}\Deltat^{2}$[page::4].

5. 神经网络结构设计


  • 无交易成本时采用三层100节点全连接神经网络,ReLU激活输出层线性。

- 有交易成本引入序列关联,通过GRU结构传递前期仓位信息,防止网络过度利用路径信息以保持模型合理性。
  • 输入为时间$t$和当前底层价格$St$,输出对应各资产仓位$q^\alphat$。

- 训练采用Adam优化器,20轮,批次256[page::5][page::6].

6. 数值结果分析



6.1 无交易成本下$\mathcal{L}^\mathrm{mean}$损失(Section 4.1)


  • 训练网络复现传统伽玛对冲策略,结果显示组合delta和gamma中性,神经网络生成仓位与理论仓位高度一致。

- 图7(第7页图)展示不同时间点对应的组合delta和gamma,深度网络策略与期权卖出的理论值匹配紧密,证明神经网络有效学习经典伽玛对冲[page::6][page::7].

6.2 无交易成本下$\mathcal{L}^\mathrm{max}$的鲁棒对冲(Section 4.2)


  • 允许模型不确定性,且最大绝对损失损失函数训练。

- 随着交易频率增加,神经网络策略渐进趋近经典伽玛对冲。
  • 图9(第9页图)中,交易频率越高,网络拟合曲线越接近理论伽玛曲线,说明深度学习方法能捕捉更高阶动态[page::8][page::9].


6.3 交易成本引入(Section 4.3)


  • 加入市场比例交易成本,分别考察零、正常(基于S&P 500数据)及高交易成本情境。

- 使用含GRU的recurrency结构,增多时间点数以模拟更精细策略。
  • 图10-15(第10-15页图)对比了不同交易成本水平下网络输出仓位与传统伽玛对冲策略的差异。

- 观察到:
- 交易成本升高时,神经网络策略仓位调整更为保守,尤其期权1持仓急剧减少,期权2持仓展现更显著变化。
- 在无交易成本情境下,网络输出密切对应理论对冲;
- 交易成本高涨时,伽玛中性保持难度增加,深度对冲表现出更复杂的非线性仓位分配以平衡成本与风险[page::10][page::15].

6.4 多模型与方法比较(Section 4.4)


  • 以10万条标的价格路径进行模拟,检验delta对冲、伽玛对冲、含1个和2个对冲资产的深度策略性能。

- 表1(第16页)给出不同损失函数和交易成本条件下均方损失$\mathcal{L}^\mathrm{mean}$与最大损失$\mathcal{L}^\mathrm{max}$指标。
  • 结果亮点:

- 伽玛对冲优于delta对冲,尤其在无或低交易成本条件下表现显著;
- 使用两个对冲资产的深度对冲表现最优,特别是在有交易成本时,相较经典策略损失明显下降;
- 伽玛对冲不总是最优,尤其在最大损失指标下,深度学习策略通过灵活仓位调整进一步压缩风险。

| 损失函数 | 对冲方法 | 无交易成本 | 低交易成本 | 高交易成本 |
|----------|----------------|-------------------|-------------------|-------------------|
| Cmean | Delta Hedging | 0.41e-3 | 0.46e-3 | 20.62e-3 |
| | Gamma Hedging | 0.01e-3 | 2.92e-3 | 30.07e-3 |
| | Deep (1 Instr) | 0.63e-3 | 0.90e-3 | 9.12e-3 |
| | Deep (2 Instr) | 0.57e-3 | 0.58e-3 | 2.83e-3 |
| Cmax | Delta Hedging | 6.17e-2 | 6.27e-2 | 15.34e-2 |
| | Gamma Hedging | 0.03e-2 | 0.97e-2 | 8.62e-2 |
| | Deep (1 Instr) | 5.38e-2 | 5.37e-2 | 8.38e-2 |
| | Deep (2 Instr) | 0.49e-2 | 0.73e-2 | 1.60e-2 |
  • 深度学习覆盖两类损失及三种交易成本设定,均体现将伽玛对冲和多工具深度对冲结合可以获得更低的风险。这也反映深度策略可捕获经典方法难以体现的市场现实[page::16].


7. 结论(Conclusion)


  • 深度对冲方法能够学习并求解无交易成本条件下伽玛对冲的理论最优解;

- 在引入交易成本情况下,鲁棒对冲策略仍趋近伽玛对冲,但传统伽玛对冲不再严格最优;
  • 深度神经网络揭示了一种调整后更优的“伽玛变体”策略,有效权衡交易成本与风险,优于单纯使用伽玛对冲;

- 研究确认伽玛对冲实际价值主要在于缓解模型不确定性风险,而非交易成本降低;
  • 结果强调在市场构建对冲组合时,应充分利用多样化对冲工具,通过现代算法寻找最优权衡策略[page::16].


---

三、图表深度解读



图6:GRU神经网络架构(第6页)


  • 结构图显示输入层包含时间$t$与标的价格$St$,经过两层全连接层(FF),中间嵌入带有GRU单元的递归层(数目同资产数$M=2$),最后输出层产出各时间点仓位$qt^\alpha$。

- GRU层设计用以携带上一时点仓位信息,实现动态记忆和考虑交易成本带来的序列依赖。
  • 该设计兼顾网络表达力和避免过拟合至个别路径统计特征[page::6].


图7:无交易成本$\mathcal{L}^\mathrm{mean}$的对冲网络delta与gamma表现(第7页)


  • 各时间点固定$t=0.1,0.5,0.975$时,网络策略组合delta与伽玛与期权卖出理论值高度重合,表明深度网络成功复制伽玛中性组合。

- 蓝色实线为神经网络对冲策略,红色虚线为理论对应期权delta/gamma值,误差极小,说明网络训练收敛良好。
  • 可以看出网络自动学习经典伽玛对冲策略,无需显式编码伽玛对冲规则[page::7].


图9:无交易成本$\mathcal{L}^\mathrm{max}$不同交易频率下策略delta与gamma(第9页)


  • 不同$n$值(交易次数)分别为5,10,40,随着$n$增大,网络策略delta和gamma更贴合理论伽玛对冲曲线。

- 体现理论中伽玛对冲策略为极限最优解的数学事实,也证明神经网络可捕获极限行为,提高实际对冲策略的稳定性和鲁棒性[page::8][page::9].

图10-15:不同交易成本与丢失函数下对冲网络仓位与组合...


  • 图10-12为$\mathcal{L}^\mathrm{mean}$损失下,0、正常和高交易成本的策略表现;

- 图13-15为$\mathcal{L}^\mathrm{max}$损失下,同样三种交易成本情境;
  • 每组图展示时间序列中神经网络持仓与理论伽玛对冲持仓的对比,以及组合整体的delta和gamma。

- 随交易成本升高,神经网络持仓幅度明显收缩且呈现更复杂的波动态势,反映网络在权衡交易费用和风险。
  • 当交易成本较大时,伽玛对冲不再是最优,神经网络通过调整delta对冲持仓比例保持整体收益率的优化。

- 表明深度模型自动适配实际市场微观结构,提高对冲执行效率和降低成本。

表1(第16页)


  • 以数值形式详细对比delta,伽玛对冲和深度对冲多工具模型在不同交易成本及损失函数下的最终性能。

- 结果表明多工具深度对冲策略在任何交易成本和损失函数条件下均优于其他对冲策略,尤其是在考虑最大损失(鲁棒性)的情况下优势更为明显。
  • 伽玛对冲相较于delta对冲,在无及低交易成本下对风险的控制明显更胜一筹;

- 但存在高交易成本时,简单伽玛对冲的劣势凸显,深度学习策略的灵活性起到关键作用。

---

四、估值分析


  • 报告主要采用Black-Scholes公式作为金融工具估值基础,利用BS模型估计欧式期权价格,计算Delta和Gamma。

- 期权价格$V
t^\alpha=\mathrm{BS}(St,K^\alpha,r,T-t,\sigma)$,其中$r$无风险利率,$\sigma$为已标定的隐含波动率。
  • 采用标的实际波动率$\sigma\eta$产生模型不确定性,允许波动率和漂移系数在一定区间随机变动,模拟真实市场环境。

- 深度学习对冲策略基于这些估值和实际市场特征,结合交易成本与动态持仓,实现对冲组合的动态调整和估值管理。
  • 对冲优化目标通过最小化PNL绝对值的平均或最大值(均方损失与极端风险),相当于在经典定价估值基础上,兼顾交易策略对组合风险的管理,形成较为完整的价值估计与风险控制框架[page::2][page::3].


---

五、风险因素评估


  • 模型不确定性:资产价格的实际波动率$\sigma\eta$及漂移$\mu\eta$服从随机分布,这导致经典Black-Scholes模型的不准确性,风险由此产生。

- 交易成本:比例交易费用$p^\alpha$影响对冲策略频繁调仓行为,可能导致策略表现低于理论最优。
  • 离散交易时点:交易不连续,使得对冲策略只能近似复制目标,带来跟踪误差风险。

- 神经网络模型风险:深度学习模型受训练样本、架构设计及超参数影响,可能发生过拟合/欠拟合,降低对冲稳定性。
  • 论文通过不同损失函数设计(平均损失与极端风险损失)部分缓解风险,同时结构设计嵌入GRU单元以保证模型动态记忆和鲁棒性。

- 交易成本和模型风险联合影响对冲策略表现,研究表明简单伽玛对冲不能完全缓解交易成本高企带来的风险,需要深度模型适应性调整。

---

六、批判性视角与细微差别


  • 报告明确假设对冲期权价格完全符合Black-Scholes定价,现实市场中期权隐含波动率往往呈现笑脸(vol smile),导致模型偏离真实价格,影响对冲策略表现。

- 潜在的交易成本模型仅考虑比例交易成本,实际市场含滑点、冲击成本等复杂费用,模型简化可能低估真实交易影响。
  • 采用神经网络求解虽较传统方法灵活,但训练耗时巨大,且可能对极端市场状况缺乏反应能力,模型泛化性需进一步验证。

- 伽玛对冲策略在本研究中作为基线被充分讨论,然而对冲组合细节(比如多头或空头结构,公司跨期权使用等)未全面探讨。
  • 报告侧重于二种损失函数以及两类对冲资产设置,在复杂市场实际操作中,资产种类远更多,策略调优更为困难。

- 结论强调伽玛对冲价值主要在模型不确定性管理,这符合现代金融观点,但未对模型误差带来的风险偏离提供细节敏感度分析。
  • 总体而言,报告方法新颖严谨,但市场实际应用时可能面临参数估计、模型验证及实时计算等难点。


---

七、结论性综合



本文系统研究了深度学习在期权对冲中的应用,特别是如何在包含模型不确定性与交易成本环境下,通过结合基础资产和对冲期权实现最优复制策略。主要发现如下:
  • 深度神经网络有效学习经典Black-Scholes伽玛对冲策略,证明该策略在模型理想情形下是对冲最优解;

- 模型不确定性刺激伽玛对冲策略成为首选,神经网络损失函数对最大风险加权表现出伽玛对冲的鲁棒性优势;
  • 引入交易成本后,简单伽玛对冲策略失去最优性,但深度学习自动辨识出针对高交易成本的更为精细的对冲方案,显著提升风险调整后的表现;

- 多对冲工具协同优化显著优于单一资产对冲,强调在实际市场构架对冲篮子的重要性;
  • 实验证明,伽玛对冲在减少模型风险方面效果突出,而非单纯降低交易费用,是市场长期采用该策略的重要动因。


图表深度解读:
  • 网络训练出的delta和gamma曲线与理论高度吻合,展示深度对冲算法的准确性与可解释性;

- 交易成本增大时持仓曲线展现节奏适应和仓位压缩,说明网络有效权衡了调整成本与对冲效果;
  • 数值模拟中的损失指标清晰量化深度策略在多维度风险控制中的优良表现。


综上,本文为伽玛对冲策略的理论验证与实用优化提供了强有力的现代机器学习工具,并为未来更复杂市场情景下的期权对冲策略设计指明了方向。基于深度学习的多资产动态对冲策略,结合模型不确定性和实际市场摩擦,将成为金融工程优化对冲组合的重要趋势。[page::0][page::1][page::6][page::7][page::8][page::9][page::10][page::15][page::16]

---

附:重要图表示意



图6:GRU神经网络结构

图7:$\mathcal{L}^\mathrm{mean}$无交易成本下网络复现伽玛对冲delta与gamma

---

以上为整篇报告的细致解读。

报告