`

MLP, XGBoost, KAN, TDNN, and LSTM-GRU Hybrid RNN with Attention for SPX and NDX European Call Option Pricing

创建于 更新于

摘要

本报告基于2015-2023年S&P500与NASDAQ100欧式看涨期权数据,比较Black-Scholes模型与多种机器学习模型(MLP、XGBoost、TDNN、RNN及基于Kolmogorov-Arnold定理的KAN)在期权定价上的表现。实验表明,Black-Scholes模型因其假设限制表现较弱,所有机器学习模型均显著优于其预测准确度。特别地,融合自注意力机制的LSTM-GRU混合RNN模型表现最佳,显著提高了定价精度与泛化能力。此外,KAN模型也优于TDNN与MLP,展现出其对多变量函数复杂结构的有效刻画能力。多模型的误差表现互补,提示集成策略可能进一步提升定价效果。报告还分析了模型在不同标的、价内价外及时间结构上的表现,为量化期权定价和风险管理提供了重要技术路径 [page::0][page::12][page::18][page::35][page::45][page::63][page::67]

速读内容

  • 研究选取了2015年至2023年间S&P 500(SPX)和NASDAQ 100(NDX)两大指数的欧式看涨期权,通过过滤剔除极端例子,获得约379万条有效数据,涵盖不同到期时间和价内价外情况,划分训练、验证和测试集 [page::19][page::20].

- Black-Scholes(BS)经典模型作为基准,虽有严苛假设(恒定风险利率和波动率、无交易成本等),但表现一般,特别是偏价存在明显过度定价问题,最佳BS模型基于90天历史波动率,RMSE约为0.056 [page::6][page::21][page::53][page::54]。

  • 多层感知机(MLP)模型输入特征包含价格比S/K、执行价格K、剩余期限、无风险利率及多时长历史波动率,最佳MLP架构为3层64神经元,采用tanh激活,使用Adam优化器和早停,性能明显优于BS,过度定价比例由59.29%降至27.59% [page::22][page::55][page::56]


  • XGBoost作为基于梯度提升的集成决策树,进一步提升了预测准确性,最佳模型树数量50,最大深度35,RMSE约0.005,过度定价进一步降低至19.03%,且误差表现较为稳定 [page::25][page::58][page::59][page::60][page::61]


  • 简化版TDNN模型采用多层1D卷积捕捉时间依赖,尽管出现过拟合,预测效果优于BS但略逊于MLP和XGBoost,过度定价达到60.91%,表现仍有提升空间 [page::26][page::62][page::63]


  • 循环神经网络(RNN),尤其是结合LSTM和GRU层的混合模型,因其长短期记忆能力显著改善了时间序列依赖建模。最佳结构为5层交替LSTM和GRU,每层32神经元,加入自注意力机制进一步提高性能,训练误差低且泛化表现优良,过度定价比例进一步降低至17.94%,正确定价达到48.05%,是所有模型中表现最佳者 [page::28][page::33][page::35][page::67]

  • 利用Kolmogorov-Arnold表示定理的KAN模型,设计了一种结合正交多项式样条的深度神经网络架构,具备较强的多变量函数逼近能力和良好的理论解释性。KAN模型采用三层Chebyshev多项式激活,16神经元,约2500参数,训练稳定并优于BS、MLP以及TDNN,但略逊于XGBoost和混合RNN,正确定价比例达34.52% [page::36][page::45][page::68][page::69][page::70]


  • 所有模型对于SPX标的预测效果优于NDX,模型在不同价内价外范围内表现存在显著差异,其中ITM选项预测准确度普遍较高。模型间错误具有一定互补性,建议未来利用集成学习提升整体预测能力 [page::45][page::64][page::65][page::66]

- 未来工作计划完善TDNN结构,提升KAN和MLP正则化、引入LSTM/GRU与注意力机制,拓展特征集与适用标的,验证针对波动率笑面捕捉能力,并尝试集成与最新时序模型如Mamba、PINN及Capsule-KAN结构 [page::46][page::47]

深度阅读

金融研究报告详尽分析报告



---

1. 元数据与报告概览(引言与报告概览)



标题:MLP, XGBoost, KAN, TDNN, and LSTM-GRU Hybrid RNN with Attention for SPX and NDX European Call Option Pricing
作者:Boris Ter-Avanesov, Homayoon Beigi
发布机构:哥伦比亚大学、Recognition Technologies, Inc.
技术报告编号及DOI:RTI-20240822-01,DOI: 10.13140/RG.2.2.32372.56963
发布时间:2024年8月22日
主题:针对标普500(SPX)和纳斯达克100(NDX)欧洲看涨期权的定价,比较多种机器学习与神经网络模型,包括多层感知器(MLP)、XGBoost、Kolmogorov-Arnold网络(KAN)、时间延迟神经网络(TDNN)、混合LSTM-GRU递归神经网络(RNN)以及注意力机制的应用。

核心论点及目的:本报告旨在比较和分析多种先进的监督学习方法在欧洲期权定价中的表现,尤其旨在对比经典Black-Scholes(BS)模型与现代机器学习模型的优劣。作者指出,BS模型的多项假设在真实市场数据中并不成立,因而表现欠佳;而深度学习架构,尤其是带有注意力机制的LSTM-GRU混合模型表现最优,能显著降低误差。此外,KAN网络因其基于Kolmogorov-Arnold表征定理,也展现出高于传统神经网络的性能。作者暗示未来可通过模型集成提高定价准确率。总体上,作者推广机器学习方法逐步替代或补充BS模型进行期权定价的可行性。 [page::0,1]

---

2. 逐节深度解读



2.1 期权定价背景与Black-Scholes模型基础(章节1至4)



报告首先详细介绍欧式看涨期权的定义与基本定价机制,强调期权持有人有权利但无义务在到期时以行权价买入资产,盈利为$S(T)-K$(若$S(T)>K$),否则放弃执行。传统期权交易策略如straddle、condor、butterfly、covered call等被简要阐述,强调期权的灵活性及交易策略的多样性。随后介绍了著名的Black-Scholes偏微分方程:

\[
\frac{\partial f}{\partial t} + r S \frac{\partial f}{\partial S} + \frac{1}{2} \sigma^2 S^2 \frac{\partial^2 f}{\partial S^2} - r f = 0
\]

及其对应的封闭解:

\[
f(t,S)=St \Phi(d1) - K e^{-r(T-t)} \Phi(d2)
\]



\[
d
1 = \frac{\ln(St/K) + (r + \sigma^2/2)(T-t)}{\sigma \sqrt{T-t}}, \quad d2 = d_1 - \sigma \sqrt{T-t}
\]

模型假定无交易成本、无套利机会、无股息支付、连续交易、风险利率恒定、价格服从几何布朗运动等。作者系统梳理了资产价格的SDE模型和BS PDE的推导过程,利用伊藤引理与无风险复制组合原理,阐释了BS模型的数学基础。 [page::1,3,4,7-12]

2.2 BS模型的不足与隐含波动率问题



尽管BS模型获得了诺贝尔奖,但其均匀市场假设被多个实证研究反驳:资产回报的分布呈肥尾、波动率和利率非恒定、无法捕捉市场的波动率微笑(volatility smile)现象。隐含波动率被定义为使BS定价与市场真实价格相匹配的波动率参数,且该参数随行权价和剩余期限变化,形成波动率曲面,明显违背了BS模型的常数波动率假设。对此,报告指出多种改良模型(随机波动率模型、局部波动率模型、跳跃扩散模型、莱维过程模型)被提出以试图刻画现实市场特性。此外,BS假定的无套利及正态分布基础也被批判。隐含波动率必须通过数值方法如牛顿迭代法反演求解,进一步暴露BS模型的局限。 [page::5,6]

2.3 机器学习激励及方法论(章节3,4)



鉴于BS模型假设过于理想化,监督学习模型,尤其是各类神经网络,如MLP、KAN、XGBoost等被引入期权定价领域。报告回顾了 ANN应用的历史,从20世纪90年代初针对S&P 期权的早期方法,到近期通过深度学习捕捉波动率微笑的先进模型。Universal Approximation Theorem和Kolmogorov-Arnold Representation Theorem支撑神经网络作为高度灵活函数近似器的理论基础。数据输入包括过往标的价格、行权价、剩余期限、利率及多个历史波动率指标。研究聚焦于欧洲看涨期权,剔除低流动性、极端价外/价内期权,以提升数据质量和模型训练效果。数据筛选、分层划分及指标定义详细列出,为后续模型训练和评估奠定基础。 [page::13-19]

---

2.4 各模型具体分析



Black-Scholes模型(章节6)



BS模型本报告数据上的表现良好,但因输入数据简单,未采用平滑处理或GARCH等高级波动率估计,效果逊色于机器学习模型。90日历史波动率表现最好,BS模型主要问题是过度高估期权价格,过定价比例达到59.29%;相较之下正确估价仅16.98% [page::21,53-54]

MLP模型(章节7)



MLP模型结构为3层隐层64神经元,tanh激活,Adam优化器和MSE损失,输出预测C/K比率。训练采用早停防止过拟合。模型拟合明显优于BS,尤其针对较小C/K表现更佳,但对高价期权存在低估倾向,过低定价比例高达44.21%。总体正确估计率28.20%,过定价27.59%。[page::22,55-57]

XGBoost模型(章节8)



XGBoost采用递归树集合,结合了bagging与boosting,参数包括树深、数量及正则等多方优化。最佳模型由50棵树和最大深度35构成,训练过程无过拟合迹象。预测表现优异,正确率42%,过低价和过高价比例均显著优于MLP和BS。体现树模型在处理非线性关系中耐用性强。[page::23-25,58-60]

TDNN模型(章节9)



Time Delay Neural Network适合处理时间序列数据的滞后特征,采用多层一维卷积捕捉不同时间尺度的信息。然而本研究未完全实现复杂层次结构,仅部分实现简化版。训练时表现出明显过拟合,表现虽好于BS但逊于MLP和XGBoost。过度高估比例达到60.91%,模型波动较大。潜在改进方向包含正则化、批归一化以及更精细的架构设计。[page::26-27,61-63]

RNN模型(章节10)



递归神经网络适合时间序列预测,基本模型存在梯度消失问题,因此采用LSTM和GRU结构以保留长期信息。引入混合LSTM-GRU层叠结构表达短长期依赖,采用tanh激活和Dropout减少过拟合。进一步加入自注意力机制,通过查询、键、值矩阵动态加权时间步信息,实现模型对重要时刻强聚焦,提升性能。最终模型优势明显,所有指标最佳,正确定价率达48.05%,显著优于其他模型。注意力机制显著提升了拟合效果和泛化能力。 [page::28-35,67-68]

KAN模型(章节11)



基于Kolmogorov-Arnold表征定理,KAN通过正交多项式样条代替传统激活函数,结合MLP结构兼具可解释性和准确逼近能力。采用Legendre、Chebyshev、Bessel、Laguerre四种多项式建构网络层,层间权重和样条系数均学习。相比常规MLP,参数量大幅增加(KAN约2528个参数,对比MLP约737个,约多3.4倍),通过正交多项式提高了非线性逼近效率。最佳模型采用Chebyshev二类样条,16个神经元,3层结构,学习率0.0059,正则化采用dropout(5%)。表现好于MLP、TDNN及BS,但稍逊于XGBoost和RNN。未来可考虑熵正则和节点剪枝以进一步提升性能和压缩模型。 [page::36-45,68-70]

---

2.5 综合性能评估与比较(章节12)



实验数据显示,所有机器学习模型均优于基准BS模型,且RNN(含注意力)表现最佳,其次为XGBoost,随后为KAN、MLP和TDNN。BS虽经典但过度高估严重,正确定价率仅17%。RNN模型虽然总体最佳,但相较于TDNN和BS有更多样本被低估。各模型对SPX标的表现稳定优于NDX。不同模型对不同虚实值状态(moneyness)表现不同,ITM期权预测优于ATM和OTM,但ATM预测优于OTM略有出乎意料。部分模型低估和高估的比例互为补充,有望通过模型集成策略进一步提升性能。 [page::45-46,64-66]

---

2.6 未来展望(章节13)



报告指出后续工作将完善TDNN网络结构,引入更精细正则化和激活函数,探索在KAN和MLP中融入LSTM/GRU和多头注意力机制,提高多项式计算效率。扩大数据特征,支持看跌期权,测试其他指数和波动率平滑技术。计划引入更复杂的模型如Heston随机波动率模型、蒙特卡洛方法比较等。同时拟尝试基于状态空间的最新序列模型(Mamba系列)和物理驱动神经网络(PINNs)。此外,将探索Capsule Network与KAN结合的新颖架构,预计提升空间大。整体规划多方向优化,力求提升定价准确性与模型解释力。 [page::46-48]

---

3. 图表深度解读



Figure 1: 风险无风险利率随时间变化图



图中蓝色曲线显示2015年至2023年期间美国13周国库券利率显著波动,红色虚线每30天标记,突出短时间内利率并非恒定。此事实挑战BS模型恒定利率假设,为使用更灵活机器学习模型提供实证基础。[page::51]

Figure 2: SPX和NDX指数的历史波动率随时间变化(多窗口)



两图分别展示不同时间窗口(20、30、40、50、65、90日)的历史年化波动率,明显见到大幅波动,短期窗口波动更剧烈。说明BS假设波动率常数不成立,且市场波动性呈现动态变化趋势。[page::52]

Figure 3: SPX与NDX的对数收益分布直方图及正态拟合



显示两指数收益分布中尾部肥厚,峰度较高,偏离正态分布(拟合线为红色),更接近拉普拉斯分布,强调BS假设的对数收益正态性失真。[page::52]

Figure 4 & 5: 期权按虚实值状态和剩余期限的均价与数量比例统计



统计数据显示,NDX期权价格整体明显高于SPX,且后者ATM期权占比较大,NDX以OTM期权为主。价格随到期时间增长而显著上涨,ITM期权均价最高,OTM最低。对比各市场结构为模型针对性优化性能提供指引。[page::53]

Figures 6 & 7: BS模型不同波动率输入下误差指标与预测实际对比



表格显示90日波动率作为BS波动率的效果最好,误差指标均为最低(MSE=0.003142),但拟合图展示BS普遍高估C/K值,尤其高值区表现偏差较大,验证了BS模型的过定价倾向。[page::53-54]

Figures 9 & 10: MLP训练验证损失与预测拟合展示



训练早期验证损失波动较大,但整体均步进下降。预测散点图显示MLP模型在C/K较小区域拟合紧密,欠拟合大值区,表现低估。验证了MLP优于BS但仍有提升空间。[page::55]

Figures 18 & 19: XGBoost训练曲线与预测拟合



曲线接近重合且平滑下降,出色避免过拟合,预测拟合紧密度高于MLP和BS,准确率领先,展示树模型对复杂非线性和特征交互的高效建模能力。[page::59]

Figures 23 & 24: TDNN训练与拟合分析



训练误差稳步收入但验证误差起伏大幅,明显过拟合。拟合散点图虽拟合大部分样本,但过定价持续严重,呼应训练表现,需架构或正则优化。[page::61-62]

Figures 33 & 34: RNN(LSTM-GRU混合+注意力)训练与预测表现



训练损失平稳下降,验证损失波动大但总体下降趋势明显。拟合图紧密覆盖大部分真实值,错误分布接近正态,表现最优。对时间序列的捕捉能力显著优于其他模型,注意力机制帮助聚焦重要时刻。[page::67-68]

Figures 37 & 38: KAN模型训练及拟合



验证误差随训练周期震荡下降,训练误差平稳,拟合数据点紧贴真实值,表现优于传统神经网络。误差分布显示模型具良好泛化,显示正交多项式样条结构在函数逼近上的优势。[page::69-70]

Figures 39 & 40: 各类正交多项式形态及期权合约分布



展示Chebyshev、Legendre、Bessel、Laguerre多项式前7阶函数图形,表达式递归易实现,辅助KAN层建构。期权合约集中于较短到期时间,标的指数价格区间SPX远小于NDX,说明数据模型训练需覆盖广泛价格区间。[page::71-72]

---

4. 估值分析



本研究未直接基于传统金融估值方法进行价内估值,而是构建基于市场历史数据的函数逼近模型。模型输出为期权价格与行权价之比C/K。
  • BS模型基于其严格的经济学假设以及封闭解存在。

- 机器学习模型通过最小化均方误差损失函数拟合C/K,比SB模型更灵活捕捉市场信息。
  • KAN模型利用Kolmogorov-Arnold定理分解多元函数,将逼近分解为一系列一维样条函数的组合,通过正交多项式建模复杂非线性关系,理论上拥有统一逼近能力。

- RNN结构通过隐状态传递描述时间依赖,融合注意力机制聚焦关键时间点,进一步提升对期权价格时间动态的理解和预测准确率。

该方法的估值过程更多依赖数据驱动模式识别而非模型假设,体现了现代金融机器学习的趋势。[page::11,12,36-38,50]

---

5. 风险因素评估



研究认知风险包括:
  • BS模型假设违反:利率和波动率非恒定,资产收益非对数正态,影响体系准确性。

- 数据样本不平衡:NDX与SPX分布不均,少量长期期权,导致某些类别预测准确率下降。
  • 模型过拟合风险:如TDNN模型验证误差波动大,需正则化和更细致架构设计。

- 参数调优复杂且计算资源需求大:尤其是KAN多项式次数和层数,注意力机制增加训练复杂度。
  • 经济事件影响与市场动态变化难以完全捕捉:模型训练基于历史,未来突发事件的影响难以预测,影响泛化性能。

- 标的资产差异性:SPX与NDX表现差异突出,模型需针对不同资产灵活调整输入特征与结构。

报告提出针对部分风险的缓解策略,如早停、Dropout、参数搜索及未来纳入更多市场变量和交易策略。[page::24,26,27,46]

---

6. 审慎视角与细微差别


  • 报告多处指出模型改进方向,但当前实现的TDNN架构简化较大,实际表现偏低,应慎重评估其结果。

- KAN模型虽理论上兼具MLP和样条优点,但参数量显著增加,训练复杂且正则方法未充分开发,可能导致模型效率与泛化力折衷。
  • RNN中自注意力机制加入虽提效,但验证误差波动仍较大,提示可能存在训练稳健性问题。

- 模型对虚实值不同类别的准确率分布不均,尤其OTM期权预测均较低,表明候选模型尚未充分解决极端状态的估值问题。
  • BS模型表现虽差,但因其简洁性和理论基础依然具备重要价值,报告中对其投入的参数优化较少,实际工业应用比对结果可能更好。

- 未来工作中提到嵌套和混合模型(模型集成、Mamba等状态空间模型)为算法多样性提供良好方向,但目前实验未涵盖其性能表现,需谨慎推广。

整体上,报告客观呈现各模型优劣,展现了多方案共存的实际研究状态和未来成长空间。 [page::23,26,27,46]

---

7. 结论性综合



本报告以标普500(SPX)和纳斯达克100(NDX)欧式看涨期权为对象,基于2015-2023年真实市场数据,全面对比了经典Black-Scholes模型和多种机器学习模型,包括MLP、XGBoost、TDNN、混合LSTM-GRU RNN带注意力机制,以及基于Kolmogorov-Arnold表征定理的KAN模型。
  • BS模型符合理论预期,在简单波动率输入下表现有限,普遍存在过度高估问题,正确定价比例低至16.98%。

- MLP模型凭借神经网络基础架构明显提高拟合精度,减少过定价,但低估现象依然显著,预测准确率提升至28.2%。
  • XGBoost模型借助梯度提升树强大特征拆分优势,进一步提升预测性能,正确定价率达42%,表现优于常规神经网络。

- TDNN模型虽设计用于时间序列,但本项目粗略实现且过拟合严重,性能介于BS与MLP间,存在结构改进空间。
  • 混合LSTM-GRU带注意力机制RNN最能捕捉期权价格的时间依赖与市场动量,综合误差最小,拟合最紧密,达到48%的正确定价率,明显优于其他模型。

- KAN模型理论新颖,将多元函数分解为单变量样条组合,提高解释力,表现优于传统神经网络且接近XGBoost,但训练复杂,参数规模大,正确定价率为34.52%。

数据分析发现各模型对SPX表现更优于NDX,对ITM期权整体表现优于ATM及OTM,且各模型的过低价和过高价倾向互补,预示基于模型集成的潜在提升。未来工作聚焦完善TDNN、强化正则化策略、引入新型神经网络架构(如状态空间模型)、探索多头注意力机制、扩展标的资产及考虑更多市场变量和参数估计技术,以提升模型普适性和精度。

报告展示了监督学习模型在金融期权定价领域的卓越潜力,挑战传统BS模型的同时,强调了机器学习与神经网络技术在复杂金融时序数据建模中的价值。该研究为期权定价的机器学习方法提供了丰富的理论和实证基础,且配套详尽的模型参数和训练过程分析,为业界和研究界后续工作奠定坚实基石。[page::0-70]

---

附注:全文同时包含详细数学推导(BS PDE及其解)、多模型结构与训练细节、丰富数据探索分析(波动率、利率、价格分布等)及大量实验图表,均已结合上述内容进行解析,确保解读严谨全面,满足高专业标准。

报告