Empirical Models of the Time Evolution of SPX Option Prices
创建于 更新于
摘要
本论文提出了一种基于机器学习的实证模型,利用30年SPX指数期权数据,结合GARCH波动率与深度神经网络、随机森林和线性回归模型,实现对欧式看跌期权价格的动态模拟和预测。神经网络模型在不同窗口训练下,在深度价外期权和波动性高涨期表现最佳,且无风险套利条件基本满足。SHAP分析揭示关键特征影响,模型提供稳健的时序路径模拟,有助风险管理和尾部风险对冲 [page::0][page::1][page::5][page::33][page::39][page::40]
速读内容
研究背景与目标 [page::0][page::1]
- 传统Black-Scholes模型假设常数波动率,难以捕获波动率微笑与波动率曲面动态演化。
- 本文利用GARCH模型估计时变波动率,结合神经网络(NN)、随机森林(RF)、线性回归(LR)构建实证期权定价模型。
- 目标是构建能联合模拟标的资产价格及期权价格演变的非参数模型。
数据与建模框架 [page::3][page::4][page::5]
- 使用OptionMetrics的SPX欧式看跌期权数据,时间跨度1996-2022年,约700万条记录。
- 输入特征包括:标的指数价格,执行价,剩余期限,股息率,无风险利率,GARCH波动率,以及部分模型包含Black-Scholes价格作为辅助特征。
- 利用无穷小批次随机梯度下降训练两层4神经元的前馈神经网络,激活函数ReLU,损失函数Huber,避免过拟合采用权重衰减和早停。
模型训练与评价方法 [page::7][page::8]
- 采用扩展窗口和滚动窗口两种训练策略分别训练模型。
- 区分价外(OTM)和价内(ITM)期权,重点关注OTM中深价外和低价格期权的表现。
- 评价指标以均值绝对百分比误差(MAPE),考虑不同价格水平分组和测试期分段。
核心结果与模型表现比较 [page::8][page::9][page::10][page::11][page::13][page::14][page::15]
- NN在所有模型中预测精度最高,特别是在含不含Black-Scholes价格特征时均表现稳健,且在高波动及深价外期权区间领先。
- RF表现高度依赖Black-Scholes输入,移除该特征后预报能力显著下滑且不稳定。
- LR泛化能力最差,广泛落后于NN和RF。
- 扩展窗口训练保持性能稳定,滚动窗口能更快适应市场变化但NN表现波动较大。

细分价外区间模型表现 [page::18][page::19][page::20][page::21][page::22][page::23][page::24][page::25][page::26]
- MAPE随期权价外程度加深明显上升,所有模型均难以准确拟合极深价外期权。
- NN表现出较强的灵活性和抗干扰能力,即使去除Black-Scholes价格输入仍表现较好。
- RF仍受限于Black-Scholes输入,表现较不稳定。
- LR表现不及其他方法,尤其在更深价外端。
模型解释性分析(SHAP)[page::33][page::34][page::35]
- SHAP价值结果说明期权剩余期限、执行价、标的指数和GARCH波动率是影响主导变量。
- 加入Black-Scholes价格会整体缩小其他特征的影响幅度,但结构不变。
- 风险事件(如2008金融危机,2020年冠病),波动率特征贡献显著增大。
- PCA结果与SHAP分析吻合,验证模型识别市场先验特征结构。

无套利条件验证 [page::36][page::37][page::38]
- 在大规模测试中,模型预测价格对执行价满足单调递减(93.5%)、凸性条件(95.1%)和剩余期限单调递增(82.9%)的比例较高。
- 违规集中于较大扰动幅度,且违规幅度较小,表明模型局部一致性良好。
- 经济约束识别为生产系统进一步改进的重要方向。
主要结论与实务启示 [page::39][page::40][page::41]
- 神经网络为非参数高灵活性模型,适用多变市场环境,黑盒透明度由SHAP解释提升。
- 展开窗口训练提供稳定估计,滚动窗口可更快响应市场动荡,但需防范模型稳定性波动。
- 深价外低价格看跌期权定价准确性关键,关系到尾部对冲策略有效性。
- 随机森林高度依赖Black-Scholes估计,在其缺失情况表现脆弱。
- 模型既兼具准确度,也具备大概率满足经济一致性,适合风险管理与情景模拟。
深度阅读
金融研究报告详尽分析报告
报告标题:Empirical Models of the Time Evolution of SPX Option Prices
作者及机构:Alessio Brini, David A. Hsieh, Patrick Kuiper, Sean Moushegian, David Ye
机构:杜克大学工程学院、商学院及数学与计算科学系
日期:暂未明确具体发布日期
研究主题:基于机器学习方法的S&P 500指数期权的价格动态演进实证模型构建与评估
---
1. 元数据与概览
本报告旨在开发并实证评估用于SPX (S&P 500指数) 期权定价的模型,能够对未来SPX路径上的期权价格进行模拟。研究团队采用了三种统计学习模型:神经网络(NN)、随机森林(RF)和线性回归(LR),利用包含期权价格、本币性(moneyness)和到期时间等期权特征及外部市场变量(指数价格历史、股息收益率和无风险利率等)为输入,训练模型以拟合期权价格函数。作者重点关注模型的无套利性质和可解释性,通过30年日频历史数据进行验证。报告核心结论指出,简单配置的神经网络模型在对期权价格预测准确性及经济一致性方面整体优于RF和LR,且无需外加无套利约束即可得到合适定价。[page::0,1]
---
2. 逐节深度解读
2.1 引言与研究背景
传统期权定价依赖于Black-Scholes-Merton模型,其假设波动率为常数,但无法刻画隐含波动率的波动微笑及期限结构等市场现象,催生随机波动率、跳跃扩散及局部波动率等模型。实务中隐含波动率曲面一般每日重构,但其动态演化多采用启发式规则模拟,缺乏系统性动态建模能力[Litterman and Scheinkman等,1991]。本研究提出以GARCH模型捕捉资产收益率波动率的时间演变,结合机器学习直接建模期权价格,而非隐含波动率曲面,从而实现期权价格与基础资产价格的联合路径模拟。强调机器学习模型在捕捉复杂非线性关系中优势及对尾部风险管理的重要性。[page::0,1]
2.2 文献综述
报告深入回顾基于神经网络的期权定价研究起点(Hutchinson et al. 1994),及近年来深度学习、递归网络、卷积网络等多种架构的应用;同时涵盖了随机波动率及复杂金融模型参数估计的深度学习融合实践(Itkin,Funahashi,Fan & Sirignano等)。此外,非神经网络机器学习方法如支持向量回归、随机森林及高斯过程等也被广泛研究。相比已有工作,报告创新在于同时系统比较NN、RF及LR三类模型的真实市场数据表现。[page::2,3]
2.3 数据集描述
数据主要为1996-2022年欧洲式SPX指数看跌期权,利用OptionMetrics数据库,经过流动性(moneyness限制50%OTM至50%ITM)、时间范围(期限1至18个月)及价格过滤,获得约457万OTM和284万ITM期权样本。数据特征涵盖实值期权特征(行权价、剩余期限)、市场环境变量(指数价格、无风险利率、股息率)、GARCH模型估计的波动率及Black-Scholes价格。GARCH(1,1)每天利用最近252个交易日数据估计波动率,以动态捕捉市场波动聚集性。报告通过图表展示了样本量随时间增长、以短期限期权为主及OTM项数量多于ITM的分布特征。[page::3,4,5]
2.4 模型构建
三种核心模型:
- 神经网络(NN):两层隐藏层,每层4个神经元,使用ReLU激活,Adam优化,固定学习率0.0001,使用Huber损失函数减轻异常值影响。训练采用标准化输入,早停法防止过拟合,未执行复杂超参数搜索以保证对比公平性。
- 随机森林(RF):集成100棵深度不超过10的决策树,通过bootstrap采样及特征随机抽样实现降噪和稳定性。
- 线性回归(LR):普通最小二乘法,回归自变量包括SPX指数、moneyness、期限、股息率、无风险利率、GARCH波动率及其交互项/二次项,有无纳入BS价格作为额外变量两种设定。
报告强调简约调参策略符合金融实务中期权模型校准的时间成本和可应用性考虑。[page::5,6,7]
2.5 实证结果
采用滚动窗口与扩展窗口两种训练测试策略,分别在不同时段反复训练和验证模型表现。实测指标主要为MAPE(平均绝对百分比误差),相对绝对误差更适合考虑不同价位期权的估价误差。
2.5.1 OTM期权
- 总体表现:含BS特征的NN和RF显著优于LR及BS模型自身,尤其深度OTM期权定价更准确。NN更灵活,即便不含BS输入也能保持较高准确度,RF对BS依赖较强。
- 时间动态:扩展窗口训练模型稳定性更好,滚动窗口NN在2008金融危机前表现波动较大,但危机后优于其他模型。RF整体表现稳定但受BS输入影响大。
- 价格区分:BS价格较低样本极大影响MAPE,划分高BS价子集后各模型误差显著下降。
- moneyness细分:期权愈深度OTM误差越大,各模型MAPE依次升高,NN实力最强,RF在无BS时表现较差。
- 所有细分均有对应图表(图2-19)反映时间演变与分组情况。
- SHAP解析显示时间到期、行权价、SPX指数为主要驱动变量,GARCH波动率在波动率极端阶段作用突出,BS特征引入后对其他变量SHAP值起缩放作用,模型解释性符合金融直觉。[page::8-26,33-36]
2.5.2 ITM期权
- ITM期权定价整体误差低于OTM。表现趋势与OTM一致:NN最优但滚动窗口训练时不稳定,RF对BS依赖明显,LR表现最弱。
- moneyness细分表明行权价对ITM定价影响更大,期权期限影响相对较弱。
- SHAP图揭示ITM期权行权价是主导特征,时间到期重要性下降。
- 对应图表(图20-24)辅助理解预测分布。 [page::27-32,33-36]
2.6 无套利条件验证
基于经济理论,期权价格应:
- 随行权价上升而单调上升;
- 随时间到期延长而单调上升;
- 相对于行权价二阶导数(凸性)为非负。
报告所用方法为逐步扰动单一输入(行权价步进5美分,期限按5%递增),分段应用相应ITM/OTM模型,再检测价格序列变化趋势及二阶差分符号。
结果显示:93.5%案例满足行权价单调性,95.1%满足行权价凸性,82.9%满足时间到期单调性,违反案例多发生在远离原始输入较大扰动时,且多数违约幅度较小,表明本模型在主训练数据邻域保持较好经济合理性。同时支持了使用本模型进行模拟路径生成的可行性。[page::36-39]
---
3. 图表深度解读
图1 数据样本特征分布
- 三幅柱状图依次展示:年份样本量激增,短期期权占多数,OTM期权数略多于ITM,分布轻微右偏。
- 数据特征展示了期权市场规模扩大和短期期权交易活跃性,为训练稳定性和覆盖面奠定基础。[page::5]

图2-7、图10-17 时间序列MAPE演化图
- 各种模型及训练策略下的MAPE波动显示,NN模型表现整体最好,尤其 BS+ 输入条件下,RF性能仅次之但对BS输入较敏感,LR最差。
- 特别关注BS价格阈值分组,低BS定价样本显著提升了误差,确认低价小额期权定价难点。
- 扩展窗口下模型趋于平稳,滚动窗口表现受市场变动影响更大。
- 图中颜色及线型分别区分模型和是否包含BS特征,有助识别BS对性能提升的贡献。[page::10-17,13-14,16-17]
图18-19 分moneyness盒须图
- 误差总体随moneyness增大(更深OTM)而增大。
- NN+相较于RF+对BS的依赖更低。
- 不同训练方法间模型表现差异明显,尤其滚动窗口NN不稳定。[page::18,26]
图25-26 SHAP特征重要性图
- 展示关键特征对NN预测输出贡献,颜色表征特征取值高低,横轴为影响方向与量级。
- 含BS特征的网络SHAP值整体缩小但结构保持一致,时点不同(2009、2015、2021)呈现波动率影响波动。
- OTM中,到期时间和行权价影响大;ITM中行权价占主导,符合金融直觉。
- SPX指数负贡献多对应市场下跌增加看跌期权价值。
- SHAP结果与PCA特征主成分分析吻合,验证统计结构和模型输出解释性一致。[page::33-36]


图28-30 无套利测试示例与结果分布图
- 图28为扰动过程中价格递增与凸性的局部示例,确认定价曲线符合无套利预期。
- 图29-30分别为违背单调性和凸性的扰动距离分布及违约幅度三维概率分布,支持模型大部分定价近似无套利,异常主要在远离训练样本边缘出现小幅违约,提示后续部署可通过局部修正解决。



---
4. 估值分析
本报告核心并非传统估值模型推导,而是通过机器学习非参数拟合实证期权价格函数。
- NN 地拟合了输入特征与期权价格之间的复杂映射,无须任何特定参数估计念和解析模型假设。
- RF基于树的集成模型用于对比,但依赖BS价格辅助回归。
- LR作为线性基准模型,纳入多项变量及BS价格改进表现。
采用GARCH模型模拟基础资产波动率的动态作为输入保证模型考虑波动集聚效应,[page::4-6]
---
5. 风险因素评估
风险主要体现在模型稳定与无套利一致性方面:
- NN模型滚动窗口训练表现波动较大,尤其危机前后和波动剧烈期间,可能导致实际使用中拟合不稳定。
- RF模型依赖于BS特征输入,对无法准确计算BS价格的新兴标的风险较高。
- 不符合无套利条件的定价虽少(<7%),但皆发生于特征扰动较远区域,实际交易中风险控制仍需增加局部约束或后期调整。
报告未详细讨论缓解策略,但指出未来工作可考虑无套利约束加入及混合模型,提升经济一致性。[page::39-40]
---
6. 批判性视角与细微差别
- 报告恪守客观实证,评价了各模型优缺点,未对深度学习模型做过度夸大,表明其在训练集中表现强于传统模型但在滚动窗口下存在稳定性问题。
- NN模型对BS特征依赖较弱表明其学习潜力,但较小神经元规模模型可能限制表现极限,大规模模型优化或效果更佳,未来待探索。
- 数据集过滤和时间窗口设置虽然合理,仍可能限制模型对极短期(<1个月)及极长期期权的泛化能力。
- 无套利条件测试的忽略局部极小异常及模型边缘稳定性提出后续改进空间。
- 报告对机器学习模型的可解释性进行了较好尝试,结合SHAP与PCA增加模型透明度,强化研究信度。
---
7. 结论性综合
本研究通过长期海量的SPX指数看跌期权实证数据,构建和评估了一种基于机器学习(神经网络、随机森林及线性回归)融合GARCH波动率和传统Black-Scholes价格的期权定价模型。核心贡献包括:
- NN在含BS输入时表现最优,尤其对深度OTM和高波动市场定价准确度突出,兼具较强的弹性及较强的经济逻辑一致性;
- RF次之,但强烈依赖Black-Scholes价格输入,脱离该依赖后性能显著恶化,实务中应谨慎选用;
- 线性模型表现最差,难以捕获非线性复杂关系;
- 扩展窗口训练提供了稳定性优于滚动窗口的方法,但滚动窗口有助于快速适应市场变化;
- 低价OTM期权对整体误差贡献大,合理定价该区间有助提升风险管理,尤其尾部风险对冲策略;
- 模型预测基本满足无套利的单调性和凸性约束,表明输出在经济上合理,适用于路径模拟和风险评估场景;
- SHAP解释性分析赋予模型良好的可解释结构,与PCA分析结果相吻合,有助模型透明化和信赖度提升。
该研究为基于机器学习的期权动态定价及风险管理提供了方法论基础和实证验证,指出未来可在无套利约束融合、多资产扩展、流动性特征整合及深度模型超参数调优方向上拓展工作。其框架适合用于尾部风险对冲、应力测试和情景生成的金融工程应用中。[page::0-41]
---
总结
本报告具备扎实的理论和数据基础,针对SPX指数看跌期权构建了一个融合GARCH动态波动率和机器学习技术的定价框架。神经网络以较小规模结构在保持较好预测准确率的同时实现了市场无套利特征的捕获,优于传统线性和树模型,表明机器学习具备替代经典参数模型的潜能。详细的训练策略比较、分组评价及模型解释性分析极大地增进了研究的实用价值和学术价值。附带丰富的图表和统计分析支撑了结论的合理性和稳健性。可为金融机构风险管理和定价模型选择提供重要参考。