Using Deep Residual Networks to Price Petrobras European Options: A Comparison with the Black-Scholes Model
创建于 更新于
摘要
本报告基于巴西Petrobras欧式期权的历史数据,构建深度残差神经网络模型进行期权定价。通过自定义混合损失函数结合市场数据和Black-Scholes模型,模型在3至19巴西雷亚尔价格区间的平均绝对误差(MAE)较Black-Scholes减少64.3%,表现更优且对长期到期选项的预测更加精准,揭示了深度学习在金融定价建模的潜力与局限性 [page::0][page::6][page::9]。
速读内容
- 研究背景及动机 [page::0][page::1]
- 采用深度残差网络解决Petrobras欧式期权定价问题。
- Black-Scholes(BS)模型为传统定价框架,但在较长期权定价准确度下降。
- 数据采集与处理方法 [page::2][page::3]
- 通过Python爬虫技术(Selenium及HTTP请求)自动化从巴西证券交易所(B3)获取了2016年至2025年8年数据。
- 数据包含期权合约信息、Petrobras股票价格、波动率及巴西央行SELIC利率,经过清洗与合并形成训练集。
- 模型结构及训练细节 [page::4][page::5]
- 网络输入五个特征:$\ln(S)$,$\ln(K)$,剩余到期时间(tte),波动率(vol)及利率(selic_rate)。
- 设计结合批归一化、Leaky ReLU激活、残差连接的深度神经网络结构减少训练难题和过拟合。
- 采用结合市场实际价格与Black-Scholes理论估计的加权混合损失函数进行训练。
- 使用Adam优化器与Optuna框架进行超参数调优,最终选择256隐藏层大小,0.2414的丢弃率及较低权重衰减。

- 训练表现及模型收敛 [page::5][page::6]
- 训练和验证损失均呈下降趋势,表明良好的训练收敛性。


- 模型与Black-Scholes比较 [page::6][page::7]
- 基于测试集,深度网络在总体MAE上优于Black-Scholes模型。
- 3至19巴西雷亚尔价格区间内,MAE减少约64.3%,覆盖了43.41%的Petrobras期权交易量。
- 不同到期时间(1、2、3个月)均表现出优越性,且模型对较长期权的价格预测尤其准确。


| 期限类别 | MAE(深度学习) | MAE(Black-Scholes) |
|---------|----------------|--------------------|
| 1个月 | 1.2873 | 1.9975 |
| 2个月 | 1.3663 | 2.0596 |
| 3个月 | 1.1932 | 2.0089 |
| 3-19区间 | 1.3047 | 2.0295 |
- 预测价格趋势及案例分析 [page::7][page::8]
- 深度网络预测的日均价格更贴近实际市场价格,BS模型在特定低价约5巴西雷亚尔的合约(如PETRL36、PETRL410)严重低估价格。


- 模型局限与未来展望 [page::9]
- 深度学习模型在3-19巴西雷亚尔外价格区间存在过度估计现象。
- 对极端市场情形泛化能力有限,仍受训练数据偏差影响。
- 未来可尝试针对不同价格区间与到期时间设计专项模型,优化准确率和稳健性。
深度阅读
元数据与概览 (引言与报告概览)
报告标题与作者
本论文由Joao Felipe Gueiros、Hemanth Chandravamsi及Steven H. Frankel合作完成,均来自以色列理工学院机械工程系。该论文提交于2024年,研究主题聚焦于应用深度残差网络(Deep Residual Networks,ResNet)进行巴西石油巨头Petrobras的欧洲期权定价,并与经典的Black-Scholes模型进行性能对比。
研究核心论点
本文旨在探讨深度学习技术,特别是基于残差网络的模型,是否能在有限资源条件下实现或超越Black-Scholes模型在Petrobras期权定价上的准确度。作者设计了基于八年巴西证券交易所(B3)历史数据的深度学习训练流程,采用自定义的混合损失函数,结合市场价格与理论分析结果进行模型指导。测试结果显示,深度网络在3-19巴西雷亚尔价格区间内相较于Black-Scholes模型,平均绝对误差(MAE)降低了64.3%,并且其对较长期权有效期的定价准确性表现优于Black-Scholes模型。作者强调了深度学习在金融建模中的潜力,并提出未来研究方向包括为不同价格区间开发专门模型。[page::0,1,2]
逐节深度解读
1. 引言
报告回顾了期权定价的历史和重要性,指出Black-Scholes模型作为传统理论基石,假设资产价格服从随机游走且为高斯分布,并导出了经典的Parial Differential Equation(PDE),结果可得封闭解。尽管Black-Scholes计算简单且理论成熟,但其在某些市场环境下,尤其是美国式期权和长期期权的精确度仍有限。作者进一步指出通过利用深度神经网络直接预测期权价格是一条可行的路径,其复杂性和适应性可能克服传统模型的限制。引用了大量既往基于神经网络的期权建模研究,从最初的单隐藏层MLP到复杂的残差网络架构的演进,强调了深度学习基于大量数据和自动特征提取的优势。[page::0,1]
2. 数据收集与预处理
本节详述数据源、采集难度与数据清理流程。由于缺乏公开统一的巴西B3期权数据接口,研究者采用了基于Python的自动化数据下载策略:先尝试Selenium模拟人工浏览器操作因被浏览器限制未果,后成功通过分析B3网站文件直链格式,实现HTTP多线程请求批量批价下载数据,显著提升效率。所采集数据涵盖2016年11月至2025年1月的约八年区间,包含期权合约、标的股票价格、股息、巴西官方利率(SELIC)。
数据清理步骤包括:
- 批量解压B3原始压缩文件(.ex转.zip),统一整理为结构化文本;
- 过滤只含Petrobras PETR相关的欧洲期权,并剔除过期合约,保留到期日在1-3个月的短中期合约;
- 计算股票波动率:用21日滚动标准差乘以交易日年化因子$\sqrt{252}$;
- 数据关联将每个期权对应的交易日期与最近的股票价格、波动率和利率匹配;
- 最终生成单一整合CSV数据集,含交易日期、行权价、期权价格等基本字段。
此细致的采集和预处理策略保证数据的准确对应和时间序列连续性,为模型训练提供了基础数据保障。[page::2,3,4]
3. 方法论
3.1 模型架构
借鉴Ke和Yang 2019的深度学习架构设计,作者选择了以$\ln(S)$(标的资产价格对数)、$\ln(K)$(行权价对数)、有效时间(time-to-expiry, tte)、波动率、利率为神经网络输入,输出目标为欧式看涨期权价格,符合Black-Scholes方程结构变量。神经网络采用启发于计算机视觉中的深度残差网络(ResNet)设计,包含三层全连接层,每层后带有批标准化(Batch Normalization)和LeakyReLU激活,且在第一层到第三层间引入残差连接,有助于缓解深层网络训练中的梯度消失和信息阻断问题。网络还引入dropout层抑制过拟合,形成轻量级且稳健的模型,适合计算资源有限的场景。[page::4]
3.2 损失函数与训练过程
提出了一种混合损失函数,结合两个均方误差(MSE)项:一项基于市场价格观测值,另一项基于Black-Scholes理论价格。定义二元掩码$\gamma_i$来识别市场价格的可靠性(价格大于0.1才认为可靠),根据此掩码对损失加权,在可靠市场价时优先学习实证数据,反之则用理论模型平滑指导。这种设计既保证了数据驱动的灵活性,也保留理论约束以防离群数据影响训练。训练采用Adam优化器,利用Optuna做超参数调优,调整学习率、隐藏层宽度、dropout概率及权重衰减等。最终模型以25个epoch,结合早停策略得到。[page::4,5]
4. 结果与讨论
4.1 超参数优化与训练表现
多条训练试跑轨迹(图2)表现各自收敛趋势,选定的最佳超参数包括较低学习率($5.74 \times 10^{-5}$)、隐藏层256个神经元、中等dropout和极小权重衰减,显示权重衰减正则化作用有限。最终训练过程中(图3)验证损失整体下降,训练过程稳定,未见明显过拟合迹象,但验证损失波动表明模型仍有提升空间,需要谨慎调优。[page::5,6]
4.2 与Black-Scholes模型比较
- 从整体误差(MAE)角度看(图4),在训练验证集上神经网络明显优于Black-Scholes;但在测试集上,神经网络MAE略高,需结合后续细分价格区间分析。
- 分拆分析按期权到期时间(一、二、三个月)和不同价格区间(1巴西雷亚尔的区间划分),神经网络普遍在3至19巴西雷亚尔价格区间表现优异,MAE减少64.3%(表3),覆盖43.41%的市场交易量,表现稳健且优于Black-Scholes(图5)。
- 而在价格明显高于或低于此区间时,神经网络倾向于高估期权价格,表现出一定的局限性。
- 日均期权价格预测对比(图6)显示神经网络预测更接近实际市场均值,Black-Scholes则低估明显。
- 在查看最优与最劣标的预测结果(图7)时,某些标的(如PETRL36、PETRL410、PETRD397及PETR409)被Black-Scholes严重低估但被神经网络准确捕捉,展现神经网络捕捉市场非线性及波动率微观特征的优势。[page::6,7,8]
4.3 讨论
总结指出,深度学习模型在3-19巴西雷亚尔价格区间的表现卓越,显著优于经典Black-Scholes,但对超出该区间的预测存在系统性偏差(过高估计)。神经网络的意外优点是对较长到期期权的准确率更高,这与传统金融理论预期相反。模型局限还包括泛化能力不足,特别是在极端价格环境下。此外,数据集以及定价市场存在的异质性和波动性使得模型难以完美拟合所有情况。作者建议未来可通过为不同价格区间与到期时间定制专门模型,提升整体定价准确度。[page::9]
图表深度解读
- 表1 (B3文件格式规范)
描述了期权原始数据文件中各字段含义与格式,为数据预处理提供依据,明确了选取PETR、欧洲期权及字段间分隔符等具体合约筛选标准。[page::3]
- 表2 (样本CSV数据)
展示了训练数据集部分样本格式,包括交易日期、期权代码、合约类型和期权价值等,直观感受数据结构及清洗后的整洁。[page::4]
- 图1 (神经网络结构示意)
左图为5输入、若干隐藏层及1输出的深度神经网络示意,右图展示残差连接设计,推动更深层网络稳定训练。采用批量标准化、LeakyReLU和dropout等,提升学习效果与泛化能力。[page::4]
- 图2 (超参数搜索训练曲线)
展示用Optuna框架在不同训练试验中,验证损失随epoch的变化。曲线波动显著,展示超参数组合对模型训练稳定性和收敛性的影响。利用该数据筛选得最佳超参数组合。[page::5]
- 图3 (最终训练与验证损失随时间变化)
显示25轮训练中损失的整体趋势,训练集损失稳定下降,验证集有所波动但仍呈看下降趋势,表明模型未明显过拟合且训练充分。[page::6]
- 图4 (整体MAE对比柱状图)
左图(验证集)神经网络MAE明显低于Black-Scholes,右图(测试集)情况逆转,Black-Scholes略优。此对比强调需更细分误差分析。[page::6]
- 图5 (按期权到期时间和价格区间分的MAE对比柱状图)
验证集(上排)神经网络在3-19巴西雷亚尔范围内的MAE显著低于Black-Scholes,而价格区间外表现欠佳。测试集(下排)趋势类似,凸显模型在核心交易区间优势及边缘劣势。[page::7]
- 表3 (按到期期限分的MAE数值对比)
呈现各到期期限神经网络均优于Black-Scholes,整体提示模型能跨短中期期权保持准确的预测。[page::7]
- 图6 (每日平均价格实际值与预测对比散点图)
直接对比神经网络预测(红点)、Black-Scholes估计(绿方块)与实际价格(蓝三角)的分布,神经网络整体贴近真实值,Black-Scholes估计普遍偏低,尤以验证集更明显。[page::8]
- 图7 (按期限分的部分最佳及最差标的对比柱状图)
针对1、2、3个月期权,分别列出模型表现最佳和最差的10个标的期权价格预测对比。图示神经网络在多数标的维持较好拟合,而在少数标的或测试集上仍有一定偏差,揭示模型优缺点。[page::8]
估值分析
报告未采用直接利用Black-Scholes PDE的数值求解法或复杂金融衍生估值法,而是采用监督学习框架,基于历史市场数据实现期权价格的直接预测。估值指标主要以“平均绝对误差(MAE)”衡量,强调预测的偏差绝对值大小,易于理解和反映模型实用效果。
所用损失函数是均方误差的加权混合,体现出深度神经网络训练中理论模型与市场数据兼顾的策略,既防止模型过度拟合噪声数据,也兼容价格的实际波动。
超参数调优的关键包括网络层数、节点数、学习率和正则化等,对于提高模型泛化能力和准确性具实质性影响,报告中使用Optuna完成了系统搜索。权重衰减影响较小,说明依据实证数据调整dropout等其他正则手段更重要。[page::4,5]
风险因素评估
- 数据获取与质量风险:由于数据采集依赖于网络爬虫和HTTP请求,存在数据缺失、下载失败、格式异常等潜在风险,尤其是历史数据覆盖广泛且格式复杂,处理错误会直接影响模型准确率。[page::2,3]
- 模型泛化性风险:深度学习模型对未见过的极端市场情况表现不佳,尤其价格位于3-19 BRL区间外的合约预测偏差较大,说明模型受限于训练数据分布,对异常数据缺乏鲁棒性。[page::9]
- 过拟合风险:尽管采取了dropout和早停策略,但模型训练阶段验证损失波动较大,且仅训练到25轮,暗示过拟合风险未完全规避,未来可能需要更有效的正则化或更大规模数据支持。[page::6,9]
- 市场环境变化风险:金融市场瞬息万变,训练数据基于过去八年,未来不可预知的政策、经济波动、流动性变化等因素可能导致模型失效。[page::9]
- 模型偏差风险:选择特定输入特征和损失函数策略可能导致模型在某些期权类型或期限上表现较差,存在系统性偏见。[page::4,9]
报告未明确提出风险的概率估计或缓解措施,但通过混合损失函数设计和分区间模型分割建议,尝试减轻部分风险影响。[page::4,9]
批判性视角与细微差别
- 报告虽充分展示深度学习模型在特定价位区间的优势,但对其他价位区间表现的不足讨论较为简略,缺乏深入分析模型失效机制及潜在的解决方案。
- 虽然采用了混合损失函数平衡市场数据与理论价格,但对其权重动态调整机制的细节说明有限,缺乏对不同情形下损失权重影响的定量分析。
- 神经网络结构设计借鉴了视觉模型残差网络,但金融时间序列数据特性与图像数据有本质差异,残差连接如何具体适应金融数据的非时序特征尚未明确阐述,存在理论与实践结合不足之感。
- 模型泛化能力和过拟合风险提及有限,尽管训练过程设置早停和dropout,缺乏对验证集外市场环境变化的检测及模型稳健性实验。
- 该研究是基于一个特定市场(巴西及Petrobras),结果对多样化市场和其它资产的泛化能力未展开研究,限制了结论的普适性。
- 数据采集过程受到硬件条件限制,模型受限于相对低配的RTX4060 GPU,虽体现了资源受限情况下的可行性,但这可能影响模型复杂度及潜在表现,未提供更高配置下的对比。[page::1,4,5,9]
结论性综合
本报告系统地评估了运用深度残差网络对巴西Petrobras公司欧式看涨期权进行定价的可行性,结果表明相比经典Black-Scholes模型,深度学习模型在3-19巴西雷亚尔价格区间内表现出显著提升,MAE降低64.3%,覆盖市场交易的43.41%,且在特定较低价格合约中有效克服了Black-Scholes模型的低估问题。数据获取采取创新且高效的多线程HTTP请求自动下载方案,构建了高质量、时间跨度长的数据集。模型结构基于残差连接,结合批量标准化、LeakyReLU激活和dropout,制衡了学习深度与过拟合风险。混合损失函数设计巧妙平衡了市场价格数据与理论估计。
实验中,深度学习模型对较长有效期期权的预测精度优于Black-Scholes,这一逆向趋势颇具启发意义。训练过程显示模型展现出良好的收敛态势,但仍存在一定波动,暗示未来需加强正则化和泛化能力训练。同时模型在价格极值区间泛化能力不足,表现价格偏高,提示需针对不同期权价格区间开发独立模型。
图表数据支持了上述结论:
- 图5中价格区间精细误差分布直观展现了神经网络的优势范畴;
- 图6中日均价格预测贴近真实值,体现模型的现实适应能力;
- 图7对个别最优与最差标的的精准刻画揭示了模型细节表现。
整体而言,本研究证实了即使在相对有限计算资源下,设计合理的深度学习模型亦能有效捕捉金融市场复杂非线性定价机制,成为传统理论模型有力补充,尤适合特定市场及价格段的期权定价问题。未来工作应聚焦于模型泛化能力、跨价区细分模型、以及更丰富金融变量的挖掘,以进一步提高定价准确度和实用价值。[page::0-9]
---
此分析基于完整报告逐节细读,结合图表数据透彻剖析,旨在为金融量化与机器学习研究者提供深入理解和评价依据。