Enhancing Fourier pricing with machine learning
创建于 更新于
摘要
本报告提出通过机器学习间接预测傅里叶定价方法中的调节参数(如截断区间和项数),实现对Heston模型欧洲期权定价的高效且具有误差控制的快速计算。该方法无需针对不同误差容忍度重复训练,显著提升计算速度,数值实验显示随机森林和神经网络均能准确估计参数并得到近乎100%的定价准确率,机器学习相比传统数值方法提速近百倍 [page::0][page::1][page::4][page::7][page::8][page::9]
速读内容
- 研究背景及问题:传统傅里叶定价方法(Carr-Madan公式、COS方法)对调参需求高且计算复杂,直接用机器学习预测期权价格缺乏误差控制且需重复训练 [page::0][page::1]
- 主要创新:本报告采用机器学习预测傅里叶方法中的调节参数($ \mu8 $和积分$ I{20} $)而非期权价格,支持任意误差容忍度下无须重训练,实现快速且误差可控的定价机制 [page::1][page::3][page::4]
- Heston模型和傅里叶方法基础:
- 描述Heston随机波动率模型的股票价格过程,给出特征函数表达式 [page::1][page::2]
- COS方法原理:基于特征函数傅里叶余弦展开近似标的对数收益的概率密度,价格通过有限项级数求和计算,关键在于截断范围L和项数N的选择 [page::2][page::3]
- 设定L和N的公式依赖$ \mun $(n阶矩)和积分$ Is $,但数值计算尤其在Heston模型中非常耗时 [page::3][page::4]
- 机器学习方法选用及说明:
- 采用决策树(DT)、随机森林(RF)、神经网络(NN)三种技术,其中RF和NN表现最佳,DT虽较简单但也具备较高准确率 [page::4][page::5]
- DT通过递归划分输入特征空间,利用方差减少实现回归 [page::4][page::5]
- NN使用多层神经层,激活函数为Sigmoid,辅以正则化技术(Dropout、Gaussian噪声等)提升泛化能力 [page::5]
- 图示:DT树结构示例

- 数值实验设计与结果:
- 训练集由25万个参数配置样本组成,实际应用Heston模型采样,剔除不满足条件样本,选取10万用于训练验证,5万测试 [page::5][page::6]
- 针对参数$ \mu8 $和$ I{20} $的预测,NN在$ \mu8 $上MSE最低,RF对$ I{20} $预测效果最优,深树(bDT)表现一般,浅树(sDT)表现仍然不错 [page::7]
| 参数 | RF | NN | bDT | sDT |
|-------|----------|----------|----------|----------|
| $\mu8$ | 0.0703 | 0.0058 | 0.2764 | 2.2390 |
| $I{20}$ | 33.6615 | 44.2353 | 49.0372 | 61.9859 |
[page::7]
- 价格准确率统计(以COS方法为例,不同误差容忍度$\varepsilon$):
- 解析计算和随机森林估计均达100%准确率,NN约99.98%,bDT约99.96%,sDT仍超过98%准确率 [page::8]
| ε | 解析计算$\mu8$ & $I{20}$ | RF估计$\mu8$ & $I{20}$ | NN估计$\mu8$ & $I{20}$ | bDT估计$\mu8$ & $I{20}$ | sDT估计$\mu8$ & $I{20}$ |
|-------------|----------------|----------|----------|----------|----------|----------|----------|----------|----------|
| $10^{-4}$ | 100% | 100% | 100% | 100% | 99.988% | 99.986% | 99.976% | 98.824% | 98.512% |
- 计算效率对比:
- 直接解析计算$ \mu4 $及$ I{20} $耗时约0.011秒,COS方法纯定价耗时$2.34\times10^{-4}$秒
- 使用机器学习估计$ \mu8 $及$ I{20} $耗时仅为传统方法的1~2毫秒级别,整体COS定价流程约提升近百倍速度 [page::8]
| 计算方式 | 平均CPU时间(秒) |
|-------------------------|------------------|
| 解析计算$\mu4$+$I{20}$ | 1.122e-2 |
| RF估计$\mu8$+$I{20}$ | 6.921e-4 |
| NN估计$\mu8$+$I{20}$ | 7.056e-5 |
| bDT估计$\mu8$+$I{20}$ | 2.607e-6 |
| sDT估计$\mu8$+$I{20}$ | 2.036e-6 |
- Carr-Madan公式调参机理及结果:
- 用NN和RF预测最优阻尼因子$\alpha$和网格数N,精度显著优于默认参数组合
- 实现90%以上样本达到误差容忍度$10^{-7}$,远胜于使用固定参数仅18.3%样本达标 [page::9]
- 结论:
- 间接使用机器学习预测傅里叶定价算法调参参数,兼顾精度与计算效率,支持灵活误差控制
- RF和NN表现优异,DT简单且速度快,均满足实际应用需求
- 本方法相较于直接用机器学习预测期权价格的方式,不需重训练且有误差保证,较传统数值方法快百倍以上 [page::9]
- 附录提供了深度5的决策树具体拆分规则和用R实现COS方法的小样例代码,方便模拟和复现 [page::10][page::13]
深度阅读
深度详尽分析报告:《Enhancing Fourier pricing with machine learning》
---
1. 元数据与概览
- 报告标题:Enhancing Fourier pricing with machine learning
- 作者:Gero Junike,Hauke Stier
- 发布日期:2024年12月9日
- 主题:结合机器学习技术改进基于傅里叶方法的欧洲期权定价,尤其是Heston模型下的COS方法和Carr-Madan方法。
- 核心论点:
- 传统快速傅里叶方法(FFT)如Carr-Madan公式与COS方法在高级模型(如Heston随机波动率模型)下表现优良,但其调参(阻尼因子、截断范围、项数等)需耗费大量计算资源或经验法则,且调参难以控制误差。
- 现有通过机器学习直接预测期权价格的方法虽加速计算,误差不可控,且误差要求变化时必须重新训练模型。
- 本文创新性提出通过机器学习预测傅里叶方法的调参参数而非期权价格,从而实现高速且具备全误差控制能力的定价算法。此方法无需针对不同误差要求重新训练,适用面更广泛。
- 整体目标:构建一种结合机器学习精确预测傅里叶方法核心调参参数的框架,在保证误差界限的同时实现高效定价。
- 实验基础:以Heston模型为基础,通过数值实验验证提出方法的速度与准确性优势。
---
2. 逐节深度解读
2.1 摘要(Abstract)
- 提出问题:傅里叶定价经典方法存在调参难题,机器学习直接定价方法误差难控。
- 创新点:用机器学习学习傅里叶方法中调参参数(如COS方法的截断范围、项数),而非期权价格本身。
- 优势:快速,误差可严格控制且无需重新训练,即可适应任意误差容忍度。
- 关键词:机器学习、计算金融、期权定价、傅里叶定价、误差控制、Heston模型 [page::0]
2.2 引言(Section 1)
- 回顾傅里叶定价:Carr-Madan公式与COS方法在金融定价中历久弥新。
- 现有机器学习定价研究(如Liu et al. (2019a,b),De Spiegeleer et al. (2018))虽加速定价,但准确度有限(MAE约\(10^{-4}\)),且误差与网络深度及训练样本量高度相关,误差控制不充分;需针对不同误差水平重复训练,效率低下。
- 本文提出策略:通过机器学习学习傅里叶方法中关键参数(截断区间和项数)的依赖关系,将误差控制交给传统傅里叶方法,使算法既快又可控。 [page::0,1]
2.3 方法论与相关背景(Sections 1–3)
Heston模型(Section 2)
- 介绍Heston随机波动率模型的基本形式,包含价格与方差的隶属随机微分方程,强调Feller条件保证方差过程非负。
- 给出对数股价的特征函数闭式表达,这是傅里叶定价的基础。 [page::1,2]
傅里叶定价方法详释(Section 3)
- Carr-Madan公式:利用特征函数,通过一个带阻尼因子的傅里叶积分计算期权价格。积分区间需截断,积分数值解通常用Simpson等规则处理。重要参数:阻尼因子 \(\alpha\),截断点 \(M\),积分点数 \(N\)。
- COS方法:整个方法基于对对数收益的概率密度函数(pdf)进行Cosine级数展开,用有限项在有限区间展开pdf的截断近似,利用特征函数快速计算Cosine系数 \(ck\)。
- 关键步骤:确定截断区间 \([-L,L]\) 和展开项数 \(N\)。
- 精确选择 \(L,N\) 以达到误差容忍度 \(\varepsilon\) 需通过特征函数的高阶矩(导数)和积分指标计算,然而计算代价较高。
- 用半重尾性质结合Markov不等式估计截断区间,计算公式依赖于特征函数的第\(n\)阶导数和某数值积分。典型取\(n=4,6,8\),积分次方取\(s=20\)以优化性能。
- 机器学习技术简介:描述三种机器学习算法(决策树DT、随机森林RF和神经网络NN)的基本原理与优势。
- 决策树参数划分,基于方差减少进行回归。
- 随机森林利用多个决策树进行集成,提升稳健性和准确度。
- 神经网络结构、激活函数(ReLU、Sigmoid等)、正则化手段(丢弃法、噪声、批归一化)说明。
- 强调学习目标并非直接预测价格,而是学习特征函数的高阶导数及积分指标,从而推导截断区间和项数。 [page::2,3,4,5]
2.4 数值实验(Section 4)
训练集构建
- 使用均匀分布随机生成Heston模型参数,参数区间覆盖常见实际应用(见表格,含均值回复速度 \(\kappa\)、均值回复水平 \(\theta\)、波动率波动率 \(\xi\)、相关系数 \(\rho\)、初始波动率 \(v
- 对参数进行筛选,剔除不满足Feller条件及无效高阶矩的样本。
- 采用\(10^5\)样本用于训练和验证,5万用于测试。
- 采用COS方法和Carr-Madan公式极高参数精度生成基准价格,保证两个方法价格至少七位小数一致。 [page::5,6]
训练机器学习模型估计调参指标
- 分别用于估计 COS 方法中的 \(\mu8\)(第8阶矩,用于截断区间计算)和积分指标 \(I{20}\)(用于确定COS方法项数)。
- 超参数优化完成,bDT为深度大决策树,sDT为深度5小型树,RF决策树数量500~600,NN结构详见表4。
- 测试集上表现(表5):
- \(\mu8\)预测:NN最精确,RF次之,bDT差,sDT差距最大。
- \(I{20}\)预测:RF最优,NN和bDT略差,sDT最差。
- 机器学习模型的估计结果用来计算COS方法的截断区间和项数,实验显示精度满足99%以上的样本误差容忍度要求(表6)。
- 机器学习估计甚至小决策树均可以保证大部分样本的COS定价精度,而COS定价本身因误差上界策略较为保守,估计指标有较大容忍空间。 [page::6,7,8]
计算复杂度对比
- 传统基于符号/数值计算的高阶矩和积分指标计算慢,尤其积分数值计算耗时显著(约0.011秒每样本)。
- 机器学习模型计算指标速度快,尤其是小DT和bDT显著快;NN和RF相较传统方法快百倍。
- COS方法主计算耗时远低于参数估计,结合机器学习后整体定价速度提升明显(表7、8)。
- 结合实际误差设置(\(\varepsilon=10^{-4}\)),机器学习估计调忧参数+COS方法总CPU耗时约1.4e-4秒,比传统计算提升约100倍。 [page::8]
Carr-Madan方法调参
- 关键参数:阻尼因子 \(\alpha\)、截断范围 \(M\)、网格点数 \(N\)。
- 采用机器学习估计最小有效的\(\alpha\)和\(N\)参数使得误差不超过\(10^{-7}\)。
- 直接用传统经验参数(如Carr和Madan默认的\(M=1024\),\(N=4096\), \(\alpha=1.95\))时,仅约18.33%样本达到误差容忍度。
- 机器学习(NN,RF)预测后,准确率提高到90%以上显著提升,显示机器学习辅助调参效果好。
- 但预测\(N\)偶尔低估,需要双倍调整以保证精度。
- 相较COS方法的严格误差界限,Carr-Madan调参仍较敏感且误差控制稍弱。 [page::9]
---
3. 图表及表格分析
3.1 表1(机器学习示例:决策树)
- 展示了一棵简单决策树的结构,分裂特征和取值阈值,以及对应的叶子节点预测结果。
- 实例强调DT以树状条件划分输入空间,叶子节点平均输出作为预测。 [page::4]
3.2 表2(Heston模型参数范围)
| 参数 | 范围 |
|-------------------------|---------------|
| 均值回复速度 \(\kappa\) | [0.001, 10] |
| 均值回复水平 \(\theta\) | [0.001, 2] |
| 方差波动率 \(\xi\) | [0.01, 5] |
| 相关系数 \(\rho\) | [-0.99, 0.99] |
| 初始方差 \(v0\) | [0.001, 2] |
| 到期时间 \(T\) | [0.25, 10] |
- 覆盖了Heston模型中常用参数范围,确保训练数据代表性。 [page::5]
3.3 表3(DT和RF超参数)
| 参数 | bDT (I20) | bDT (μ8) | RF (I20) | RF (μ8) | sDT (I20) | sDT (μ8) |
|----------------------|------------|----------|----------|---------|-----------|----------|
| 树数量 | 1 | 1 | 500 | 600 | 1 | 1 |
| 最大树深 | 30 | unlimited| 50 | 90 | 5 | 5 |
| 最小分裂节点大小 | 8 | 6 | 1 | 1 | 5 | 5 |
- 大树(bDT)支持深度,RF使用众多树进行集成,效能与复杂度有所权衡。 [page::6]
3.4 表4(神经网络超参数)
| 参数 | 搜索范围 | NN (I20) | NN (μ8) |
|--------------|--------------------------|--------------------|--------------------|
| 隐藏层数 | 1–4 | 4 | 3 |
| 每层神经元数 | 32 到 2048 | 1024, 256, 256, 32 | 256, 128, 32 |
| 激活函数 | ReLU、Leaky ReLU、Sigmoid等 | Sigmoid | Sigmoid |
| Dropout率 | 0 到 0.5 | 0.2 | 0 |
| 噪声率 | 0.01 到 0.1 | 0.07 | 0.02 |
| 优化器 | Adam、SGD、RMSProp | Adam | Adam |
| 批量大小 | 128, 256, 512, 1024 | 512 | 256 |
- NN结构较深,激活函数均为Sigmoid,合理正则化确保泛化能力。 [page::7]
3.5 表5(不同ML方法MSE对比)
| | RF | NN | bDT | sDT |
|-----------|---------|---------|---------|----------|
| \(\mu8\) | 0.0703 | 0.0058 | 0.2764 | 2.2390 |
| \(I{20}\) | 33.6615 | 44.2353 | 49.0372 | 61.9859 |
- NN在\(\mu
3.6 表6(COS方法价格准确率)
- 涵盖各种误差容忍度 \(\varepsilon = 10^{-1} \) 到 \(10^{-7}\)
- 机器学习预测参数均能保证约99%以上样本获得目标准确度,RF和直接计算几乎100%。
- 简单决策树虽略低,依然有98%以上准确率。
- 说明训练模型虽近似,因算法容错机制,依旧能实现高准确度。 [page::8]
3.7 表7(COS方法核心计算CPU时间)
| \(\varepsilon\) | \(L(\varepsilon,\mu4)\) (秒) | \(L(\varepsilon,\mu8)\) (秒) |
|--------------|-----------------------------|-----------------------------|
| \(10^{-2}\) | \(5.89 \times 10^{-5}\) | \(3.38 \times 10^{-5}\) |
| \(10^{-3}\) | \(1.15 \times 10^{-4}\) | \(4.66 \times 10^{-5}\) |
| \(10^{-4}\) | \(2.34 \times 10^{-4}\) | \(6.67 \times 10^{-5}\) |
- 使用\(\mu
3.8 表8(计算\(\mun\)和\(I{20}\)所需CPU时间)
| 计算方式 | 时间(秒) |
|-----------------------------|-----------------|
| \(\mu4\)和\(I{20}\) 直接计算 | \(1.122 \times 10^{-2}\) |
| \(\mu8\)和\(I{20}\) RF估计 | \(6.921 \times 10^{-4}\) |
| \(\mu8\)和\(I{20}\) NN估计 | \(7.056 \times 10^{-5}\) |
| \(\mu8\)和\(I{20}\) bDT估计 | \(2.607 \times 10^{-6}\) |
| \(\mu8\)和\(I{20}\) sDT估计 | \(2.036 \times 10^{-6}\) |
- 机器学习估计速度提高百倍以上。 [page::8]
3.9 图1(决策树示例图)
- 清晰展示简单树的节点划分过程,符合表1。
- 图示从顶节点判断变量\(T\)是否小于0.101999,决定左右子树,降低数据方差。 [page::5]
---
4. 估值分析
本报告重点在于提高已有傅里叶方法的参数估计和定价效率,而非对期权价格作具体估值预测,因此无传统估值模型(如DCF)应用。
- 估值方法:基于傅里叶积分和COS展开,通过特征函数反演概率密度,结合计算高阶特征量,来估计截断区间和展开项数,实现控制误差和加速计算。
- 输入参数:Heston模型参数、期权执行价、到期时间、利率。
- 估值核心假设:Heston模型特征函数已知且准确;密度半重尾使得Markov不等式等能有效界定截断区间。
- 通过机器学习映射:利用ML学习模型参数到特征函数高阶导数及积分值的函数映射,快速获得COS方法所需的参数配置。
- 精度控制:通过误差容忍度显式指定,保证定价误差在给定范围内。
- 方法比较:机器学习间接估参优于现有直接预测期权价格的机器学习方法,避免了误差不可控和重复训练。 [page::1–9]
---
5. 风险因素评估
- 误差控制风险:直接用机器学习预测期权价格的模型误差不易控制,且误差容忍度改变需重新训练,成本高且风险大。
- 模型参数范围:输入的参数范围过宽或不符合Feller条件(如方差过程不满足正稳定条件)会导致高阶矩不存,影响结果准确性,报告中通过筛选剔除异常参数,降低风险。
- 机器学习误差风险:虽然RF和NN表现优秀,但仍存在少量样本误差未达标(尤其在Carr-Madan的调参中)。方法未必对所有极端市场情况表现同样好。
- 数值积分风险:对基准数值积分方法计算时间长且可能存在数值稳定性问题,报告未深入讨论积分计算的数值稳定性。
- 模型假设风险:Heston模型是面向实际资产价格波动,但任何模型简化均存在误差,调参方法依赖精确特征函数,模型失配可能带来误差。
- 缓解措施:报告通过终端实验测试与Feller条件筛除减少异常案例的风险,机器学习模型通过验证集和测试集评估泛化能力。文中未详细披露更多缓解策略。 [page::6–9]
---
6. 批判性视角与细微差别
- 创新性的间接机器学习:将机器学习用于调节傅里叶方法参数而非直接定价,规避了直接定价中误差不可控的问题,客观有效。
- 存在潜在限制:
- 机器学习估计的参数虽准确率高,但依赖训练数据的代表性及质量。某些极端参数区域可能性能不足。
- Carr-Madan公式调参效果不如COS方法稳定,因其调参参数对价格影响更敏感,采用简单倍增策略提升准确率,但该策略未必最优。
- 误差控制严格性受限于理论计算公式的保守性,实际可能存在估算冗余,尽管带来良好精度。
- 神经网络等模型训练细节(如训练样本分布、过拟合风险)在论文中并未深度探讨。
- 对比其他方法的均衡分析:报告中清晰展示了机器学习结合经典傅里叶方法的优势,相较于纯数值计算和纯机器学习均有明显提升,分析深刻周全。
- 报告内部结构合理严谨,无明显数据矛盾。 [page::0–9]
---
7. 结论性综合
本报告提出且详细实现了一种创新混合方法,即通过机器学习技术预测傅里叶定价方法(COS方法和Carr-Madan公式)的关键调参参数(截断区间\(L\),项数\(N\),阻尼因子\(\alpha\)等),而非直接对期权价格建模,从而实现了高度精准且计算效率极高的欧洲期权定价框架。
通过以下几个关键要点实现了该目标:
- 理论保障的误差控制:传统傅里叶方法提供明确定价误差边界,以理论公式驱动参数选择,实现任意误差水平的可控定价。
- 机器学习映射高阶特征指标:学习Heston模型参数映射至截断区间所需高阶矩(如\(\mu8\))及积分指标\(I{20}\)的函数,避免了耗时高阶导数和数值积分计算。
- 多种机器学习技术比较:随机森林在\(I{20}\)估计上表现最佳,神经网络在\(\mu8\)估计优异,简单决策树虽误差大但速度极快且足够实用。
- 数值实验充分验证:各种误差容忍度下机器学习估计调参均能保证COS方法定价准确度超过98%,且CPU时间较传统数值计算快100倍以上。
- Carr-Madan方法调参改进明显:借助机器学习提升该方法的参数设定精度,令90%以上样本满足高精度要求,显著优于传统固定参数方案,仅靠经验设定准确率不足20%。
- 实际应用价值突出:该方法对面向复杂模型的期权快速精准定价十分适用,为金融机构提供了可靠且高效的数值定价工具。
- 源代码及具体算法附录提供清晰实现与复现场景,有助业界进一步推广。
---
总结:
这份报告在金融量化领域提出了将机器学习与经典傅里叶期权定价方法深度融合的前沿方案,巧妙绕过了传统机器学习定价中误差不可控的瓶颈,实现了高效且具备理论误差保障的欧式期权定价方法,体现了机器学习在金融工程中的实际应用潜力和创新价值。报告的理论阐述、数值实验和算法实现环环相扣,呈现高度专业性和实证说服力,具有深远的学术与业界参考意义。
---
附件 — 关键图表展示

---
参考溯源目录
- 基础背景及方法:页0–4
- 数值实验及结果:页5–9
- 机器学习架构与性能细节:页4–7
- 算法实现与代码示例:页13–14
全文分析均基于以上页码标识严格引用满足学术规范。