Hybrid Quantum Neural Networks with Amplitude Encoding: Advancing Recovery Rate Predictions
创建于 更新于
摘要
本研报提出了一种结合振幅编码的混合量子机器学习模型,针对债券恢复率的高维、非线性、少样本预测问题,显著提升预测精度和稳定性。实证结果显示,该模型在1,725条历史数据和256特征维度的全局数据集上,较经典神经网络和角度编码量子模型分别降低了RMSE至0.228,表现稳健且训练时间更短。与XGBoost对比,该模型在留一交叉验证中略有优势,具有较强噪声鲁棒性,展示了量子机器学习在金融风险建模中的潜力。该模型兼顾了量子态的指数压缩及参数化量子电路的幺正约束,有效缓解了过拟合与计算复杂性难题,开拓了信用风险预测的新路径 [page::0][page::3][page::5][page::9][page::13][page::20][page::26][page::27][page::28][page::43]
速读内容
研究背景与问题挑战 [page::0][page::1][page::3]
- 恢复率是信用风险关键指标,传统和经典机器学习方法难以有效捕捉其复杂非线性关系与高维特征。
- 数据稀缺且样本量有限,给模型训练与泛化带来挑战。
- 机械学习过拟合风险高,传统统计模型功能有限。[page::1][page::3]
模型架构与核心创新 [page::12][page::14][page::15]
- 提出融合经典神经网络与参数化量子电路(PQC)的混合量子机器学习(QML)模型。
- 采用振幅编码将256维输入压缩进仅8个量子比特,实现指数级数据压缩,减小训练参数规模。
- PQC包含旋转门和纠缠CNOT门,构造幺正映射,有助泛化能力与稳定性。
- 完整架构包括输入预处理经典层、量子状态准备、PQC处理及测量输出四步。

- 振幅编码相比角度编码,显著减少量子比特数量与参数,提高训练速度和泛化能力。[page::14][page::15]
量化评估与比较分析 [page::20][page::21][page::23][page::24]
- 在四折交叉验证及留一交叉验证中,QML振幅编码模型RMSE最低且稳定性最高,显著优于基准的经典前馈神经网络(FNN)及量子角度编码模型。

- 统计显著性检验(Diebold-Mariano测试)显示QML振幅编码模型与FNN及角度编码模型性能差异显著,后两者对比不稳定。
- 与XGBoost对比,虽然XGBoost四折CV中RMSE稍优,但留一交叉验证显示QML模型表现更佳且方差更小,初期训练阶段QML有显著优势。

- XGBoost需要较深树与更多迭代,模型复杂度较高,训练时间较长。

量子模型优势剖析 [page::26]
- 振幅编码避免辅助降维层,保留更多信息,参数规模仅对数级增长。
- PQC的幺正变换有助减少过拟合,训练更稳定。
- 模型结构紧凑而表达力强,适合小样本、高维数据。
- 训练耗时优于角度编码方案,兼具实用潜力。
限制与未来方向 [page::27][page::28][page::29]
- 当前结果基于无噪声量子模拟,实际量子硬件噪声、退相干及量子门限制尚未完全克服。
- 振幅编码需输入为2的幂次方,实际中填充带来冗余。
- 量子硬件比特限制和深度电路对实用化构成挑战,需噪声缓解和量子纠错技术支持。
- 后续可探索多种编码方法、动态金融环境适应性和量化交易策略可行性。
额外实验与初步量子硬件测试 [page::41][page::42][page::43]
- 限于量子硬件和资源,目前仅角度编码模型在真实设备(Rigetti Ankaa-3)测试,展示一定的噪声抗扰动性。
- 振幅编码模型在带噪声模拟器上训练表现与无噪声相近,具备潜在可行性。
深度阅读
金融研究报告深度分析报告
报告标题
《Hybrid Quantum Neural Networks with Amplitude Encoding: Advancing Recovery Rate Predictions》
作者与发布机构
作者:Ying Chen, Paul Griffin, Paolo Recchia, Lei Zhou, Hongrui Zhang
机构:新加坡国立大学(多个相关中心)、新加坡管理大学、Asian Institute of Digital Finance
发表时间与主题
日期未明确给出,但报告涵盖1996-2023年的数据,且引用了2023-2024年最新文献。
主题聚焦于信用风险管理中的恢复率预测,提出基于量子机器学习(QML)的混合量子神经网络模型,并重点使用量子幅度编码(Amplitude Encoding)技术。
---
1. 元数据与概览(引言与报告概览)
本报告旨在通过引入量子机器学习技术,提供对恢复率(Recovery Rate)预测的创新解决方案。恢复率作为信用风险管理的核心指标之一,对债券投资策略中的风险评估、资产定价和投资组合优化至关重要。然而,传统模型在恢复率预测中面临非线性复杂依赖、高维特征空间以及样本量有限的问题,致使模型存在过拟合和预测偏差。本文提出一种混合量子机器学习模型,采用幅度编码(Amplitude Encoding)以利用量子态的指数压缩特性和参数化量子电路(PQC)的幺正约束,提高模型的准确性和泛化能力。
本文核心论点包括:
- 量子幅度编码在处理高维金融数据中表现出指数压缩优势,显著减少所需量子比特数。
- 混合量子经典模型在1,725条观测、256特征的全球数据集上,优于经典神经网络和基于角度编码(Angle Encoding)的QML,RMSE分别为0.228、0.246和0.242。
- 模型在模拟量子环境和噪声模拟器上表现稳定,表明其在未来实际量子硬件上应用的潜力。
- 尽管当前硬件实施存在噪声、量子比特有限等瓶颈,但该研究展示了QML在复杂金融预测任务中的长远价值。
---
2. 逐节深度解读
2.1 引言
报告开篇强调恢复率在信用风险管理中的重要性,并指出行业普遍采取的是固定恢复率假设(约40%),但实际数据存在广泛波动(0%–100%),且分布往往呈双峰结构,忽略波动性导致风险评估不准确。传统统计模型(线性回归、Logistic回归等)因假设限制和对异常值敏感,在恢复率非线性、高维、样本稀缺的实务背景下表现欠佳。[page::1] [page::2]
量子神经网络(QNN)特点包括:
- 利用Hilbert空间随量子比特数指数增长的优势,实现高维特征的紧凑表示。
- PQC的幺正性质限制模型复杂度,天然抑制过拟合。
- 文献表明在有限样本、复杂模式识别任务中优于部分经典方法,尤其是在低信噪比场景。
因此,本研究基于这一理论基础,探索QNN结合幅度编码以解决恢复率预测的挑战。[page::2] [page::3]
2.2 文献综述
传统恢复率建模主要依赖线性回归、Tobit模型、分位数回归、结构模型等,它们因需指定函数形式、对非线性与交互效应捕捉能力有限、难以处理高维数据,且在样本量有限时泛化能力较差而受到限制。[page::4]
现代机器学习方法(支持向量机、随机森林、梯度提升树、神经网络及深度学习)在捕获非线性和异质性方面取得进展,但仍面临过拟合、可解释性差以及高维数据处理限制。文献中少数尝试利用自然语言处理和市场情绪特征提升性能。[page::5] [page::6]
量子机器学习结合超位置、纠缠和幺正变换优点,展现出处理稀疏数据、高维非线性问题的潜力。已有研究表明QML在金融时间序列预测、信用评分和欺诈检测等方面具有竞争力,但实际量子硬件限制依旧显著。[page::6] [page::7] [page::8]
2.3 数据介绍
使用由新加坡国立大学UP5项目提供的全球数据,覆盖1996-2023年,包含1,725个样本和256个特征,涉及576家企业。恢复率定义为违约后30天的债券价格,符合Moody’s及S&P惯例。[page::8] [page::9]
恢复率呈明显双峰分布,基本围绕10%和100%两个峰值,中位数为42%,均值约48%,且标准差达33%,反映高度不确定性和异质性,固定恢复率假设难以准确捕捉实际波动。[page::9] [page::10]
恢复率与债券票息、到期时间等变量无明显线性关系,且在年份维度上呈波动趋势,显露经济周期效应,使得经典线性模型难胜任。[page::10] [page::11]
2.4 特征工程
特征构建包括五大类:
- 债券特征(票息、久期、债权等级、事件指标,共29项)
- 公司财务指标(如资产回报率、资产负债率,17项)
- 信用风险指标(概率违约PD、违约距离等,共78项)
- 行业、地区及货币类别虚拟变量(共98项)
- 宏观经济及市场变量(GDP增长率、通胀率、利率等,34项)
所有特征均基于文献支持,充分融入多层面风险驱动因子。[page::11] [page::12]
2.5 方法论
2.5.1 混合量子机器学习模型架构
整体模型框架包含以下步骤:
- 经典预处理层:输入256维数据(满足$N=2^n$形式),通过一个输入层和隐藏层(均为256维)利用LeakyReLU做非线性变换,生成适合量子编码的嵌入。
2. 幅度编码:利用Mottonen等方法,将经典数据映射到量子态的幅度上,256维向量用8个量子比特表示,实现指数压缩。
- 参数化量子电路(PQC):采用Strongly Entangling PQC,包含旋转门和控制非门,参数规模$O(3n)$,可表达丰富的量子态。
4. 测量与输出:对量子态中Z保利算符测量,输出映射回经典空间经输出层预测恢复率。
该混合架构兼顾经典神经网络捕获粗粒度特征与QNN实现非线性映射,弥补了单一架构的不足。[page::12] [page::13] [page::14] [page::15]
2.5.2 经典对照模型与比较
- 经典前馈神经网络(FNN)
- 采用角度编码(Angle Encoding)的QML模型,配备辅助经典层降维到量子比特数,解决量子比特限制问题
- XGBoost梯度提升树回归模型,作为强基线
表4中汇总各模型对应章节和比较设计。[page::15] [page::16]
2.6 实验设计与参数设置
- 优化方法:Adam优化器,配合PyTorch和PennyLane模拟框架,QML以经典CPU进行无噪声模拟
- 模型架构:
- QML幅度编码固定8个量子比特,将256特征编码
- FNN和角度编码QML调参以保持参数规模接近,保证比较公平
- XGBoost使用树深6,训练100棵树
- 训练均采用100轮(或对应树数),采用四折交叉验证和留一验证多重评估
- 使用Diebold-Mariano统计检验模型性能差异显著性[page::17] [page::18] [page::19] [page::20]
---
3. 图表深度解读
图1:恢复率分布直方图及核密度估计
- 展示恢复率从0到1.1的频次分布,显著双峰特征
- 主峰于10%左右,次峰接近100%
- 高波动性和尾部值说明了固定恢复率假设的局限性
- 数据直观揭示恢复率复杂非线性属性和风险多样性[page::9]

图2:恢复率与票息及到期时间的三维曲面
- 无显著线性规律,曲面呈复杂非线性形态
- 颜色渐变传递恢复率大小,强调多因素叠加效应[page::10]

图3:各违约年份恢复率均值趋势
- 恢复率随时间波动明显,反映宏观经济和市场周期
- 1997-1998年金融危机和其他周期性事件可能对应低谷[page::11]

图4和5:QML模型架构示意及编码方式
- 图4清楚展示经典预处理与量子层的结合流程
- 图5对比角度编码与幅度编码量子电路区别,后者以更少量子比特实现数据指数压缩[page::13][page::14]


图6:角度编码QML模型示意
- 经典辅助层降维,以匹配量子比特数
- 单量子位RX旋转实现角度编码
- PQC施加强纠缠,测量输出联系经典优化[page::17]

图7:经典FNN与QML(角度编码和幅度编码)模型RMSE表现及标准差
- 幅度编码QML表现最佳,测试RMSE最低且波动最小
- 角度编码次之,FNN表现最差,尤其在留一验证中差异明显
- 图右展示留一验证消除部分噪声,便于观察模型收敛与稳定性[page::21]

图8:Diebold-Mariano检验p值与统计显著性图
- 绿色块代表幅度编码QML显著优于其它两个模型(角度编码QML、FNN)
- 红色与灰色块结合显示无显著差异或劣势
- 结果表明幅度编码优势显著且稳定[page::22]

图9:幅度编码QML与XGBoost模型交叉验证与留一验证表现对比
- XGBoost更早获得较低RMSE,实验中RMSE略优于幅度编码QML
- 但XGBoost在留一验证中RMSE更高,且模型方差较大不稳定
- 幅度编码QML在训练后期表现平稳,稳定性强[page::24]

图10:幅度编码QML与XGBoost的模型显著性检验
- 多数训练轮次下未见XGBoost显著优于QML
- QML早期训练阶段显著领先[page::25]

附录图表
- FNN隐藏层规模变化对性能影响(图A1):隐藏节点增加不改善反而恶化准确度和稳定性。
- QML角度编码量子比特数变化(图A2):增加比特数后性能无显著提升,计算时间指数增加,幅度编码效率更优。
- XGBoost树深与数量变化(图A3):最佳树深为6,超深树易过拟合,训练需大量树导致复杂度增大,QML显示更优泛化。
- QPU与噪声模拟实验(图B4):虽受限于硬件和规模,初步结果示QML在噪声和真实量子处理器上表现优于经典模型,具噪声鲁棒性。
---
4. 估值分析
本报告非金融资产估值研究,但涉及模型性能评估的统计估值指标,包括:
- 均方根误差(RMSE)
- 模型参数规模(参数数量)
- 训练时间和收敛轮次
关于量子模型用到的Key概念:
- 幅度编码(Amplitude Encoding):将长度为$N=2^n$的经典向量映射至$n$ qubits的量子态幅度,实现指数压缩。
- 角度编码(Angle Encoding):将每个特征直接映射到单qubit旋转角,对高维数据扩展线性且不实用。
- 参数化量子电路(PQC):由可训练旋转门和纠缠门组成的电路结构,是QNN的核心模块。
- 强纠缠PQC:该结构能够实现高表达能力且参数量适中($O(3n)$),避免参数过多引发过拟合。
报告中多次强调了幅度编码模型的参数量远远小于传统FNN,同时对数据维度的尺度几何映射 (\(\log N\) 比\(N\)) 带来的训练稳定性和泛化能力优势。
---
5. 风险因素评估
- 实际量子硬件限制
- 真实量子设备噪声较大(退相干时间短、门保真度限制等),可能导致模型性能下降。
- 当前量子设备量子比特数有限,对高维数据幅度编码的真实实现有物理障碍。
- 编码限制
- 幅度编码要求输入维度为2的幂次,非幂次维度需补齐零填充,可能引入冗余、扰动输入分布。
- 角度编码虽然门深较小,但资源需求线性增长,不适合高维数据。
- 数据量少,模型复杂度设计权衡
- 过拟合风险依然存在,尤其FNN在隐藏层级别扩增时表现明显恶化。
- 较深幅度编码PQC对深度和参数复杂度更敏感。
- 解释性与计算成本问题
- 复杂量子架构的黑箱性类似深度学习模型,且当前训练主要基于模拟,计算成本较高。
同时,报告指出尚未集成噪声补偿、错误缓解及去噪算法,为未来研究方向。模型能否在动态金融环境保持稳定亦是开放问题。[page::27] [page::28] [page::29]
---
6. 批判性视角与细微差别
- 模型性能差异有限,需谨慎解读
- 尽管幅度编码QML优于角度编码QML和FNN,但与XGBoost对比优势不显著,在部分验证中RMSE甚至较大,需注意XGBoost调参和复杂度权衡。
- 硬件模拟限制
- 现阶段全部QML实验基于无噪声量子模拟器,硬件限制未充分反映,实际应用中复杂度和噪声挑战严峻。
- 数据集限制
- 样本包含1700余条,虽然多元但相对规模仍属中小,量子模型的泛化优越性或受限。
- 辅助经典层影响
- 角度编码QML因引入辅助层增加参数量及训练复杂性,引发潜在过拟合,幅度编码避免该瓶颈。
- 实现层面的复杂性
- 幅度编码电路深度较大,当前NISQ硬件难以实现,需更硬件友好的量子编码和变分结构改进。
- 缺乏经济效用综合评价
- 虽然提出基于预测提升的潜在收益策略,报告未具体验证QML模式在实际交易策略上带来的超额收益。
---
7. 结论性综合
本报告提出了一种应用于恢复率预测的混合量子机器学习模型,核心创新在于采用幅度编码实现高维数据的指数压缩,并结合强纠缠参数化量子电路,带来显著的参数量降低与泛化性能提升。实证结果表明,模型在全球1,725条债券违约数据上,相较于经典前馈神经网络和角度编码量子模型具有更低的均方根误差(RMSE最低0.228),且训练更稳定、卷积更快。与XGBoost比较,尽管后者在传统交叉验证中表现稍优,但在留一验证中表现逊色,且高方差降低了统计显著性。报告还通过多轮Diebold-Mariano检验彻底验证了模型的统计优越性。
图表解读方面:
- 恢复率数据本身呈现复杂非线性及双峰特征,说明传统线性和简单统计模型难以适用。
- 模型架构图清晰展示了经典与量子网络互补优势和数据流。
- 多个交叉验证损失曲线显示幅度编码QML稳定收敛,优于其角度编码兄弟模型及FNN。
- 统计显著性图进一步支撑幅度编码QML的稳健优势。
限制方面,报告坦诚将模型局限于量子仿真环境,实际硬件噪声及量子资源制约依然明显。幅度编码对输入维度幂次需求和深电路设计加剧现实落地难度。未来工作方向涵盖多样编码策略探索、硬件噪声容忍机制、经济应用价值验证,以及动态金融环境下的模型适应性检验。
总体而言,本报告不仅在金融信用风险计量领域为恢复率预测带来革命性的量子计算框架,也对量子机器学习在实际复杂数据预测中提供了坚实的理论及实证基础,标志着金融量子计算迈出了关键一步。[page::0 ~ 29] [page::37 ~ 43]
---
8. 参考文献溯源说明
本分析所有观点及数据均直接或间接基于报告正文及附录内容,并严格按报告页码溯源呈现。引用多个页码时,均以[page::X, page::Y]形式列示来源。
---
总结
本报告是一份融合量子计算与金融风险建模的跨学科高质量研究,对恢复率预测这一关注度较低但意义重大的子领域提出了创新建模方法,综合考虑了理论、数据、模型设计、计算实现及实验验证的全流程。其详尽的实验设计和严谨统计检验极大增强了结论的说服力。未来,如能结合实际量子硬件并深化经济价值研究,QML将有望在金融技术领域激发更大变革。