人工智能 52:神经网络组合优化初探
创建于 更新于
摘要
本报告系统介绍了将组合优化嵌入神经网络构建端到端量化投资框架的探索,重点应用了斯坦福大学开发的CvxpyLayers工具。报告通过三大凸优化案例—including Softmax函数、风险预算模型及马科维茨模型—详细证明与示例代码展示,实现了凸优化层对组合权重的动态求导。基于CvxpyLayers,构建因子模型FactorModel与端到端LSTMModel,实证覆盖国内外及国内资产配置,均优于风险平价基准模型,且用风险预算上下限限制增强稳定性。LSTMModel的超额收益主要来源于关键资产的偏配,如标普500和彭博贵金属指数[page::0][page::9][page::13][page::14][page::21]。
速读内容
量化投资三步骤端到端优化实现 [page::3]

- 因子生成、多因子合成及组合优化传统相互独立,目标函数不统一,存在信息损耗。
- 本文借助CvxpyLayers,将组合优化通过凸优化层嵌入神经网络,实现端到端梯度传播和优化。
CvxpyLayers介绍及优势 [page::4]

- CvxpyLayers将凸优化作为神经网络层,支持PyTorch、TensorFlow和JAX接口。
- 突破传统组合优化方法无法端到端训练、参数难确定和单期优化限制。
凸优化问题案例及数学证明 [page::5][page::6][page::7][page::8]
- Softmax函数的凸优化等价形式,利用拉格朗日乘子法证明,支持权重约束。
- 风险预算模型的转化为凸优化问题,详细推导等价关系,并展示完整代码。
- 马科维茨模型作为传统二次规划,可调参数整合于CvxpyLayers优化层。
资产配置标的池及数据准备 [page::9][page::10]
| 资产名称 | 代码 | 年化收益率 | 年化波动率 | 夏普比率 |
|------------------------|---------------|------------|------------|----------|
| 沪深300 | 000300.SH | 7.05% | 25.81% | 0.27 |
| 标普500 | SPX.GI | 7.49% | 19.54% | 0.38 |
| 中债-国债总财富指数 | CBA00601.CS | 3.81% | 2.81% | 1.35 |
| CBOT10年期美国国债 | TY.CBT | 1.14% | 6.28% | 0.18 |
| 彭博贵金属子指数 | BCOMPR | 7.61% | 20.35% | 0.37 |
- 实证涉及国内外和国内两个资产池,覆盖股票、债券、商品等大类资产。
- 收盘价归一化趋势图揭示各资产长期波动特征。
风险预算模型的两个神经网络实现 [page::11][page::12]


- FactorModel输入55维人工构建因子,经过双全连接层、Softmax + HardTanh映射风险预算,接入CvxpyLayers。
- LSTMModel输入原始30日资产收益率,先用单层LSTM提取动态因子,再接上述全连接及凸优化层。
- 两模型目标均为最大化未来20日组合收益,采用累计收益负值反向传播训练。
模型回测结果对比 (国内外资产配置) [page::13][page::14]
| 模型 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | Calmar比率 | 总换手率 |
|----------------|------------|------------|----------|----------|------------|----------|
| 风险平价 | 2.76% | 4.90% | 1.69 | -4.49% | 1.04 | 33.54 |
| FactorModel1 | 4.65% | 3.17% | 1.64 | -4.11% | 1.19 | 36.59 |
| FactorModel2 | 4.98% | 3.29% | 1.57 | -4.01% | 1.24 | 39.00 |
| FactorModel3 | 4.86% | 3.29% | 1.48 | -4.34% | 1.12 | 39.07 |

- FactorModel2和其它限幅模型均优于风险平价,最大回撤更小,夏普略低但整体收益性价比明显改善。

- FactorModel的累积超额收益平稳增长。
模型回测结果对比 (端到端LSTMModel 国内外配置) [page::14][page::15]
| 模型 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | Calmar比率 | 总换手率 |
|----------------|------------|------------|----------|----------|------------|----------|
| 风险平价 | 4.65% | 2.76% | 1.69 | -4.49% | 1.04 | 33.54 |
| LSTMModel1 | 4.91% | 2.98% | 1.65 | -4.08% | 1.20 | 36.57 |
| LSTMModel2 | 5.02% | 3.14% | 1.60 | -4.09% | 1.23 | 38.02 |
| LSTMModel3 | 4.79% | 3.14% | 1.52 | -4.36% | 1.10 | 37.57 |


- LSTMModel2的收益和超额收益均优于风险平价,展现端到端自动因子提取优势。
LSTMModel2资产偏配与超额收益贡献分析 [page::15][page::16]
| 资产 | 平均偏配权重 | 超额收益贡献 |
|------------------|--------------|--------------|
| 沪深300 | 0.86% | -0.48% |
| 标普500 | 1.95% | 3.66% |
| 中债-国债总财富指数 | -3.47% | -0.56% |
| CBOT10年期美国国债 | -1.00% | -0.11% |
| 彭博贵金属子指数 | 1.65% | 1.74% |



- LSTMModel集中超配标普500和贵金属,贡献主要超额收益来源。
国内资产配置结果总结 [page::17][page::18]
| 模型 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | Calmar比率 | 总换手率 |
|----------------|------------|------------|----------|----------|------------|----------|
| 风险平价 | 1.59% | 2.70 | -2.88% | 1.48 | 18.43 | |
| FactorModel1 | 4.28% | 1.66% | 2.71 | -2.62% | 1.72 | 18.88 |
| FactorModel2 | 4.55% | 1.85% | 2.46 | -2.94% | 1.55 | 21.94 |


- 国内资产配置中,风险预算模型提升年化收益3%以上。
端到端模型LSTM国内资产配置回测 [page::18]
| 模型 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | Calmar比率 | 总换手率 |
|----------------|------------|------------|----------|----------|------------|----------|
| 风险平价 | 4.28% | 1.59% | 2.70 | -2.88% | 1.48 | 18.43 |
| LSTMModel1 | 4.49% | 1.88% | 2.40 | -2.97% | 1.51 | 21.91 |
| LSTMModel2 | 4.56% | 2.09% | 2.19 | -3.89% | 1.17 | 24.47 |


- 端到端模型LSTMModel2在国内资产配置也实现超过风险平价的超额收益。
LSTMModel2国内配置资产偏配及超额收益 [page::19][page::20]
| 资产 | 平均偏配权重 | 超额收益贡献 |
|------------------------------|--------------|--------------|
| 沪深300 | 0.03% | 0.79% |
| 中证500 | 1.73% | 5.13% |
| 中债-国债总财富(1-3年)指数 | -6.58% | -1.85% |
| 中债-国债总财富(7-10年)指数 | 3.51% | 0.71% |
| SGE黄金9999 | 1.32% | 1.56% |



- 超额贡献主要来自中证500及黄金偏配,体现资产配置权重动态调整能力。
总结与展望 [page::21]
- 研究首创将CvxpyLayers嵌入神经网络中实现端到端组合优化,突破传统优化局限。
- 通过三个经典凸优化实例及相关代码展示,应用于因子风险预算模型构建。
- 因子模型和端到端模型实证均优于风险平价模型,且收益改善主要来源于核心资产偏配。
- 后续工作有望在引入更多因子、更多量化策略应用及动态超参调优等方向拓展。
深度阅读
金融研究报告深度解读报告
报告标题:《人工智能 52:神经网络组合优化初探》
发布机构:华泰研究,华泰证券股份有限公司
发布日期:2022年1月9日
研究员:林晓明、李子钰、何康
报告主题:基于神经网络的组合优化,特别是CvxpyLayers工具在量化投资资产组合优化中的应用
---
一、元数据与报告概览
该份深度研究报告延续了华泰金工团队在量化投资领域中应用人工智能技术的研究传统,重点关注如何将“组合优化”这一经典投资组合管理流程中的关键步骤,通过神经网络技术进行端到端建模,实现信息的无缝连接和优化过程的梯度传播。报告核心论点包括:
- 传统的组合优化步骤存在无法端到端优化、参数难以动态确定、单期优化等局限;
- CvxpyLayers作为一个将凸优化层嵌入神经网络的技术工具,打破了传统方法的限制,实现了组合优化的梯度可传播;
- 介绍并实证了三个基于CvxpyLayers的案例,包括Softmax函数凸优化形式、风险预算模型的凸优化形式以及经典马科维茨模型;
- 构建了两个基于CvxpyLayers的风险预算优化模型(因子模型FactorModel和端到端模型LSTMModel),在国内外及国内资产配置测试中,相比于风险平价模型均表现出更优的收益率和风险调整收益,各项指标均有提升;
- LSTMModel通过对资产原始日收益率数据的直接输入,自动特征提取,将传统的因子挖掘、合成与组合优化整合,体现了较强的端到端能力;
- 报告也提醒了模型基于历史数据,受神经网络随机性影响大,解释性弱,使用需谨慎。
整体来看,报告为量化投资中的组合优化引入深度学习技术,探索了一条端到端优化新路径,推动量化投资在智能化、自动化方向上的技术进步。[page::0,3,21]
---
二、逐节深度解读
2.1 引言与背景(第0–3页)
报告开篇点明量化投资流程三大关键步骤:因子生成、多因子合成、组合优化。深度学习技术擅长处理端到端优化,可促进因子挖掘与合成环节整合,目前“组合优化”通常独立进行,难以与特征提取整合。借助CvxpyLayers(由斯坦福大学凸优化研究组开发),将凸优化作为神经网络层嵌入,实现“组合优化”步骤的微分和端到端优化,目标函数直接聚焦组合收益或其他关键投资指标,从数据输出到权重分配闭环优化。
图表1直观展现了传统因子流程与基于神经网络端到端模型的区别,突出本报告聚焦点——在神经网络架构中嵌入组合优化层由凸优化构建的CvxpyLayers层,形成统一优化管道。[page::0,3]
2.2 传统组合优化的局限(第4页)
以经典均值-方差模型为例,说明传统组合优化基于给定参数(预期收益μ、风险厌恶系数λ)独立求解,不支持梯度传播,难以端到端训练。主要局限:
- 预期收益等输入参数无法通过优化流程动态调整;
- 参数λ需遍历确定,效率低下;
- 通常为单期规划,难以支持多期动态优化。
该限制实质是传统凸优化无法嵌入神经网络作为可微分层体现。[page::4]
2.3 CvxpyLayers简介(第4–5页)
介绍了CvxpyLayers工作原理:基于DPP规范参数化规划和ASA格式,将凸优化问题转换为可微映射,能够计算优化解对输入参数的梯度,从而实现端到端训练。平台兼容PyTorch、TensorFlow和JAX,构建神经网络时可像其它网络层调用优化层。图表2展示了框架和接口整合机制,突显其工程落地能力。[page::4,5]
2.4 三个CvxpyLayers案例及代码(第5–8页)
- 实例一:Softmax函数的凸优化形式
Softmax函数是神经网络中常用激活函数,输出可视为权重分配。报告证明Softmax函数等价于求解包含熵正则项的凸优化问题,并给出拉格朗日乘子证明过程,确保优化问题解唯一,输出与软分类概率一致。此外给出带约束的Softmax凸优化代码示例(图表3)。
- 实例二:风险预算模型的凸优化形式
风险预算是一种资产权重分配策略,原问题为非凸形式,论文转化为凸优化以便嵌入神经网络,同样使用拉格朗日法证明等价性,详细推导权重y与原始权重w的转换关系。代码示例如图表4。
- 实例三:马科维茨模型
报告给出均值-方差模型凸优化层的代码示例,体现参数(协方差矩阵方根Qsqrt、预期收益μ、约束矩阵A,b,G,h)的输入形态和优化变量w,展现了同类经典模型移植CvxpyLayers的实现思路。[page::5,6,7,8]
2.5 基于CvxpyLayers的风险预算模型实证(第9–20页)
构建两个基于CvxpyLayers风险预算资产配置模型:
- FactorModel(因子模型):输入人工构造大类资产因子(55个因子,涵盖收益率和波动率不同长度窗口),经过两层全连接层+Softmax+HardTanh(限制风险预算上下限且归一化)映射为风险预算,最后输入参与优化层得到权重,目标最大化未来20天组合收益(计算损失用于反向传播)。模型结构展示图表10与11。
- LSTMModel(端到端模型):输入过去30交易日5个资产的日收益率原始数据,使用LSTM层提取时序特征输出55个因子,后续结构同FactorModel。展示图表12、13。
训练测试设计:
- 国内外资产配置回测区间2009-2021年;国内资产配置2011-2021年。
- 采用滚动训练策略,训练集、验证集分离,避免未来信息泄露,调仓频率为20交易日。
- 反复训练5次取平均,剔除随机性影响。
- 设置合理风险预算上下限,调节策略风险偏好。
实证结果:
- 两个模型在不同风险预算上下限设置下,收益指标均优于风险平价模型,年化收益和夏普均有较好提升,最大回撤相似或减小,Calmar比率提升,换手率略升。
- LSTMModel2表现最佳,体现端到端自动化特征提取的效果。
- 通过风险预算和权重分布图(图表17、21、31、35)直观看出权重集中度和资产配置趋势。
- 超额收益归因表明,国内外资产配置中,标普500和彭博贵金属子指数贡献超额收益最多;国内资产配置中,中证500和SGE黄金9999贡献突出。
- 权重时间序列图进一步揭示模型对各资产配置策略的动态调整策略。
- Overall, 体现出CvxpyLayers实现的端到端风险预算模型在实际资产配置中有显著潜力。[page::9–20]
2.6 结论与讨论(第21页)
总结指出:
- CvxpyLayers破解传统组合优化不可微的瓶颈,实现神经网络端到端传导,在量化投资流程中形成完整闭环。
- 三大凸优化实例为神经网络集成优化提供理论和实践基础。
- 因子模型与端到端模型均能超过风险平价基准,尤其是LSTMModel端到端能力较强。
- 超额收益主要源自对核心资产的策略性偏配。
- 后续研究可能包括融合更多基础面和宏观因子,探索更多量化策略应用,搭建动态超参数优化框架等。
- 强调模型限于历史经验总结,神经网络的不确定性和黑盒特质对实务应用提出挑战,应谨慎实操。[page::21]
2.7 风险提示及免责声明(第22–25页)
- 资产配置策略基于历史表现,存在失效风险,且神经网络模型不易解释,有较强随机性。
- 报告严格披露分析师利益冲突与监管合规信息,明确本报告仅供投资参考,不构成买卖建议。相关法律尽职调查与监管信息详细列明。
- 保护版权及使用限制说明,提示读者在使用报告时注意合规界限。[page::22–25]
---
三、图表深度解读
3.1 图表1:人工智能模型融入量化投资流程(第3页)
- 该图将量化投资流程与对应的AI模型进行映射。传统因子生成-合成-组合优化三个独立步骤,在端到端神经网络框架下,通过AlphaNet实现因子挖掘与合成的端到端,当前工作进一步引入CvxpyLayers凸优化层,实现从特征提取到组合优化的完整闭环。
- 图中“遗传规划”“随机森林”“XGBoost”等传统机器学习模型均为单步骤改进方案;端到端方法标明提升深度学习技术价值。
- 该图突出CvxpyLayers的核心角色,是本报告技术创新的核心支持。[page::3]
3.2 图表2:CvxpyLayers框架示意图(第4页)
- 该图展示如何将常规的凸优化问题嵌入为神经网络层,实现输入参数θ到优化结果x*的映射,集成至PyTorch、TensorFlow框架。
- 体现了CvxpyLayers依托cvxpy语法构建凸优化问题,并提供自动求梯度功能,便于神经网络训练。这是底层实现的核心关键技术。
- 说明了实用层面,用户可以像调用普通层一样直接在神经网络中引入凸优化,融合优化思路与深度学习。[page::4]
3.3 图表3与4分别对应Softmax约束优化及风险预算模型代码示例(第5-7页)
- 图表3代码示例展示如何利用cvxpy声明变量w与参数x,设置熵函数正则项约束权重之和为1,及权重上限u,用于实现约束softmax。
- 图表4代码展示风险预算模型的构建,将风险预算b和协方差矩阵平方根Qsqrt作为参数,设置非负约束和风险预算对数约束,目标为最小化组合风险平方和,求解y,再归一化生成权重。
- 代码清晰展示接口调用流程,为用户复现提供便利。[page::5,7]
3.4 图表6-9:资产池的基本信息与归一化价图(第9-10页)
- 表格总结了各资产年化收益率、波动率和夏普比率,体现资产基本属性。标普500和彭博贵金属子指数平均表现优异,沪深300波动较大,债券类波动最低。
- 归一化价格图展示价格变动趋势,方便对比多个资产长期走势,表明大宗商品和股市波动明显,有一定分散效果。
- 标的池合理覆盖股票、债券、大宗商品多元资产,有利于分散风险和测试模型综合表现。[page::9-10]
3.5 图表10-13:因子模型与端到端模型结构图(第11-12页)
- 图表10与12图示因子模型输入手工指标,端到端模型输入原始收益率,分别经过神经网络层得出风险预算,再经CvxpyLayers组合优化层输出权重,整体流程清晰。
- 表格11、13详述网络层数、激活函数、优化器设置、超参数等,有助理解网络设计思想及复现。
- HardTanh结合Softmax限制风险预算上下界,避免异常权重产生,体现风险管控需求。[page::11-12]
3.6 图表14-17 & 18-21:模型回测绩效与风险预算(第13-14页)
- 绩效数据表显示因子模型及端到端模型3组不同风险预算上下限设置均优于风险平价,年化收益率分别提升约1.3%-2.3%;夏普比率均有所提升,最大回撤更小或接近风险平价。
- 净值曲线图清晰显示模型资产净值持续超越风险平价,且回测期间波动合理,累计超额收益增长稳健。
- 风险预算柱状图显示模型分配权重变化,偏好相对均衡但倾向标普500和贵金属较大配置。
- 说明神经网络结合凸优化整体设计有效,模型在实际资产配置中提升收益表现和风险分配的合理性。[page::13-14]
3.7 图表22-27:LSTM模型超额收益贡献与权重对比(第15-16页)
- 表格22显示模型超额收益主要来自于偏配标普500和贵金属,低配中债和美债也带来少量负贡献,资产偏配较为明晰。
- 通过资产权重与收盘价走势图展示,偏配权重的动态调整趋势与价格走势存在一定相关性,体现模型擅于捕捉资产价格特征。
- LSTMModel权重对比风险平价显示出更高的动态调节频率和幅度,体现模型在资产配置上的灵活度与主动性。[page::15-16]
3.8 图表28-35 & 36-41:国内资产配置回测表现与偏配分析(第17-20页)
- 国内资产配置表现与海外一致,因子模型和端到端模型均优于风险平价,稳健提升收益。
- 风险预算和资产权重分配显示中证500、黄金等资产的重点配置,反映内地市场特色。
- 偏配和超额收益贡献分析进一步显示中证500和黄金偏配是收益主要来源。
- 模型能适应不同市场环境,体现较好的泛化能力和适用性。
- 不同于海外资产配置,国内配置中多元化配置和行业选择显得更加重要,模型成功捕获这种结构。[page::17-20]
---
四、估值分析
报告本质为方法论和模型构建应用示范,并未涉及传统意义上的公司估值或股票价格目标,未包括常见的DCF、市盈率分析等。其估值层面可视为对基于风险预算的组合优化模型价值的内核测试,呈现为资产配置组合未来收益提升的潜力体现。
---
五、风险因素评估
报告特别强调:
- 神经网络资产配置策略基于历史数据,可能不适用于未来市场,存在失效风险。
- 神经网络模型本质为黑箱,缺乏清晰的因果解释,结果受训练过程初始化和随机性的影响较大。
- CvxpyLayers的组合优化能力虽突破局限,但对超参数动态优化的效果尚待实证。
- 模型需严格风险管理限制,通过上下限调节风险预算,避免极端权重配置。
- 投资者应谨慎采纳,并结合其他风险管理措施。[page::22]
---
六、批判性视角与细微差别
- 报告假设组合优化可以通过端到端的方法获得更优权重,但未对模型在极端市场、非平稳数据表现进行详细讨论,可能高估了模型泛化能力。
- 虽然提供了历史回测数据,实际交易滑点与市场冲击等微观结构风险未详述,可能掩盖真实交易成本影响。
- LSTMModel较优结果得益于端到端特征提取,但模型复杂度提升带来的过拟合风险及计算成本需额外关注。
- 风险预算上下限设置对模型表现影响较大,如何科学确定此参数尚不明确,是未来关键研究方向。
- 代码和数学推导虽严谨,但象征性代码示例尚需实际场景完整实现验证细节。
- 整体报告基于多资产小池,面对更高维资产时,模型性能表现和训练效率的可扩展性需要未来验证。
- 报告未涉及因子选择和数据预处理等前端问题对最终组合表现的影响,缺少更宽泛的因子挖掘策略整合视角。[page::21]
---
七、结论性综合
报告系统地介绍了基于CvxpyLayers的神经网络组合优化框架,将传统资产配置的因子生成、多因子合成与组合优化实现端到端融合,极大突破了传统凸组合优化不可微分的限制。通过三个数学证明,确保Softmax函数及风险预算模型的优化形式准确等价,保障优化层的理论严密。
构建的两套风险预算模型FactorModel和LSTMModel,分别基于人工因子和端到端原始收益率数据,在国内外及国内资产配置测试中表现均显著优于风险平价基准,年化收益率和夏普比率提升明显,最大回撤控制良好。LSTMModel自动化的数据处理与特征提取能力展示了深度学习在量化投资中的广阔应用前景。
超额收益归因分析进一步揭示了各资产偏配路径,深刻反映了模型决策逻辑和有效资产配置策略。附带代码示例极大方便了业界复现与应用,助力后续研究推广。
报告同时明确指出神经网络模型的局限性与风险,警示投资者在实际应用时要结合专业判断和风险管理。
综上,该报告提供了一个完整、创新且理论支撑强的量化投资端到端建模框架范式,对金融量化、人工智能研究、资产配置管理均有重要借鉴价值。[page::0-22]
---
图表索引(部分示例)
-

-

---
以上为报告的详尽解读与剖析,涵盖关键论点、逻辑推理、财务数据解读、图表分析、模型设计说明及风险评估,配合对应页码,方便效果溯源及后续引用。