`

基于端到端神经网络的风险预算与组合优化——“学海拾珠”系列之一百七十三

创建于 更新于

摘要

本报告研究了端到端神经网络在风险预算投资组合优化中的应用,通过集成预测与优化任务,构建基于模型和无模型两类端到端神经网络,采用随机门控机制实现资产选择功能,克服传统风险平价忽视资产回报且对资产选择敏感的缺陷。实证结果显示,基于模型的端到端方法和随机门控器嵌入提升了投资组合的夏普比率与风险调整收益,显著优于名义风险均等策略,且在包含低回报低波动资产时表现更为稳健[page_idx::0][page_idx::3][page_idx::6][page_idx::8][page_idx::11][page_idx::13]

速读内容

  • 端到端神经网络方法整合了投资组合预测与优化任务,避免传统两步模型的误差累积问题。该方法使用全连接神经网络自主学习资产风险预算,实现最优资产配置[pageidx::0][pageidx::3][pageidx::4][pageidx::5].

- 模型包括无模型(直接输出分配)与基于模型(嵌入风险预算隐层)两种结构。基于模型方法在模拟和真实市场数据中表现更优,表现指标包括夏普比率和累计回报[pageidx::6][pageidx::7].
  • 真实市场数据基于2011-2021年七只不同类别ETF,涵盖股票、债券及商品。该模型在样本内、外均表现优越,特别是在2020年疫情波动期间展现出动态风险控制优势[pageidx::8].

  • 资产选择创新采用随机门控器机制,通过调整资产对应的风险预算,动态筛除低效或负贡献资产,增强投资组合稳健性和风险调整收益。门控器训练时引入正态扰动,训练结束以阈值0.5确定资产纳入[pageidx::9].

  • 端到端模型结合随机门控器后,样本外测试表现显著优于名义风险平价基准,夏普率达到1.24,风险调整收益显著提升,而且在存在低波动低回报资产时,有效过滤不良资产,保护组合收益和降低潜在损失[pageidx::10][pageidx::11][pageidx::12].


  • 端到端风险预算组合利用随机门控器实现稀疏化资产选择,解决了传统风险平价均等风险贡献导致的对低回报低波动资产投资问题,体现了在风险预算分配框架中资产选择的重要性[pageidx::9][pageidx::11][pageidx::12].

- 模型计算结构清晰,输入层经过隐藏层后生成风险预算,随机门控器调整风险预算比例,再由可微分优化层输出资产配比,训练通过反向传播实现[pageidx::10].
  • 研究结论明确推荐夏普比率作为端到端神经网络训练的主要目标函数,保障风险调整后收益的稳定性和优越性[pageidx::8].

- 本文通过实际市场与模拟研究验证了端到端学习和资本资产选择功能的有效性,并指出未来优化空间及风险提示[page_idx::13].

深度阅读

报告分析解构:基于端到端神经网络的风险预算与组合优化



---

1. 元数据与概览


  • 报告标题:基于端到端神经网络的风险预算与组合优化——“学海拾珠”系列之一百七十三

- 作者及分析师:吴正宇(执业证书号:S0010522090001),炜(执业证书号:S0010520070001)
  • 发布机构:华安证券研究所

- 发布时间:2024年
  • 研究主题:将端到端神经网络方法应用于风险预算投资组合构建的新模型,重点聚焦投资组合优化中预测与决策任务的集成,以及资产选择机制的创新应用。


核心观点
  • 本报告通过端到端神经网络模型,融合资产配置中预测和优化的两个关键步骤,解决传统两阶段方式中各自独立训练所导致的次优问题。

- 作者基于七种资产构建组合,以提升夏普比率为目标函数进行训练。所设计的基于模型风险预算方法在模拟和真实市场数据上优于传统名义风险均等组合,并通过统计显著性检验。
  • 报告引入随机门控机制作为新颖资产筛选手段,避免投资于具有低波动但潜在负收益的资产,从而改善组合表现。

- 综述了相关领域的前沿研究,强调端到端学习在金融投资优化问题中的创新及实际作用。
  • 明确声明结论基于历史数据和国外文献,非投资建议。[pidx::0]


---

2. 逐节深度解读



2.1 引言


  • 投资组合优化分为预测资产参数和基于参数进行决策优化两阶段。传统方法由于预测标准与决策目标不同(如最小化预测误差vs最优化决策损失),存在误差累积,导致最终组合表现不佳。

- 报告提出利用端到端学习,将预测与优化任务集成于单一神经网络,避免独立训练参数,网络能够自主学习最优参数配置,减少中间步骤的不稳定性。
  • 将风险预算投资组合(如风险平价)融入神经网络结构,利用其稳定性抵御参数估计不准的缺陷。

- 引入了随机门控机制作为资产选择工具,避免风险预算法选择劣质资产,进一步提升稳健性与表现。
  • 论文结构明确,涵盖文献综述、模型构建、模拟实验、真实数据测试与资产选择及总结。[pidx::3][pidx::4]


2.2 文献回顾


  • 深入梳理了机器学习与强化学习在金融投资组合优化中的端到端方法,包括Bengio(1996)、Zohren(2020)、Butler和Kwon(2021)、Amos(2018)及Agrawal等的工作,突显模型联合训练交易模块对提升组合绩效的重要性。

- 区分了有模型(基于特定优化结构)和无模型(纯粹前馈网络)两种神经网络结构。
  • 延续现有研究,作者采用基于风险预算的端到端训练,加强组合的稳健性,同时融合资产选择机制以对抗低风险低回报资产的短板。[pidx::4][pidx::5]


2.3 模型构建


  • 摒弃传统依赖回报和协方差参数预测的两阶段流程。

- 端到端模型直接从原始输入特征学习资产配置策略,避免不准确的中间参数导致的误判。
  • 结合无模型和有模型方法:

- 无模型方法直接通过神经网络映射特征到资产权重。
- 有模型方法在网络内部嵌入风险预算优化问题,通过可微分层学习风险贡献分配。
  • 采用风险预算投资组合作为策略规则,利用其抗干扰、高容错优点。

- 设计前馈网络隐藏层,结合随机优化技术解决约束问题,提升模型的表达力与训练效率。[pidx::5][pidx::6]

2.4 模拟研究


  • 使用基于2011-2021年7只ETF(日均收益及协方差)的正态分布模拟资产回报。

- 模拟期长达175交易日,采取滚动窗口训练(150天),预测未来5天权重,超参数包括隐藏层32个神经元,学习率10,训练步数50。
  • 两种方法(有模型和无模型)在100个随机种子上验证稳定性,呈现不同表现路径的中位数、均值、最高和最低:

- 图表2显示以夏普比率为目标时,有模型方法表现明显优于无模型和名义风险均等组合。
- 统计假设检验(Z检验)支持有模型端到端方法能显著优于无模型及基准,在1%显著性水平下拒绝无模型和基准优于有模型的假设。
- 若以累计回报指标为目标也发现类似趋势,统计检验略低但整体稳健。
  • 说明端到端整体学习整合优化目标更有效,应采用基于夏普比率的训练目标。[pidx::6][pidx::7]


2.5 真实市场数据


  • 研究选用7只代表不同资产类别ETF,包括美股宽基(VTI,IWM)、债券类型(AGG,LQD,MUB)及商品(金、商品指数)。

- 实证结果同样显示端到端模型,尤其是基于模型、带门控器的端到端方法,在夏普比率和风险调整回报上全面领先名义风险均等策略。
  • 特别强调2020年疫情市场波动期间,端到端模型展现动态调节风险预算的优势,显著减轻回撤、提高表现。

- 推荐将夏普比率作为训练目标,兼顾收益与波动性,更适合风险预算优化。[pidx::8]

2.6 风险预算投资组合中的资产选择


  • 传统风险预算模型忽视资产预期回报,导致对低回报低波动资产的过度配置,风险平价策略尤为明显。

- 运用随机门控机制,嵌入于风险预算层,在训练过程中注入随机扰动以判别资产是否应包含于投资组合。
  • 门控器以参数 \(\mu\) 控制开启概率,结合噪音 \(\epsilon\) 产生均值偏移的高斯变量,训练完成后以阈值0.5判断资产纳入。

- 该机制未对资产包含进行惩罚,目标侧重避免持有劣质资产而非极力减少资产数量,区别于Yamada等的用法。
  • 三种策略对比:(i)无门控器端到端;(ii)门控器无过滤,仅用于风险预算调整;(iii)门控器加资产过滤,仅给选中资产分配权重。

- 实测纳入低回报、低波动模拟资产,显示门控器过滤模型能较好避免此类资产,提升夏普比率和风险调整后回报,且优于名义风险平价策略。[pidx::9][pidx::10]

2.7 模型在市场数据上的表现


  • 门控器学习率通过超参数调节,确保模型在训练与验证集上均表现优异。

- 图表7显示端到端带资产过滤门控器的投资组合在2020年之后实现最高累积回报指数,优于不含过滤和传统风险平价。
  • 风险指标MDD也显著改善,显示更稳健抗风险能力。

- 进一步引入随机低回报低波动资产后,资产过滤策略优于简单筛选(名义RP-topk和RP-positive),并且明显优于无过滤端到端及传统方法。
  • 图表9-10综合展示了多维度绩效指标(年化收益、波动率、夏普率、最大回撤、Calmar比率)表明随机门控器带来的组合优化价值以及实战适用性。[pidx::10][pidx::11][pidx::12]


2.8 结论


  • 端到端端神经网络方法有效整合风险预算资产配置中的预测与优化任务,较传统分步模型性能更优。

- 基于模型端到端方法在模拟和真是市况下均取得显著的夏普率和收益-回撤表现提升。
  • 痛点中的低波动低回报资产风险通过随机门控器实现动态筛除,提升组合表现的同时保护组合免受低收益陷阱的影响。

- 端到端模型在正常行情下行为接近名义风险平价,异常震荡时则提供更优的抗风险能力和收益表现。
  • 该研究框架具备较高的扩展性,可向其他涉及预测与决策的金融问题推广。

- 风险提示明确,结论基于历史数据和海外文献,对投资决策仅供参考,不构成建议。[pidx::12][pidx::13]

---

3. 图表深度解读



图表1:文章框架思维导图(引言章节)


  • 描述了本文涉及的问题提出、文献综述、数据构造、模型搭建、实证研究、资产选择机制及结论的全面流程。

- 可见本文系统探讨机器学习和深度学习在投资组合优化中预测及优化任务的集成,重点关注端到端学习模型架构及随机门控机制的设计。
  • 体现了从理论到实证、从模拟到真实市场数据的全方位研究视角。[pidx::3]


图表2:调优目标为夏普比率时模拟数据表现


  • 显示模型基于风险预算(model-based)和无模型(model-free)两种端到端学习方法在模拟数据上的表现路径。

- 纵轴为投资组合价值或收益水平,横轴是时间步。
  • 基于模型方法表现更为稳定且提升更持续,表现路径明显优于无模型和名义风险均等(line nominal)。

- 阴影区展现表现的波动性,基于模型方法波动较小,说明其抗风险能力更强。
  • 说明集成优化层使得风险预算分配更有效,提升了收益的风险调整水平。[pidx::6]


图表3:调优目标为累计回报时模拟表现


  • 同样的两种模型结构表现图,与图2相似,但调优目标不同。

- 模型均展示出增长态势,但累积回报训练导致表现差异稍微缩小。
  • 测试统计值表明基于模型方法依然优于无模型及名义基准,但显著性较以夏普比率为目标时有所降低。

- 反映了夏普比率作为训练目标更适合风险调整优化任务。[pidx::7]

图表4:2011-2021年七只ETF表现统计


  • 表格列出年化收益率、波动率、夏普比率、最大回撤、Calmar比率及收益/平均回撤比率。

- 不同资产类别表现不一,股票类ETF(VTI、IWM)收益较高但波动也大。
  • 债券类资产波动和最大回撤均较低,夏普指数相对稳定。

- 商品类(DBC,GLD)表现波动较大,DBC负收益明显。
  • 反映市场多样性,为端到端模型提供了丰富且异质的资产表现与分散机会。[pidx::8]


图表5:随机门控器结构图


  • 展示了风险预算层 \(b\) 到经过门控调整后的新风险预算层 \(b'\) 的传递。

- 门控器 \(zi\) 作用于每个资产的风险预算权重,通过 0/1 二值决定资产是否被包含。
  • 门控器基于资产预期回报 \(\mui\) 和波动率 \(\sigmai\) 输入,结合随机扰动实现训练过程中的资产筛选。

- 直观反映了如何通过可训练随机门控机制实现动态资产选择和风险预算调整。
  • 该机制为传统风险预算策略加入了数据驱动的资产过滤,提升模型灵活性与适应性。[pidx::9]


图表6:基于模型端到端带资产过滤的计算流程图


  • 展示数据流和反向传播完整路径。

- 从原始输入特征通过隐藏层,输出风险预算层,经过门控过滤,再被传入优化层得出资产配置决策。
  • 优化层解决带约束的凸优化问题。

- 损失函数基于风险奖励 \(R
\theta(z)\),实现端到端训练。
  • 体现整合数据预处理、资产选择和风险预算决策的深度学习架构设计理念。[pidx::10]


图表7:2020年后端到端带随机门控器与基准表现


  • 曲线图显示不同策略的累积收益走势。

- 带过滤门控器的端到端策略(蓝色)显著领先其它策略,表现稳健增长。
  • 无过滤门控器(橙色)和端到端原始方法(绿色)也优于名义风险平价(红色)及名义风险平价调整版本。

- 显示资产筛选机制在实际市场中的有效提升作用。
  • COVID-19大烈震期间模型能够迅速调整投资组合,缓解风险,提升收益。[pidx::11]


图表8:资产引入低风险低回报随机资产后年化绩效指标


  • 多策略的年化收益、夏普、波动、最大回撤等指标集中展示。

- 带过滤门控的端到端策略收益最高(12.33%),夏普率为1.24,明显优于名义风险平价(约6%收益,0.79夏普率)。
  • 无过滤端到端与基准差距显著,支持门控机制有效剔除不良资产提升组合质量。

- 表格直观反映低风险低回报资产对传统风险平价的负面影响及门控器的缓释作用。[pidx::11]

图表9-10:2017年至2021年样本外累积回报与绩效指标


  • 图9展现带过滤器、无过滤器端到端,以及传统基准投资组合的累计收益比较,带滤过器组合远超其他策略。

- 表10提供详细数值指标确认图9趋势,包括收益、波动率、最大回撤、Calmar比率和收益与平均回撤比。
  • 带门控器模型综合表现最出色,显示良好的风险收益权衡。

- 传统风险平价处理不佳的低回报资产一度导致组合表现负面。
  • 此两图表证明端到端带过滤的风险预算模型对真实市场适应性强,且保障收益稳健。[pidx::12]


---

4. 估值分析



本报告核心为投资组合优化方法研究,无直接企业估值,故无典型估值指标如DCF、市盈率等分析。主要以风险调整收益指标(夏普比率)、收益回撤比等投资组合表现指标评价模型有效性。

---

5. 风险因素评估


  • 报告明确风险提示:文献结论是基于历史及海外研究总结,不能视为具体投资建议。

- 端到端学习方法对输入数据质量高度依赖,市场结构变化或异常事件可能对模型造成影响。
  • 资产选择机制中随机门控器的训练收敛性受限,门控器状态不完全趋于0或1,导致资产过滤界限模糊,可能影响决策稳定。

- 模型对小样本或市场极端波动的适应还需持续检验。
  • 报告未对模型过拟合风险做深入讨论。

- 但整体通过引入风险预算和有模型结构降低了预测误差对组合的敏感度,改善了传统模型的鲁棒性缺陷。[pidx::0][pidx::13]

---

6. 批判性视角与细微差别


  • 报告主张端到端模型性能优于传统两阶段方法,基于大量随机实验及真实数据验证,较为充分客观。

- 但部分超参数设置(如学习率、训练步数、门控器学习率)依赖经验选择,模型表现受调参影响较大,存在一定主观成分。
  • 门控器设计虽然创新,但对过滤决策阈值的0.5设定较为经验,说明实际过滤效果还具有不确定性。

- 报告重点强调基于模型的神经网络方法优于无模型,但无模型网络结构细节及可能优化空间未充分展开,存在进一步深挖空间。
  • 模拟环境与历史数据的品种数量有限(7只资产),未覆盖更广泛市场异质性,可能限制结论的全面推广。

- 报告与类Yamada模型对比时未实施罚项正则,选择不惩罚冗余特征的立场合理但缺乏更细证据支撑。
  • 风险控制和模型鲁棒性虽有所突出,但缺少对模型实施难度、计算资源消耗和实操复杂度等现实交易层面的评估。[pidx::9][pidx::13]


---

7. 结论性综合



本报告系统地探讨了端到端神经网络技术在金融资产配置风险预算组合中的应用,着力解决传统两阶段预测与分配割裂训练带来的决策信息损失问题。通过建立联通预测、资产选择与风险分配的完整神经网络架构,作者实现了组合构建中的任务协同优化,显著提升了组合的风险调整收益。

实证基于7种ETF进行,模拟与真实市场均验证了基于模型的端到端方法显著优于无模型端到端方法以及传统名义风险均等组合,尤其在夏普比率与收益回撤比指标中表现优异。引入随机门控机制有力过滤掉低波动低回报资产,解决风险预算模型对资产选择敏感的问题,进一步提升组合稳健性和收益表现。图表2和3清晰展现了两种端到端策略在模拟环境中的优劣及训练目标差异影响,图4至10通过全面的市场数据呈现端到端模型在实际应用中的绩效与优势。

报告的创新性体现在:
  • 端到端融合预测与优化,突破传统训练目标割裂的瓶颈;

- 设计随机门控器嵌入风险预算层,动态实现资产选择,强化模型适应性和鲁棒性;
  • 采用模型化优化层提高决策的明确性和稳定性;

- 经统计检验保证研究结论的显著有效性。

整体上,报告展示了端到端神经网络的潜力及其在资产管理领域的实践价值,为未来风险预算及资产配置的智能化发展提供了理论和方法基础。

---

参考文献


  • Uysal, A.S., Li, X., Mulvey, J.M. "End-to-End Risk Budgeting Portfolio Optimization with Neural Networks." IDEAS Working Paper.

- 相关国内外学术与行业文献。
  • 华安证券研究所整理报告材料。


---

(全文所有结论均基于上述报告内容与数据,引用页码均已标注,确保信息溯源明确。)

报告