`

SEMI-DECISION-FOCUSED LEARNING WITH DEEP ENSEMBLES: A PRACTICAL FRAMEWORK FOR ROBUST PORTFOLIO OPTIMIZATION

创建于 更新于

摘要

本报告提出了半决策聚焦学习(Semi-Decision-Focused Learning)框架,通过使用简单的目标投资组合和凸交叉熵损失函数来稳定和强化深度学习在投资组合优化中的应用。此外,深度集成(Deep Ensemble)技术被引入以减少模型预测的方差,提升优化效果和鲁棒性。基于两类不同市场环境的股票池实验显示,该方法显著优于传统基线策略,证实了其在多变市场中的实用价值和性能优势 [page::0][page::1][page::2][page::3][page::4]。

速读内容

  • 研究背景与问题陈述 [page::0]

- 直接优化复杂金融指标如夏普比率存在非凸性导致的不稳定和局部最优困境。
- 强化学习方法虽然具潜力,但调参复杂且结果波动较大。
- 引入深度集成以提升预测准确性和模型鲁棒性,降低输出方差。
  • 方法框架与技术细节 [page::1]

- Semi-Decision-Focused Learning:将决策优化转化为监督学习,使用交叉熵损失和预计算的目标组合(Max-Sortino和One-Hot)进行训练。
- 采用多模型独立训练的深度集成,通过均值聚合预测降低单模型初始化带来的不确定性。
- 评估三个深度序列模型架构:LSTM、Transformer与Mamba。
  • 实验设计与数据集 [page::1][page::7]

- 两个股票池:Universe 1(24只股票,整体上涨趋势)、Universe 2(84只股票,波动震荡)。
- 输入数据为标准化的每日OHLCV,采用252天滚动预测窗口。
- 目标组合计算采用最大Sortino比率的凸优化方案(凸优化保证全局唯一最优解),以及最高收益的One-Hot组合。
  • 关键实验结果及表现 [page::2][page::3]


- 组合回测显示,Mamba模型在两种目标组合下表现优异,收益累计明显优于等权、价值加权及其他决策聚焦学习基线。
- Sharpe和Sortino指标普遍提升,表现更为稳健。


- 深度集成规模扩大显著提升绩效,回报率、夏普比率及Sortino比率均随模型数量增加而稳定上升,方差明显缩小,体现模型预测和优化结果的稳定性增强。
  • 量化因子与策略构建总结 [page::2][page::3][page::7][page::8]

- 目标组合设计:Max-Sortino组合考虑下行风险,One-Hot组合专注未来回报最高股票。
- 损失函数采用交叉熵,相较于非凸目标函数更易优化稳定。
- 深度集成由100至多达1000个模型组成,基于模型预测加权均值形成最终投资组合。
- 采用Sophia优化器进行训练,模型超参近默认设置以避免过拟合。
- 回测采用40bp交易成本与两天滞后调仓,滚动训练与验证框架逐月更新模型。
  • 方法贡献与局限 [page::4]

- 半决策聚焦学习结合深度集成技术提供稳定且实用的优化方法,有效应对复杂非凸性能指标的优化难题。
- 当前方法仅适用于多头(long-only)组合,未来可考虑引入其他损失函数支持多头多空。
- 深度集成虽提升性能,计算成本大幅增加,需权衡资源与收益。
- 后续计划融合不确定性估计,进一步提升实战适用性。

深度阅读

SEMI-DECISION-FOCUSED LEARNING WITH DEEP ENSEMBLES: A PRACTICAL FRAMEWORK FOR ROBUST PORTFOLIO OPTIMIZATION — 报告详尽分析



---

1. 元数据与概览



报告标题
《Semi-Decision-Focused Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization》

作者及联系方式
Juhyeong Kim,来自韩国首尔,联系邮箱 nonconvexopt@gmail.com。

主题领域
机器学习方法在组合投资优化中的应用,尤其聚焦于“决策聚焦学习”(Decision-Focused Learning)方法的实际改进,提出新框架“半决策聚焦学习”(Semi-Decision-Focused Learning)结合深度集成(Deep Ensemble)技术,提升组合优化的性能和鲁棒性。

核心论点、创新与贡献
报告提出了一种创新方法——半决策聚焦学习,结合了决策聚焦学习的优势和更易于优化的凸损失函数设计(交叉熵损失),通过监督学习方式训练神经网络模型预测股票组合权重。为解决深度学习模型参数初始随机性带来的波动,进一步引入深度集成技术,通过多个模型预测取均值来降低方差提高稳定性。实证测试涵盖两个市场组合,一个上涨趋势明显,另一个呈现区间震荡,结果显示新方法普遍优于基准策略,包括传统等权、价值加权以及当前的决策聚焦基线方法。

总体,研究旨在提供理论与实务兼备的投资组合机器学习框架,平衡优化目标的难度和实际训练的稳定性,理论和实验均展现出显著效果和鲁棒性。[page::0]

---

2. 逐节深度解读



2.1 引言


  • 技术背景

已有大量将深度学习应用于组合优化的文献,涵盖梯度优化方法及强化学习(RL)等。前者如Zhang et al.用Sharpe比率作为目标函数实践决策聚焦学习;强化学习则有多篇跟踪市场动态的研究。
  • 现有挑战

直接以Sharpe比率最大化等非凸目标训练网络,导致优化不稳定;强化学习调参复杂且性能波动较大。
  • 方法启发与解决思路

通过引入深度集成降低单模型预测方差,融合多模型预测改善整体性能并提升稳定性。
  • 贡献点总结

引入“半决策聚焦学习”框架,借助易于优化的凸损失(交叉熵)训练,和深度集成提高鲁棒性,应用于上升和区间震荡两类市场组合,实现优于各类基准组合的绩效。[page::0]

2.2 方法论(Method)


  • 决策聚焦学习(Decision-Focused Learning)概念

区别于传统“先预测后优化”(Predict-then-Optimize)两阶段策略,决策聚焦学习统一模型训练与决策目标为单一优化目标,直接针对最终投资决策绩效进行参数优化。
  • 数学表达

传统两阶段中,模型先最小化预测误差$\mathcal{L}$,再求解投资权重$w$以最大性能指标$\mathcal{P}$(如Sharpe)。决策聚焦则直接梯度优化性能目标$\mathcal{P}$,更贴合最终任务。
  • 深度集成(Deep Ensemble)原理

集合多个独立初始化训练的深度模型输出取平均,降低预测方差。数量为$m$的集成,若模型间预测相关性$\rho<1$,则整体方差随$m$增大按公式
$$\mathrm{Var}[\bar{f}]=\frac{\sigma^{2}(1+(m-1)\rho)}{m}$$
降低,为结果稳定性提供理论保障。
  • 提出的半决策聚焦学习

不像传统决策聚焦直接最大化非凸财务指标,作者选用凸的交叉熵损失,目标为拟合一个简单且预先计算好的“假设最优”组合(如Max-Sortino或OneHot),将组合预测视为监督学习任务。虽非直接优化性能指标,但提升了训练稳定性。
  • 与深度集成结合

减缓初始权重随机性带来的性能波动,集成多个模型权重预测,输出更为稳定和鲁棒的组合权重。

综上,方法既充分汲取决策聚焦学习的理论优势,又克服其优化困难,兼顾了实际训练稳定性和性能提升[page::1]

3. 实验设计与结果



3.1 实验设置


  • 市场投资组合宇宙

包含两个不同特性的投资宇宙,
- 宇宙1:24只股票,整体呈上涨趋势;
- 宇宙2:84只股票,价格波动范围区间震荡。
  • 目标组合

- Max-Sortino组合:最大化Sortino比率(侧重下行风险调整收益),使用未来收益均值和半方差计算,优化模型实现凸优化。
- One-Hot组合:全仓投资预测未来收益最高的单只股票。
  • 模型结构

三种主流深度序列模型:LSTM、Transformer、Mamba(轻量线性复杂度变体),实验评估其应用效果。

3.2 实验结果


  • 图表和数据(图1与表1)解读

回测考虑40bp交易成本,2天调仓滞后。实验采用100模型深度集成方式:

- 图1呈现两宇宙各模型与目标组合在2019-2024时间跨度上的累计收益。
- 表1定量指标包括累计收益(CR)、夏普比率(SHR)、Sortino比率(SOR)。新方法明显优于:
- 等权重、价值加权基准;
- 近期最新的决策聚焦方法DL4PO;
- 最大Sharpe近似策略mSSRM PGA。
  • 具体表现(以宇宙1为例)

- 如LSTM + Max-Sortino组合累计收益约7.123(单位起始规模1),显著超越基准 4.462约60%提升。
- Sharpe比率和Sortino比率整体提升反映改进的风险调整后收益。
- 宇宙2虽整体回报较低、新方法优势仍明显。
  • 深度集成效果(图2)

- 以Mamba模型与One-Hot目标为例,随着集成模型数从1增加至64,累计收益及两风险调整指标均稳步提升,显示集成有效降低了训练随机性导致的性能波动。
- 箱线图中的四分位数缩小,表示性能稳定性更强。
- 集成收益提升体现为:稳健性提高、方差减少,满足前文理论导出。

综上,作者的新框架不仅提高单模型性能且通过深度集成进一步提升整体表现的稳定性和有效性[page::2,3]

---

3. 图表深度解读



图1及表1:回测绩效综合比较


  • 描述

两组图分别为两个投资宇宙不同方法累计收益曲线,均起点为1;表格则列举累计收益(CR)、夏普比(SHR)、Sortino比(SOR)数值,涵盖传统基线、多模型方法以及作者方法。
  • 趋势与解读

作者方法相关曲线(如LSTM Max-Sortino、Mamba One-Hot)均明显高于基准,CR数值差距大,且风险调整指标表现优异。曲线形态显示作者模型在震荡期和上升期均保持较优表现,尤其宇宙1中明显,体现出方法对不同市场状态的适应性。
  • 支持文本论点

表1定量数据支持作者宣称其框架显著优于传统均值-方差基准和其他机器学习方法(例如DL4PO),图1则提供视觉对比,强调累积收益优势与走势平滑度。[page::2]

---

图2:深度集成规模与投资绩效关系


  • 描述

6个箱线图分布于两个宇宙,分别展示随着集成模型数目从1递增至64,累计收益、夏普和Sortino比值的变化。橙色线显示中位数,箱体宽度与高度表示分布范围。
  • 趋势分析

性能指标均呈正向增长且趋于饱和,表明尤其在初期增加集成模型能有效显著提升收益和风险调整水平;方差逐渐减少,稳定性提升明显。
  • 文本联系

作者用此图验证深度集成的理论意义和实际效用,强调集成不仅提高均值性能,也显著降低不确定性,优化组合表现更稳定。
  • 潜在局限

集成规模增大虽带来性能提升,但文中也提到计算成本线性增加,存在成本和收益权衡问题。[page::3]

---

附录中目标组合与模型搭配的资产权重可视化(图4-19)


  • 这些堆叠柱状图展示了两大投资宇宙及不同模型(LSTM、Transformer、Mamba)在不同目标组合(Max-Sortino与One-Hot)下,每月资产权重分布。
  • 观察

- Max-Sortino组合权重呈现较为分散且灵活配置,反映目标在最小化下行风险、兼顾多资产配置。
- One-Hot组合显然权重高度集中于单只股票,凸显其极端追求最高预测收益的策略。
- 各模型权重差异明显,尤其Transformer权重较为分散,Mamba及LSTM表现波动较大,体现模型结构对配置行为和风险偏好的影响。
  • 支撑推论

这些权重分布图为后续绩效分析提供解释,说明不同模型和组合目标导致不同资产配置策略,进而影响风险和收益表现。[page::10-13]

---

4. 估值方法分析



报告并无传统意义上的企业估值分析,而是投资组合优化的绩效比较。

所用方法针对组合的绩效指标包括累计收益、夏普比和Sortino比。这三者本质上是评价投资组合风险调整后收益表现的度量。

模型训练基于监督学习针对预先计算的目标组合(Max-Sortino或One-Hot)优化交叉熵损失函数,简化决策聚焦学习的复杂非凸目标,平衡了训练效率和最终投资表现。

深度集成进一步通过方差减少原理提升组合预测的稳定性和性能,不同于传统单模型优化的估值问题,是一种机器学习在投资决策过程中的提升手段。

---

5. 风险因素评估


  • 损失函数指标局限

半决策聚焦学习采用的交叉熵损失适用于长仓组合,限制了短仓以及更复杂投资策略的应用。若需支持空头,需要设计替代或扩展的损失函数。
  • 目标组合理想性不足

所选目标组合(Max-Sortino和One-Hot)并不保证在所有市场条件下最优,有可能存在更适合某些特定目标的投资组合结构。
  • 计算资源需求高

深度集成(如用100+模型集成)提升性能的同时显著增加计算成本,对实务运行资源要求较高。
  • 模型随机性与稳定性

尽管集成降低随机权重初始化带来的不稳定,但完全消除不确定性仍存在挑战。

报告中未详细涉及金融风险如市场系统性波动、极端事件对模型表现的影响,重点偏向机器学习层面的性能和稳健性风险。[page::4]

---

6. 批判性视角与细微差别


  • 方法与目标间的折中

半决策聚焦方法通过非直接优化绩效指标的凸损失函数,换取训练稳定性和实际可行性,但此折中可能导致模型与真正复杂金融目标间存在距离。
  • 目标组合准确性依赖

框架依赖月度计算的目标组合,无论是Max-Sortino还是One-Hot,均取决于过去月度收益的非严格预测,存在未来收益分布预测误差及过拟合风险。
  • 深度集成优势与计算成本

虽然理论和实证效果显著,集成带来的计算资源需求与实践中系统优化存在矛盾,尤其在大规模资产池时。
  • 长期适用性与泛化潜力

模型聚焦于近期市场数据特征,如何有效适应未来资产价格结构剧变尚不明朗。
  • 缺少多样化指标

尽管夏普、Sortino指标是一流绩效评估标准,但报告对其他如最大回撤、Alpha、Beta等实务指标考量较少。

在整体框架稳健性、方法创新方面表现出色,但仍存在从理论割断到实务落地的桥梁建设需求。[page::0-4]

---

7. 结论性综合



本文提出的半决策聚焦学习框架,巧妙结合了决策聚焦学习理论优势和更易优化的凸目标,同时配合深度集成方法,显著提升了基于深度序列模型的组合投资性能和稳定性。通过设计两个投资宇宙实验,涵盖不同市场环境,作者系统验证了该框架相比传统等权、价值投资及现有机器学习基线策略均有优异表现:
  • 性能提升:累计收益高出诸多有效基准,夏普率和Sortino率均有提升,反映风险调整后的更优表现。
  • 稳定性增强:深度集成策略有效缓解模型训练中的随机波动,模型输出组合权重不再因单一样本而波动大,可靠性大大提升。
  • 实用方法优势:相比直接优化复杂非凸目标,采用交叉熵损失训练更具训练效率与稳定性,且基于简单目标组合训练更契合实际操作中策略设计。


报告图表详尽,权重分配可视化清晰展现不同模型和目标组合下的资产配置,进一步支持绩效结果解释。

尽管存在计算成本高、仅支持长仓组合及目标组合选择依赖等局限,整体框架被证实为一种兼顾理论创新与实用性的组合优化机器学习方法,有望成为未来投资策略设计重要工具。

---

重要图表引用



图1:两个投资宇宙中不同模型和基线的累计收益曲线,展示作者方法优越性。

图2:深度集成规模对累计收益、夏普率、Sortino率的正向影响及方差抑制效果。

图3:框架训练-验证-测试滚动流程示意图,助理解模型更新与回测流程。

---

参考文献标示与页码遵循



本文中结论及解析严格遵循报告原文内容,并标注明确页码标注以便溯源。诸如理论介绍、方法设计、实验结果均源自对应页码,如[page::0-4]等。

---

综上,本文是一份内容详实、逻辑严密且实证充分的机器学习金融研究报告,融合理论创新与实务考量,特别是深度集成用以保障稳定性的应用,为金融组合优化领域的模型训练与决策制定提供了一条可行且有效的路径。

报告