`

MILLION: A General Multi-Objective Framework with Controllable Risk for Portfolio Management

创建于 更新于

摘要

本报告提出了MILLION,一个结合多目标学习与风险可控的深度学习投资组合管理框架。其通过资产回报率预测与排序两个辅助目标提升模型对未来市场的泛化能力,并通过投资组合插值与改进方法实现对用户指定风险水平的精细控制。实证研究表明,MILLION在三大真实市场数据集上显著优于传统预测优化及RL方法,表现出更优的收益风险平衡与训练效率 [page::0][page::1][page::3][page::5][page::6][page::7]

速读内容

  • 框架结构与核心方法 [page::1][page::2][page::3]:


- MILLION框架包含两个阶段:①回报相关最大化,利用LSTM及注意力机制加权资产历史指标构建投资组合;②风险控制,采用投资组合插值(权衡最大收益与最小方差组合)和投资组合改进(通过优化插值权重以提升收益)实现风险精准调节。
- 多目标优化包括主要目标(最大化夏普比率、累计收益或最小下行风险)及辅助损失(资产回报率预测与排序),提升训练模型泛化能力。
  • 数据集与对比方法 [page::4][page::5]:

| 数据集 | 训练周期 | 测试周期 | 资产数量 |
|----------|--------------------|-------------------|----------|
| NAS100 | 2009/01/01-2020/02/01 | 2020/02/01-2021/01/01 | 78 |
| DOW30 | 2009/01/01-2019/02/01 | 2019/02/01-2020/01/01 | 28 |
| Crypto10 | 2018/08/02-2021/07/01 | 2021/07/01-2023/10/32 | 10 |

- 竞争模型涵盖预测优化(决策树、随机森林、LSTM-PTO等)、强化学习(A2C,PPO)及深度学习基线(LSTMHAM不同目标版本)。
- 评价指标包含年化收益率(APR)、波动率(AVOL)、夏普比率(ASR)、累计收益(ACR)、最大回撤(MDD)等。
  • 实验结果摘要 [page::5][page::6][page::7]:




- MILLION各版本在不同数据集均取得领先的APR和ASR表现,明显优于传统预测优化与强化学习方法。
- 投资组合插值与改进方法有效实现不同风险偏好的符合预期的风险控制,改进方法在保持风险不变的情况下,显著提升累计财富。
- 包含资产回报率预测的投资组合改进相比无辅助预测的版本进一步提高了性能,展现出较好的稳健性和收益提升能力。
  • 量化因子与策略构建 [page::3][page::4][page::6][page::7]:

- 多目标优化结合了收益最大化与两个辅助目标(回报率预测及排序),显著提升模型对未来市场的泛化能力。
- 风险控制通过投资组合插值方法实现风险值在[min-variance组合,当前组合]区间的可控调整,风险为插值权重的单调递减函数,收益在同区间线性变化。
- 投资组合改进策略以最小化插值权重γ为目标,通过梯度优化实现同风险水平下的收益最大化,提升了传统插值策略的效益。
- 训练采用自适应权重策略平衡多目标损失,有效避免单一目标过拟合。
  • 训练效率与实用性 [page::6]:


- MILLION训练效率优于强化学习方法,约等于传统预测优化,适合实际金融市场快速建模需求。
- 风险控制部分参数固定,改进方法仅需对插值权重优化,降低计算开销,提高用户个性化风险调整的实时性。

深度阅读

金融研究报告深度解析报告


报告题目: MILLION: A General Multi-Objective Framework with Controllable Risk for Portfolio Management
作者与机构: Liwei Deng、Tianfu Wang、Yan Zhao、Kai Zheng,分别来自电子科技大学、科学技术大学及其他合作机构。
发布日期及来源: 2024年,发表于PVLDB(Proceedings of the VLDB Endowment)第18卷第2期,466-474页。
研究主题: 针对资产组合管理,提出一个多目标且具备风险可控性的深度学习框架 MILLION,旨在解决传统模型风险控制不精细及投资者个性化需求难以满足的问题。

---

一、元数据与报告概览



本报告提出了一个通用且具备风险可控能力的多目标深度学习框架——MILLION,用于资产组合管理(Portfolio Management)问题。核心思想是将组合投资的优化过程分为两个阶段:
  • 收益最大化阶段(Return-Related Maximization): 通过多目标优化,结合资产收益率预测和排序两个辅助任务,提高模型对未来市场的泛化能力。

- 风险控制阶段(Risk Control): 通过组合插值和组合改进两个方法,实现对组合风险的细粒度控制,满足不同投资者的风险偏好。

该方法理论上证明了插值法能严格控制风险并保持收益不低于纯最小方差组合;进一步提出的组合改进方法还能在风险不变的情况下提升收益。实验部分选择了美国股市(NAS100、DOW30)和加密货币市场数据集,结果显示MILLION框架优于传统的预测-优化方法、强化学习和单目标深度学习模型,在收益及风险指标上都有显著优势。本报告愿意开放代码和数据,具有较好复现价值[page::0-1]。

---

二、章节深度剖析



2.1 引言与研究动机(第0-1页)


  • 背景与问题点:

资产组合管理通过优化预算分配,在风险-收益之间寻求平衡。自1952年Markowitz提出现代投资组合理论(MPT),组合投资因降低风险获得关注。近年来有三类技术路线:

1. 预测-优化(Predict-then-Optimize): 先预测资产价格或收益率,再基于预测结果求解组合,典型如均值-方差模型。问题在于预测精度受限,市场波动导致泛化能力差。
2. 强化学习(RL)方法: 直接基于环境状态最大化投资回报,由于奖励非连续且多目标,优化效率低且泛化性不足。
3. 深度学习(DL)方法: 直接优化可导的投资目标(如Sharpe比率),突破了RL优化效率限制。
  • 存在不足:

当前研究依赖外部信息(如金融新闻)或简化模型限制泛化;风险控制参数难以调节且缺少个性化支持;缺乏保证且细粒度风险控制方法。
  • 作者方案亮点:

提出MILLION框架,利用两个辅助目标改善收益预测泛化能力;设计两个风险控制机制能完美控制风险并快速响应个性化风险等级请求;理论支撑风险可控且收益不会低于基线最小方差组合。该框架灵活兼容新的数据源和模型输入[page::0-1]。

2.2 预备知识(第1页)



定义核心概念:
  • 保持期:投资的最小时间单元(每日/月度)。

- 资产价格与收益率:基于价格序列定义短期收益率。
  • 风险定义:沿用MPT,风险用收益率的波动率(方差)表征。

- 长仓与组合定义:禁止卖空,仅买入获利;组合权重满足非负且合为1;组合收益为权重与资产收益的内积,组合风险为加权协方差。
  • 投资目标:序列化地构建投资组合,实现最大收益且满足指定风险约束。


上述定义为后续理论和模型设计提供基础公式和符号说明[page::1]。

2.3 方法论:MILLION框架(第1-4页)



2.3.1 整体架构



MILLION框架分两大阶段,如图1:
  • 收益最大化阶段(左中 部分)

采用基于LSTM的时空模型编码市场状态,结合资产间的历史收益协方差构建注意力机制。输入为股票技术指标(MACD、BOLL区间、RSI等8个指标,Z-score规范化),通过一层LSTM捕捉时间序列模式,再通过注意力融合资产间空间关系。
输出为每个资产的权重评分,经Softmax归一化为组合投资比例。
  • 多目标优化模块

优化目标包括传统的最大累计收益(MaxCum)、最大Sharpe比率(MaxSharpe)及最小下行风险(MinDown)。通过结合辅助任务(收益预测和收益排名)来提升模型泛化能力,防止过拟合。
  • 风险控制阶段(右侧两部分)

- 组合插值法(Portfolio Interpolation):将收益最大化获得的组合与最小方差组合通过插值参数$\gammat$线性结合,理论证明风险可单调调节且不会低于最小方差组合的回报。
- 组合改进法(Portfolio Improvement):基于插值法构造的组合进行优化,最小化插值权重$\gamma
t$来提升收益,同时风险水平不变,进一步向有效前沿靠近。

2.3.2 细节解析


  • 时空建模公式

LSTM用于编码时间序列特征$\pmb{h}t^i = LSTM(Xt^i)$,并结合资产收益协方差矩阵通过注意力加权与协方差加权融合,公式体现了深度学习中的图神经网络思想。
  • 多目标损失

先定义组合收益回报(考虑交易成本)用于最大化目标;辅助损失有$\mathcal{L}P$(预测误差)及$\mathcal{L}r$(排序误差)。最终损失加权求和,采用动态权重调整避免手动调参(依据Kendall et al.的多任务学习权重策略)。
  • 风险控制的数学证明

- 组合插值风险是关于插值权重的二次函数且单调递减,可通过求解对应风险值的二次方程精确获得插值系数$\gammat$。
- 组合插值收益在插值范围内介于原组合和最小方差组合之间,保证不会低于后者。
- 组合改进通过梯度优化降低$\gamma
t$,并用预测收益引导,兼顾风险控制和收益提升。

这些数学推导结合了线性代数中特征分解、风险度量与优化理论,保证了风险控制的理论合理性及实现简便性[page::2-4]。

---

三、图表深度解读



3.1 图1:MILLION框架结构图(第2页)


  • 描述:图1详细展示了MILLION的端到端架构,从资产技术指标输入,到时空特征编码,接着多目标组合权重预测及辅助任务预测,最后风险指标的两种调整方法。

- 解读:清晰划分了收益最大化与风险控制两大阶段,突出组合插值与组合改进在风险控制中的作用。用颜色区分模块,体现模块化设计。
  • 联系文本:图示映射了模型设计与数学表达,直观辅助理解计算流程和信息流动。


3.2 图2:风险调整示意图(第4页)


  • 描述:x轴为风险,y轴为收益。

- 图(a)展示组合插值效果,由最小方差组合(低风险,低收益)至原组合(高风险,高收益)连线,插值点位于连线上。
- 图(b)展示组合改进效果,有一橙色区域代表组合改进可达到的更高收益但相同风险的点,突破单纯插值的限制。
  • 解读:图示直观展现两种风险控制方法的差异和优势,组合改进能向更优的有效前沿靠近。

- 联系文本:直观支撑Propositions 3.1-3.3,论证理论证明的实际意义。

3.3 表1:模型性能对比(第5页)


  • 描述:分别在DOW30、NAS100和Crypto10三个数据集上对比了多种预测-优化(决策树、线性回归、随机森林等)、RL(FinRL-A2C、FinRL-PPO)和DL(LSTMHAM及MILLION各单一及多目标模型)。指标覆盖收益(APR)、波动率(AVOL)、Sharpe比率(ASR)、Calmar比率(ACR)和最大回撤(MDD)。

- 解读:
- MILLION多目标模型(如MILLION-S)在大多数指标和数据集上均领先,尤其APR和ASR表现突出,表明其收益和风险调整收益均优越。
- 传统预测-优化模型表现参差不齐,RL表现较弱且训练时间长。
- 多目标训练明显提升DL模型表现,体现辅助任务的有效性。
  • 数据意义:表明MILLION框架具备较好的稳健性和泛化性,能有效优化交易组合,支持个性化风险调整。


3.4 图3:累计财富曲线(第6页)


  • 描述:不同模型在三个数据集上的累计财富随交易日的变化趋势。

- 解读:MILLION曲线稳健攀升且领先各比较方法,尤其在加密货币市场(波动大)展现更优适应性。其他方法表现波动较大,容易回撤。
  • 联系:直观体现风险调整后组合能持续盈利,强化了实验结果的说服力。


3.5 图4、5、6、7:模型训练效率和风险控制性能展示(第6-7页)


  • 图4(训练时间):MILLION训练效率优于RL,接近传统机器学习模型,显示稳定且快速收敛。

- 图5(风险控制方法对比):随着用户设定风险从低到高,展现ASR和AVOL同步增加,组合改进始终优于插值方法,加入预测收益更优。
  • 图6(投资案例):显示插值参数变化对累计财富影响及改进方法逐步提升累计财富曲线,且风险保持稳定。

- 图7(改进方法指标变化):随着迭代轮次增加,收益(APR、ASR)提升,波动率(AVOL)下降,最大回撤(MDD)维持较低水平,显示改进方法收敛良好、性能提升明显。

---

四、估值与财务预测分析



本报告并未涉及传统意义上的企业财务估值分析和预测,而是针对资产组合的风险与收益优化问题提出方法论和实验验证。因此,此处的“估值”更多对应资产组合的收益率指标及风险度量,通过最大化收益相关目标(如Sharpe比率)和风险控制,实现投资组合效用的绝对提升。

---

五、风险因素评估



报告强调并解决了以下风险因素:
  1. 市场动态及数据嘈杂导致模型泛化能力不足

- 通过辅助任务(预测和排序)辅助训练,提高模型对未来动态市场的适应能力,有效缓解过拟合现象。
  1. 个体投资者的风险偏好多样且动态

- 通过风险插值和改进机制,允许用户设定风险参数,实现风险的细粒度且动态调整。
  1. 现有强化学习及单目标深度学习方法缺乏明确风险控制保证

- 理论证明风险调整的有效区间及收益边界,防止极端损失。

风险控制方法提供高效、可解释的风险调节方案,增加投资者使用信心。关于风险因素发生概率和缓解策略体现于插值权重调节和损失函数设计上[page::1-4]。

---

六、批判性视角与细微差别


  • 积极方面:

报告系统性设计了多目标和风险控制阶段,结合了理论证明与充足实证,科学严谨。辅助任务设计提升泛化能力,突破单目标训练局限。风险控制方法简单明了,便于部署。
  • 潜在局限:

- 对于辅助目标中的收益排名和预测瓶颈,依赖历史数据质量和模型准确度,市场极端情况下性能稳定性仍待验证。
- 风险控制插值要求风险水平处于一定区间,超出范围时具体表现没有详述,实际个性化需求可能更复杂。
- 组合改进优化阶段参数权重设定敏感,且对预测收益的准确度存在依赖。
- 训练时间虽然优于RL但未详细分析大规模资产池下的可扩展性。
  • 细节备注:

组合只允许多头,未考虑卖空策略限制某些策略的适用范围。交易成本$c_t$设置为0,有改善空间。

---

七、结论性综合



本报告提出了一个创新的多目标深度学习框架MILLION,用以提升资产组合管理的收益和风险控制能力,核心贡献点和结论如下:
  • 多目标学习设计巧妙结合收益率预测和排序两个辅助任务,与投资组合目标共同训练,有效改善了模型在未来市场上的泛化能力。

- 风险控制创新方法提出了组合插值和组合改进两种调节机制,理论证明了风险可精确控制和收益边界,支持满足个性化动态风险偏好。尤其组合改进方法进一步推动组合向有效前沿靠近,提升回报。
  • 实证结果充分覆盖股市与加密货币三大真实数据集,MILLION框架在收益(APR、ASR、ACR)与风险(AVOL、MDD)指标上系统优于预测-优化、强化学习及单目标模型。

- 训练效率良好,比强化学习方法显著节省时间,具备实际应用潜力。

报告图表清晰展示了收益与风险的动态权衡,辅助实验充分验证理论,整体体现了多目标深度学习与理论模型结合下,资产组合风险可控的创新进展。虽然存在个别细节条件限制,MILLION在智能金融领域资产管理任务中具有重要参考意义和现实应用价值,值得进一步推广与优化[page::0-7]。

---

总体评价



本报告作为深度学习在资产组合管理领域的典范研究,以理论证明加实证验证双轮驱动,有效解决了长期困扰投资组合优化的风险可控和泛化难题,框架设计科学且具有良好扩展性,实验严谨且基准充分,具有较强的学术研究和工程实用价值,是金融与人工智能交叉领域的重要贡献。

报告