`

Investment Portfolio Optimization Based on Modern Portfolio Theory and Deep Learning Models

创建于 更新于

摘要

本论文提出基于现代组合理论的方差-协方差矩阵预测新框架,结合LSTM、DeepVAR和GPVAR深度学习模型进行多资产组合优化。实证中,LSTM模型在信息比率和年化收益率方面表现最佳,且较长的历史窗口和较低的调仓频率能提升深度学习模型的预测和组合表现。深度学习方法在捕捉矩阵长期依赖方面优于传统方法,对股市及加密货币联合投资均具适用价值 [page::0][page::17][page::23]

速读内容


研究背景与目标 [page::1][page::2]

  • 研究基于现代投资组合理论(MPT)优化资产配置,核心难点为方差-协方差矩阵估计。

- 采用LSTM、DeepVAR、GPVAR三种深度学习方法进行多变量时间序列方差-协方差矩阵的单步预测。
  • 数据覆盖美国股票和加密货币,结合传统方法(样本协方差、EWMA、收缩估计等)比较性能。


经典与深度学习方差-协方差矩阵估计方法介绍 [page::4][page::6][page::8]

  • 经典方法包括样本矩阵、半协方差矩阵、指数加权移动平均(EWMA)、多种收缩估计及Oracle近似方法。

- LSTM单层和双层网络结构设计,训练150轮,参数包括隐藏层大小、batch等。
  • DeepVAR和GPVAR为概率模型,估计联合概率分布,使用Copula与高斯过程降维技术提高效率。


方差-协方差矩阵深度学习预测流程 [page::10][page::11]

  • 使用Cholesky分解确保预测矩阵正定性。

- 将矩阵入口展开为一维时间序列,分别用深度学习模型预测后重构矩阵。
  • 只预测一步(次日)矩阵,用于当天组合权重优化。


投资组合构建及绩效评估指标 [page::12][page::13]

  • 投资组合采用基于最小方差的Markowitz优化,考虑0.5%交易成本。

- 调仓周期选择30, 60, 90, 120天,历史窗口同样是30-120日。
  • 核心性能指标包含年化收益率、信息比率、最大回撤及多种风险调整指标。


数据及参数设定 [page::14][page::15][page::16]

  • 股票与加密货币数据覆盖2018初至2021末,含10只市值最大股票与10只加密货币构建动态资产池。

- 深度学习模型超参数网格调优,LSTM单双层网络,DeepVAR/GPVAR双层网络及分布参数设定。
  • 模型每调仓日重新训练以适应动态资产池。


实证结果总结 [page::17][page::18][page::19][page::20][page::21]


  • 各策略在不同窗口、调仓周期下回测,深度学习模型普遍优于经典方法,且LSTM表现最优。

- 短窗口(30天)表现不理想,长窗口(60天及以上)能显著提升预测质量。
  • 调仓频率低(90天及以上)一般带来较好风险调整收益。

- DeepVAR及GPVAR的稳定性好,参数调优需求低,但整体收益略逊于LSTM。
  • 长时间窗口及适中调仓频率为策略表现提升关键。

- 部分极端情况下DeepVAR和GPVAR表现欠佳,可能因高维度及非平稳性影响预测准确度。

研究结论与未来方向 [page::22][page::23]

  • 深度学习方法尤其是LSTM能有效捕捉方差-协方差矩阵结构,指导组合优化表现显著提升。

- 观察窗口长度和调仓周期为影响业绩的关键参数,长窗口和低频调仓更适合深度模型。
  • 概率模型虽稳定但未显著超越传统LSTM,研究验证了两项假说:深度学习优于经典方法,概率模型未必优于LSTM。

- 未来可扩展至更大资产池、动态风险模型及不同优化目标,如夏普率优化。

深度阅读

金融研究报告详尽分析报告



一、元数据与概览


  • 报告标题:《Investment Portfolio Optimization Based on Modern Portfolio Theory and Deep Learning Models》

- 作者:Maciej Wysocki, Paweł Sakowski
  • 机构:华沙大学数量金融及机器学习系定量金融研究团队

- 发布日期:未明确具体日期,但引用信息最迟2023年且代码基于Python3.8及Tensorflow 2.2
  • 研究主题:结合现代投资组合理论(Modern Portfolio Theory, MPT)与深度学习模型优化投资组合,特别关注方差-协方差矩阵的估计及其在资产组合中的应用,涉及股票及加密货币市场资产。


核心论点摘要



本论文聚焦现代投资组合理论中最核心且难点的问题——资产方差-协方差矩阵的估计。作者提出了基于深度学习方法(尤其是长短期记忆神经网络LSTM和两种概率深度学习模型DeepVAR与GPVAR)的新颖方差-协方差矩阵估计框架,并将不同参数组合下的策略(如观察窗口长度和再平衡频率)进行了实证测试。研究显示:
  • LSTM基模型在信息比率信息比率(Information Ratio)及年化收益率上表现最佳。

- 深度学习模型需要更长的历史观察窗口以便捕捉长期依赖关系。
  • 较长的再平衡周期通常优于短周期。

- 概率性深度学习模型表现稳定,但未显著优于LSTM。
  • 结合加密货币与股票资产的复合投资组合为模型性能测试提供了丰富的市场条件。


---

二、逐章深度解读



1. 引言(Introduction)


  • 关键论点:投资组合管理仍是金融资产交易中核心话题。现有技术进步促使投资者从简单分析向深度强化学习等复杂方法转化。马克维茨(1952)提出的MPT已成为基础,但实际应用中最难解决的是准确估计方差-协方差矩阵。

- 支撑证据:文献复盘涵盖传统如频率估计法、EWMA、GARCH变种、收缩估计法及新兴机器学习方法,说明问题的普遍性与复杂性。指出深度学习,尤其是LSTM和Transformer,动态捕捉金融时间序列表现优异。
  • 假设基础:深度学习可能因其非线性和长短期记忆能力,克服传统估计在高维及非线性金融数据上的局限。


2. 理论背景(Theoretical Background)



2.1 平均-方差优化(Mean-Variance Optimization)


  • 内容概要:重申了MPT的核心,即在给定风险水平最小化方差或在给定预期回报最大化收益。采用无卖空约束,构建仅多头仓位组合。

- 公式解读
- 目标函数为最小化组合的方差,即所有资产权重与协方差矩阵的二次形式。
- 约束权重和为1,且均为非负(无卖空)。
  • 期望收益取为历史均值,风险定义为组合方差。

- 进一步说明:选择最小方差优化,适用于波动性大的资产组合(如包含加密货币),体现实际稳定性需求。

2.2 经典方差-协方差估计器(Classical Variance-Covariance Estimators)


  • 关键论点:多种非深度学习估计器包括:

- 样本方差协方差矩阵(频率估计器),直接计算样本协方差,若资产数大于样本容量则矩阵奇异,存在过拟合风险。
- 半方差矩阵,只计算收益低于某阈值(2%)的下行风险,更符合投资者关注的风险偏好。
- EWMA,通过指数衰减权重提高对近期数据的敏感性,Decay factor固定为0.94。
- 收缩估计器,通过权衡结构化目标矩阵与非结构化样本矩阵,降低估计误差,具体包括常数方差收缩、单因素模型和常数相关收缩。
- Oracle Approximating Estimator(OAE),基于迭代调整收缩系数,适应高维小样本环境,具备理论最优性质。
  • 推理基础:提供多种估计方法以供对比验证,反映行业传统和最新改良技术。


2.3-2.4 深度学习模型介绍


  • LSTM详解:

- 能解决传统RNN的梯度消失问题,通过门控机制(遗忘门、输入门、输出门)处理长序列依赖。
- 具体数学表达式揭示其内在的状态更新和门控权重计算过程。
  • 概率自回归循环神经网络(DeepVAR与GPVAR):

- 深度学习的概率建模,针对多变量时间序列直接估计联合分布,优势为捕捉不同时间序列间的关联性和不确定性。
- DeepVAR基于条件概率分解,采用高斯似然,输出不确定性范围。
- GPVAR则利用高斯Copula过程,结合LSTM状态动态,拟合复杂的联合分布,更加灵活。
  • 核心逻辑:概率模型不仅预测均值,更预测分布,有助风险管理,但复杂度更高。


2.5 利用深度学习预测方差-协方差矩阵


  • 问题点:方差协方差矩阵需保证对称且半正定性,直接预测元素可能导致无效矩阵。

- 解决方案:先对历史矩阵做Cholesky分解,将分解后的下三角元素形成时间序列分别建模预测,再重构方差协方差矩阵,确保属性成立。
  • 步骤总结

1. 计算历史方差协方差矩阵
2. Cholesky分解矩阵,提取元素序列
3. 用深度学习模型预测每个元素的下一期值
4. 重构预测的方差协方差矩阵用于投资组合优化。
  • 重要参数:观察窗口长度影响预测精度,本文测试30、60、90、120天四种配置。


3. 投资组合构建与评估方法



3.1 组合构建


  • 统一基于最小方差准则做优化。

- 考虑交易费用,设50 bps佣金,交易过程模拟市场真实约束,采用贪婪离散分配算法确保权重接近最优。
  • 再平衡周期为30、60、90及120天。


3.2 性能评估指标


  • 年化收益率、年化标准差

- 最大回撤与最大亏损持续时间
  • 信息比率(多种形式,包含风险调整)

- 全面衡量收益与风险表现。

4. 数据与参数设置


  • 数据覆盖2018-01-01至2021-10-31,涵盖纳斯达克高流动性前10只股票与加密货币前10只,样本动态变化,共计82只资产。

- 股票价格来自Yahoo Finance,加密货币来自Coinpaprika,处理股市停盘日采用前值填充。
  • 精细划分参数统一研发(窗口、再平衡间隔、模型超参)便于公正对比。

- 深度学习模型训练150轮,采用Adam优化器,学习率0.01,对应批量大小、隐藏层节点数、序列长度等均做调节。

5. 结果分析


  • 明确呈现多个不同参数组合和估计方法对策略绩效的影响,重点关注信息比率和年化收益率。

- 关键观察:
- 短窗口(30天)策略整体盈利能力差,尤其经典模型表现最弱。
- LSTM模型整体领先于DeepVAR、GPVAR和经典模型,且表现更为波动。
- 更长窗口(90、120天)提升了包括深度学习所有模型的表现,验证了模型需要较长序列学习长短期依赖。
- 再平衡周期越长(90/120天),通常策略表现越优,说明频繁调整交易成本攀升影响显著。
- 概率模型表现虽较均衡稳定但整体盈利不及LSTM,可能由于高维金融数据复杂性与非平稳性影响。
- 经典方法多数组合亏损明显,表明深度学习技术在捕捉复杂市场动态方面确实具备优势。

---

三、图表深度解读



图1:LSTM单元结构(图7)


  • 描述:展示LSTM内部遗忘门、输入门、输出门及状态传播结构。

- 解读:清晰说明LSTM通过门控机制克服传统RNN的梯度消失问题,有效捕捉长期依赖,对金融时间序列建模尤为关键。
  • 联系文本:说明为何本研究借助LSTM及其变种处理资产方差协方差矩阵的时间演变。


图2至图5:策略绩效分布图(图18-21)


  • 描述:分别针对30、60、90和120天窗口,展示不同估计法(GPVAR, VAR, LSTM, Classical)及不同再平衡周期组合的策略信息比率和年化收益。

- 关键数据解析:
- 所有窗口下,经典方法大多表现最弱。
- LSTM在绝大多数配置中信息比率和年化收益领先,且随着窗口增长优势明显。
- 概率模型表现稳定,特别是在长窗口和不太频繁再平衡条件下。
- 最佳组合多为较长观察窗口+较长再平衡周期,如120天窗口+120天再平衡。
  • 视觉传达:盒须图显示区间扩展和离散点分布,反映结果的稳定性和极端表现。

- 图表支撑结论:深度学习尤其是LSTM在预测资产间动态协方差结构中效果优异,经典方法因估计误差限制难以匹敌。

---

四、估值分析



本报告核心在组合优化与方差协方差矩阵预测,不直接涉及估值模型(如DCF、PE等),但采用MPT的风险—收益优化框架,重点为方差协方差矩阵预测驱动权重配置优化。采用最小方差目标函数,结合历史收益均值作为预期回报估计。

---

五、风险因素评估


  • 影响风险主要包括:

- 矩阵估计误差导致投资组合配置风险,如经典估计在高维小样本下的不稳定性。
- 深度学习模型对历史窗口长度及数据质量敏感,短窗可能严重影响预测效果。
- 加密货币的高波动性和市场非平稳性增加模型预测难度。
- 概率模型虽能提供不确定性估计,但复杂度大、高维度处理存在挑战。
  • 报告未详细量化风险概率,但结果显示较短窗口及高频再平衡时策略表现普遍下降,提示估计稳定性风险。


---

六、批判性视角与细微差别


  • 报告肯定了深度学习在协方差估计中的潜力,但概率模型未优于简单LSTM,可能是模型复杂性与金融市场非平稳性的双重挑战。

- 经典方法在某些极端情况下表现较差,强化了对传统估计局限的认识。
  • 研究使用固定手续费简化交易成本,虽合理但实际交易中成本结构更复杂,可能对频繁再平衡策略产生更大影响。

- 深度学习模型参数选取和训练周期有限,更多超参数搜索与更长训练周期或改进模型结构可能带来改进。
  • 包含加密货币与股票的组合实际中,流动性及市场行为差异可能引入额外风险,但未见详细讨论。

- 研究结论基于较短时间窗口(约4年),未来扩展至更长周期可能验证结果一致性。

---

七、结论性综合



本文研究提出并实证验证了基于现代投资组合理论结合深度学习方法对多资产风险管理的全新框架。通过构建对方差-协方差矩阵的LSTM和概率深度学习模型预测,递推Cholesky分解矩阵元素,保证了有效的矩阵性质,成功应用于股票与加密货币混合投资组合的最小方差优化。
  • 深度学习模型优势明显:尤其是LSTM-RNN模型在多种窗口长度和再平衡频率组合下,信息比率和年化收益普遍优于传统方法及复杂概率模型,显示其优越的预测能力和适用性。

- 历史数据窗口与再平衡频率为关键驱动力:较长历史窗口(90天以上)和较长再平衡周期(90天甚至120天)带来更优策略表现,说明组合构建更适合中长期动态调整。
  • 概率模型稳定性好但性能劣于LSTM:DeepVAR和GPVAR不需复杂调优,可作为稳健工具,然而在实测盈利能力上稍逊一筹。

- 融合加密货币增强了多样性测试,验证深度学习方法在高波动资产环境中的适应性。
  • 研究贡献:提供完整方法论及可复现代码,支持后续学术与实务扩展,包含模型框架构建、数据处理和性能评估三大模块。


综上,作者认为基于深度学习的方差-协方差矩阵估计,是现代投资组合优化中一个极具潜力的方向,特别是结合适当参数配置,能够显著提升风险管理质量与投资回报,未来研究可进一步探索更复杂模型、多目标优化及更广泛市场数据的适用性。[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23]

---

附:关键图表引用


  • 图1 (LSTM结构示意图):


  • 图2-5 (不同参数下策略表现箱线图):

30天窗口

60天窗口

90天窗口

120天窗口


---

以上分析完整覆盖了论文的主题、理论基础、方法论、数据处理、模型构建、实证结果、风险、批判性思考、结论和主要图表解读,符合专业金融研究写作规范与要求。

报告