`

Portfolio Optimization with Feedback Strategies Based on Artificial Neural Networks

创建于 更新于

摘要

本文提出了一种基于深度学习的动态资产配置方法,通过使用人工神经网络(ANN)直接最大化经验效用函数,避免了解析求解Hamilton-Jacobi-Bellman方程的复杂性。该方法分别在几何布朗运动和Heston随机波动率模型下进行了验证,结果显示ANN策略在投资组合权重和预期效用上均与理论最优策略高度一致,且计算效率显著提升。该框架灵活且可推广至多资产、多样市场动态,助力现代资产管理实践 [page::1][page::5][page::8][page::10][page::12].

速读内容

  • 研究提出了一种利用深度学习中的人工神经网络(ANN)作为反馈控制函数,通过经验效用最大化直接训练资产配置策略,无需推导和求解复杂的HJB偏微分方程 [page::1][page::5][page::6]。

- 资产市场采用两种模型:几何布朗运动(GBM)和Heston随机波动率模型,分别用S&P 500和VIX指数数据进行了标定和仿真 [page::7][page::9][page::10]。
| 参数 | 值 |
|---------------|----------------------------|
| 初始标的价格 S0 | 4770 |
| 初始财富 W0 | 1.0 |
| 无风险利率 r | 5% 年化 |
| GBM模型 | 漂移 μ=0.085,波动率 σ=0.176 |
| Heston模型参数 | θ=0.0438, κ=10.5, ρ=-0.712 |
  • 在GBM情形下,训练单隐层3个神经元的ANN,使用不同风险厌恶系数η(范围:1/η从0.25到1),ANN优化结果在股票配比与经典Merton比率理论值高度吻合;用10,000次蒙特卡洛模拟比较终端效用,ANN与解析解无显著差异 [page::8][page::9]。




| 1/η | ANN均值终端效用 | 解析均值终端效用 | ANN标准误差 | 解析标准误差 |
|--------|-----------------|------------------|-------------|-------------|
| 0.250 | 0.05055 | 0.05027 | 1.83e-5 | 1.77e-5 |
| 0.375 | 0.05563 | 0.05555 | 4.86e-5 | 4.65e-5 |
| 0.500 | 0.05897 | 0.05765 | 8.61e-5 | 9.01e-5 |
| 0.625 | 0.06050 | 0.06408 | 0.00015 | 0.00014 |
| 0.750 | 0.06479 | 0.06387 | 0.00019 | 0.00021 |
| 0.875 | 0.06643 | 0.06753 | 0.00029 | 0.00030 |
| 1.000 | 0.07200 | 0.07000 | 0.00041 | 0.00040 |
  • 对Heston模型(包括标的价格及波动率的联合随机动态),使用单隐层5神经元ANN,针对对数效用η=1进行训练与评估,ANN生成的股票权重随时间和波动率变化,与理论解析解(只依赖于波动率)高度匹配。基于10,000次蒙特卡洛模拟的终端效用均值和标准误差也证明ANN方法有效且准确 [page::10][page::11]。





| 方法 | 终端效用均值 | 标准误差 |
|------|--------------|-------------|
| ANN | 0.07840 | 0.00055 |
| 解析 | 0.07748 | 0.00060 |
  • 本文训练ANN采用Adam优化算法,利用Euler-Maruyama方法进行资产和财富过程离散化。计算资源要求低,无需GPU,运行环境在常规笔记本(Intel i7-13800H CPU,32GB RAM)下数小时内完成训练 [page::7][page::10][page::12]。

- 该DL方法具有推广性,适用于包括GARCH(1,1)、Kraft和3/2等随机波动率模型,支持多资产和更复杂市场动态,具备灵活性与实用性 [page::12]。

深度阅读

详细分析报告:基于人工神经网络反馈策略的投资组合优化



---

一、元数据与概览


  • 报告标题:Portfolio Optimization with Feedback Strategies Based on Artificial Neural Networks

- 作者及机构:Yaacov Kopeliovich(康涅狄格大学金融系),Michael Pokojovy(老自治大学数学与统计系)
  • 发布日期及来源:该报告为期刊论文,DOI链接:https://doi.org/10.1016/j.frl.2024.106185

- 主题领域:金融资产配置,深度学习,经验效用最大化,随机波动率模型及Heston模型
  • 核心论点:

- 介绍一个基于深度学习的投资组合优化框架,通过人工神经网络(ANN)实现资产配置的反馈控制。
- 该方法不依赖传统的Hamilton-Jacobi-Bellman(HJB)偏微分方程求解,而是直接通过经验效用最大化训练ANN,实现灵活且计算高效的动态资产配置。
- 方法在基于S&P 500指数和VIX指数标定的几种市场模型下进行了验证,结果与经典理论最优解相当。
  • 研究贡献:本文提出的ANN反馈控制方法具有通用性和模块化特征,能适应多种资产配置场景和市场动态,同时配套了开源R代码。[page::0,1]


---

二、逐节深度解读



1. 引言


  • 背景综述:

- 回顾经典资产配置理论演变:Markowitz(1952)提出静态均值-方差优化,开启现代资产组合管理理念;Merton(1969)正式将资产配置看作动态控制问题并提出基于效用最大化的动态配置框架。
- 传统动态资产配置的计算关键在于求解HJB方程(一个偏微分方程),方法复杂且通常受维度限制。
  • 技术革新与动机:

- 现代机器学习(尤其DL)的兴起为高维、非线性控制问题的求解带来新的手段。许多尝试聚焦于用DL解决HJB问题,减少维度灾难。
- 最新发展提出,直接跳过HJB方程的解析推导,而通过经验效用最大化训练ANN策略,获得动态资产分配权重。
  • 创新点及目标:

- 本文展示一个基于ANN的资产配置反馈控制框架,直接训练使资产组合效用函数最大化,实现简单且透明的方案。
- 重视系统的适用性和效率,力求方法能普适市场模型且计算量适中,与传统蒙特卡罗路径数百万次相比,提出更轻量级的实现。
- 目标是构建一个独立于具体市场模型和HJB的模块化框架。
  • 总结:整合人工智能与经典资产配置构建新的优化路径,对金融智能化管理有重要借鉴意义。[page::2]


2. Merton最优资产配置问题形式化


  • 数学模型:

- 资产价格动态采用风险资产$St$与无风险资产$Pt$两种工具建模。具体风险资产采纳随机波动率的Heston模型:
- 无风险资产收益率固定,$dPt = r Pt dt$。
- 风险资产收益率满足几何布朗运动,且波动率随时间变动,$dSt = \mu St dt + \sqrt{Yt} St dBt^S$。
- 波动率过程$Y
t$服从均值回复的CIR过程,参数包括均值回复速度$\kappa$、长期均值$\theta$、波动率波动率$\sigmaY$,两个布朗运动间存在相关性$\rho$。
- 投资者持有时刻$t$资产组合权重$\pi
t$,其财富动态满足相应随机微分方程。
  • 优化目标:

- 投资者希望最大化在有限投资期$T$终端财富的期望效用,效用函数选为常用的isoelastic效用,涵盖对不同风险偏好参数$\eta$的度量。
- 优化变量为股票比例$\pit$,理论上不设限(允许借贷和卖空)。
  • 经典结果与理论基础:

- 优化问题通过随机控制逻辑,与HJB偏微分方程联系紧密。应用HJB方程可导出最优控制策略$\pi^(t,y,w)$。
- 特殊情况下(如对数效用),可得显式解析解,如$\pi^{
}
{Heston}(y) = (\mu - r)/ y$,其仅依赖于方差状态变量$y$。
  • 总结:该节奠定数学基础框架与传统方法,为后续应用ANN替代HJB求解做铺垫。[page::3,4,5]


3. 基于前馈ANN的反馈控制


  • 方法核心思想:

- 根据函数逼近理论(Hornik,1991),可用带参数$\theta$的神经网络$\mathcal{N}(t,y|\theta)$去逼近未知的最优反馈控制$\pi^*(t,y)$.
- 这种方式规避直接求解复杂的HJB偏微分方程,将问题转化为参数优化问题,即最大化期望效用关于神经网络参数的函数。
  • 神经网络结构及训练:

- 定义输入为时间$t$与方差$y$,输出为配置比例$\pit$,网络采用多层(至少2层)感知机结构,隐层激活函数选用Swish/SiLU以保证逼近能力。
- 最输出层线性激活,允许配置比例为任意实数(即支持卖空与借贷)。
- 期望效用$J(\theta) = \mathbb{E}[U(W
T^{\pi=\mathcal{N}(\cdot|\theta)})]$,通过蒙特卡罗模拟离散化动态方程计算。
- 使用Euler-Maruyama方法离散SDE以生成训练数据样本,采用小批量随机梯度下降(Adam优化器)对损失函数-\(J(\theta)\)进行优化,采用动态再采样防止过拟合。
  • 优势说明:

- 训练过程独立于底层市场模型,充分模块化。
- 训练效率明显优于类似文献中需上百万级蒙特卡罗路径的计算负担。
  • 总结:本章从理论到实践描述了ANN反馈资产配置策略的具体实现方式,重点体现了深度学习无偏模型逼近和有效优化结合的能力。[page::5,6]


4. 应用实例



4.1 几何布朗运动(GBM)模型


  • 市场设置与参数估计:

- 使用S&P 500指数数据进行风险资产收益率$\mu$和波动率$\sigma$的最大似然估计。
- 相关参数见表1,初始资产价格与初始财富分别为4770和1美元,风险无风险利率设为5%。
  • 训练与结果概述:

- 针对不同风险厌恶系数$\eta$(从$1/\eta=0.25$到$1$)训练单隐层三神经元ANN。
- 训练步骤分三阶段,分别调整批量大小和步长,单次训练耗时不超过3.5小时。
  • 结果分析(图1和图2):

- 图1(a)显示训练完成的ANN结构;图1(b)显示随时间$t$变化的股票权重,ANN学习得到的曲线与经典Merton比率基本重合,复现了分析最优解。
- 图2给出不同$1/\eta$对应的权重对比,ANN输出满足理论线性关系,拟合度高。
- 模拟的终端效用(表2)显示ANN预测与解析最优策略预期效用一致,标准误差极小。
  • 结论:对经典GBM模型,ANN方法能够高效准确地学习并复刻最优资产权重,验证了其有效性。[page::7,8,9]


4.2 Heston模型


  • 数据校准:

- S&P 500和VIX指数用来标定Heston随机波动率模型参数(表3)。
- 采用加权最小二乘法估计模型参数并生成多条模拟路径(图3左为价格,右为波动率),揭示波动率随机性及均值回复特性。
  • 训练细节:

- 采用单隐层五神经元ANN,训练步骤较GBM多,训练总时长约6小时。
- 训练流程类似,应用Adam优化器和按阶段调整训练超参数。
  • 结果解读(图4,表4,图5):

- 图4(a)为训练完成的ANN结构;图4(b)展示多时点对应不同波动率$y$的权重曲线,ANN权重曲线与解析对数效用解($\eta=1$)基本吻合,尽管存在时点$t$的轻微波动,但整体效果稳定,尤其在波动率聚集的均值区域表现更佳。
- 表4列示了通过1万次模拟信用计算终端效用,ANN结果均值与解析值紧密匹配,误差均在统计标准误范围内。
- 图5对于多条模拟路径展示了终端财富曲线,ANN策略与理论策略难分伯仲,支持策略实际等效。
  • 总结:ANN反馈策略在复杂随机波动率环境下依然能有效捕获最优权重,说明该方法适用于高复杂度市场模型。[page::9,10,11]


5. 摘要与结论


  • 总结性陈述:

- 提出的经验效用最大化框架及ANN反馈策略,在GBM及Heston模型下无需解析解或者HJB求解,可直接通过数值方法训练完成。
- 采用极简神经网络结构(3-5个隐藏神经元,单隐藏层)即可得到与经典解析策略相媲美的结果。
- 所用方法在计算效率、模型灵活性方面均优于现有基于大型蒙特卡罗路径或严格HJB数值解方案。
  • 可拓展性与应用潜力:

- 该框架易于推广应用于其他随机波动率模型(如GARCH(1,1)、3/2模型、Kraft模型等),可处理多资产、多类别及更复杂金融市场动态。
  • 项目开放资源:

- 相关数据和完整实现代码集均开源于GitHub,方便后续研究及应用推广。
  • 声明:无利益冲突,无外部资金支持。

- 技术细节补充:附录详细介绍基于Euler-Maruyama的离散化方法,确保数值模拟的严谨性。
  • 关键词与JEL分类:资产配置,深度学习,经验风险最小化,随机波动率,Heston模型 | JEL:G11(投资,投资决策),C61(优化技术)[page::12,13]


---

三、图表深度解读



表1(第8页)



| 参数 | 数值 |
|---------------|------------|
| 初始价格$S0$ | 4770 |
| 初始财富$W
0$ | 1.0 |
| 无风险率$r$ | 0.05 |
| 漂移$\mu$ | 0.085 |
| 波动率$\sigma$| 0.176 |
  • 说明:基于实际数据用最大似然估计获得,体现现实市场条件。

- 影响:确定GBM模型下的价格演化和训练环境。[page::8]

图1(第8页)


  • 左图展示了最终训练完成的ANN结构(3层,总3个神经元隐藏层)及网络权重,标明了权重大小与方向,可视化了反馈控制网络核心组件。

- 右图显示ANN输出的股票投资权重随时间的变化曲线(黑线)及理论解析解(红虚线),两者高度重合,意味着ANN成功逼近最优控制。
  • 结论:ANN设计合理且训练充分,有良好的泛化表现。[page::8]


图2(第9页)


  • 通过不同风险厌恶参数反比$1/\eta$展示对应权重,黑圈为ANN预测,红色虚线为理论权重。

- 结果显示两者呈高度线性正相关且重合,验证ANN方法的准确性和稳定性。
  • 说明ANN方法能够捕捉不同风险偏好下的动态权重变化。[page::9]


表2(第9页)



| 方法 | 1/$\eta$ | 0.25 | 0.375 | 0.5 | 0.625 | 0.75 | 0.875 | 1.0 |
|--------|----------|---------|---------|---------|---------|---------|---------|---------|
| ANN均值| | 0.05055 | 0.05563 | 0.05897 | 0.06050 | 0.06479 | 0.06643 | 0.07200 |
| ANN误差| | 1.83e-5 | 4.86e-5 | 8.61e-5 | 0.00015 | 0.00019 | 0.00029 | 0.00041 |
| 解析均值| | 0.05027 | 0.05555 | 0.05765 | 0.06408 | 0.06387 | 0.06753 | 0.07000 |
| 解析误差| | 1.77e-5 | 4.65e-5 | 9.01e-5 | 0.00014 | 0.00021 | 0.00030 | 0.00040 |
  • 说明:两种方法模拟出的期望效用基本一致,证明ANN的策略近似效果优良。

- 标准误差极小,显示模拟统计的稳定性。[page::9]

表3(第9页)



| 参数 | 数值 |
|------------|-------------|
| 初始价格$S0$ | 4770 |
| 初始波动率$Y
0$| 0.0155 |
| 初始财富$W0$ | 1.0 |
| 无风险率$r$ | 0.05 |
| 漂移$\mu$ | 0.089 |
| 均值回复$\theta$ | 0.0438 |
| 均值回复速率$\kappa$ | 10.5 |
| 波动率波动率$\sigma
Y$ | 0.564 |
| 相关系数$\rho$ | -0.712 |
  • 说明:基于标普和VIX指数,抓取了波动率波动特性及负相关效应,反映实际市场波动。

- 参数设定保证了模拟的现实描述能力。[page::9]

图3(第10页)


  • 左图:历史(-3年到0年)和模拟(0年到1年)标普价格轨迹,模拟路径波动性合理,波动率反映长期趋势及随机波动。

- 右图:历史与模拟波动率(年化)轨迹对应,模拟路径展示随机波动率的上下震荡,与历史较吻合。
  • 结论:模型对实际市场行情的拟合度较高。[page::10]


图4(第10页)


  • 左图:训练完毕的5神经元单隐层ANN模型结构,层间连接权重可视化,反映模型复杂度与参数设定。

- 右图:不同时间点$t$下,股票配置权重随平方波动率$y$变化的曲线集合(多条曲线衬托时间变化),红色虚线为理论解。
  • 说明:ANN拟合曲线与理论曲线整体一致,尤其在主流波动率区间内保持良好拟合,低波动率区偏差较大但影响不明显。

- 体现ANN对于波动率这一隐含状态变量的反馈控制能力。
  • 存在少量时间依赖的波动,说明ANN策略在实际应用中能捕捉动态非平稳性。[page::10]


表4(第11页)



| | ANN | 解析解 |
|------|--------|---------|
| 均值 | 0.07840| 0.07748 |
| 标准误差 | 0.00055| 0.00060 |
  • 说明:二者平均终端效用极为接近,标明ANN模型训练完成度高且稳定。

- 标准误差小,验证模拟估计的统计精度。[page::11]

图5(第11页)


  • 左图和右图分别为ANN策略和解析策略下的10条模拟最优终端财富进程路径。

- 两图显示财富演化轨迹及波动范围基本接近,支持ANN策略对预期回报和风险的良好捕捉。
  • 说明方法实用性强,能够实现动态管理。 [page::11]


---

四、估值分析



本报告核心不涉及传统估值,而是围绕动态资产配置的数学优化问题和策略拟合,利用深度学习作为逼近优化策略的有效工具。因此,估值更多体现在:
  • 利用效用最大化作为投资目标函数,结合随机控制理论中HJB方程理论解析的基准。

- 将高维连续状态空间中的策略映射换成ANN前馈网络的参数空间优化问题。
  • 采用蒙特卡罗模拟及Euler-Maruyama离散法估计终端财富效用,并用SGD方法进行参数估计和拟合。


该方式规避传统因高维HJB求解而导致的算力瓶颈,实现动态投资策略的实用估计和辅助决策。[page::5,6,12,13]

---

五、风险因素评估



报告中隐含以下关键风险点:
  • 模型假设风险:

- Heston模型及GBM是理想化模型,实际市场可能存在非正态分布、跳跃过程等特征,可能影响策略有效性。
- 波动率过程假设为CIR型,实际波动率可能更复杂。
  • 训练风险:

- ANN训练依赖随机梯度下降及蒙特卡罗模拟,可能受样本不足、训练过拟合、局部极小等问题影响。
- 数据质量和量的限制可能对训练结果造成偏差。
  • 执行风险:

- 该模型允许卖空和无约束借贷,未考虑交易成本、市场冲击和限制,现实中需谨慎调整。
  • 市场动态变化风险:

- 模型假设市场参数不随时间或状态显著变化,实际情况可能存在结构性转变,影响策略适配性。

报告未重点展开缓解方案,侧重展示方法论及其适用性,后续研究和应用中需要结合实际限制及风险管理机制。 [page::2,3,6,10]

---

六、批判性视角与细微差别


  • 优点:

- 取得了教学与研究价值极高的突破,将复杂动态控制问题转化为深度学习问题。
- 计算效率明显提升,现实中可操作性增强,具有应用推广潜力。
  • 潜在局限:

- 训练神经网络使用的结构较为简单,损失多层深度或复杂交互信息捕捉能力,未来可探索更深或更复杂架构。
- 训练过程对超参数和初始化权重较敏感,报告中采用随机初始化,可能存在训练不稳定风险。
- 对于多资产、多因素扩展尚未充分覆盖。
- 模型中允许运用无限制卖空和借贷策略,在实际市场中不太现实,缺少交易或流动性成本的考虑限制了实战使用。
  • 内部细节注意点:

- Heston模型中ANN权重表现出轻微时间相关性,而理论最优解仅依赖波动率,这可能引起策略效率的波动。
- 数据切分和防止过拟合措施虽提及,但具体效果和模型泛化能力没有深入说明。
  • 总体:报告在理论框架和演示实现非常扎实,但未来工作需进一步丰富模型复杂性、风险控制及实际约束考虑。 [page::2,6,10,11]


---

七、结论性综合



本文报告系统性地介绍并验证了一种利用深度学习中的前馈人工神经网络作为动态投资组合反馈控制策略的创新方法。通过将传统的基于随机控制理论的动态资产配置问题,特别是Merton最优配置问题,转化为直接基于经验效用最大化的神经网络训练任务,实现了极具通用性和高效性的资产配置框架。
  • 实证验证方面:

- 在经典GBM及更复杂的随机波动率Heston模型下,使用实际的S&P 500与VIX市场数据标定参数。
- ANN策略成功逼近理论最优策略,体现在权重路径、效用函数值及财富过程模拟上均与解析解密切匹配。
- 优化训练过程在计算资源受限的单台普通笔记本电脑上即可完成,极大降低使用门槛。
  • 重要图表洞察:

- 图1和图2证明在GBM设定下ANN对Merton比例的准确逼近和风险参数敏感性符合理论预期。
- 图4和图5揭示在随机波动率环境下,ANN对复杂动态权重的建模效果以及可实现近似理论最优财富演进。
- 表2和表4通过蒙特卡罗模拟期望效用统计,强化了策略效果的可靠性。
  • 方法优势总结:

- 不依赖HJB方程计算,提升模型适应性和扩展性。
- 算法易于实现,代码开源,便于同行评估和扩展。
- 可推广至多资产、多模型情形,未来潜力巨大。

综上,该研究揭示了深度学习在复杂金融动态资产配置问题中的创新应用,为资产管理实践与金融工程领域带来新路径和思路,是跨学科融合应用的典范。[page::0-13]

---

参考文献



详见报告末尾[page::13]。

---

注:所有引用都严格标注了对应页码以确保溯源准确。

报告