`

Large-scale Time-Varying Portfolio Optimisation using Graph Attention Networks

创建于 更新于

摘要

本报告提出并实证检验了基于图注意力网络(GAT)的全新大规模时变投资组合优化方法,利用30年中型市值公司数据,构建基于距离相关系数和三角最大过滤图(TMFG)的图结构,直接以夏普比率为损失函数进行端到端训练,实现了风险调整收益的最大化。实证表明,GAT优化组合在风险调整后的收益率方面显著优于均值方差模型、网络指标模型和平等权重组合,且在不同市场环境中表现稳健,投资组合权重分布合理,交易成本较低 [page::0][page::9][page::24-31].

速读内容

  • 数据覆盖30年美国中型市值企业,样本涵盖16,793家公司,采用3年滚动窗口,单次投资组合约包含5,000家活跃企业,默认率约1.5%,全样本期间累计为8.5% [page::9]。

  • 采用基于波动率序列的距离相关系数衡量企业间非线性相关性,优于传统的Pearson相关系数,支持不同长度序列计算,解决企业进出市场和数据缺失问题 [page::10-12]。

- 利用TMFG过滤算法对密集距离相关图进行稀疏化处理,生成最大边权平面子图,极大减少边数同时保留信息,适用于大规模企业网络 [page::12-14]。
  • 网络中心度指标(度中心性、介数中心性、接近中心性)构建复合“逆周边性”指标,用于比较网络结构投资策略的资产分布 [page::13-15]。

- GAT模型采用多头注意力机制对邻居节点权重自适应分配,结合两层带L1正则化的前馈网络生成投资权重,最终通过自设计的权重归一且稀疏化层确保组合权重满足投资约束,避免软最大化导致权重分散 [page::16-19]。
  • 对比基准包括均值方差模型、网络逆周边性指标模型和平等权重模型,所有模型均使用期权信息分割的测试集进行滚动检验,性能基于投资组合层面的夏普比率衡量,且评价交易组合的周边性、行业分布及换手率等辅助指标 [page::19-23][page::24][page::27-30]。

- 结果显示,GAT模型在测试集上年化夏普比率为1.082,显著优于均值方差模型(0.700)、网络模型(0.820)和平等权重模型(0.830),且长期表现稳健,特别是在市场多次波动周期中保持优势。
  • 投资组合的中心性分析显示,GAT模型挑选的公司相对均衡,不极端偏好图网络的周边节点,与传统网络指数模型相比更注重中枢节点,降低因极端边缘选股带来的风险。

  • GAT优化权重在过滤后图中集中分布于特定分支,显示非均质配置,兼顾核心与周边节点,同时抑制低效持仓,提升组合稳定性。

  • 行业配置层面,四种模型均偏重制造业,但GAT模型对行业权重动态调节幅度适中,展现一定的灵活性以应对不同市场环境。

  • GAT模型采用正则化减少持仓数,空仓比例显著高于均值方差模型,降低交易管理成本。

  • 换手率分析表明,GAT模型相较均值方差和网络模型具有更低的换手率,减少交易费用,且适应市场变化调整组合,维持组合活跃度和灵活性。

  • 综上,GAT结合距离相关和TMFG过滤的深度图神经网络模型,有效捕捉复杂非线性关系,提高了中型市值组合的风险调整表现和交易效率,具备较强实用潜力 [page::30-31]。

深度阅读

研究报告详尽分析:Large-scale Time-Varying Portfolio Optimisation using Graph Attention Networks



---

1. 元数据与概览



标题:Large-scale Time-Varying Portfolio Optimisation using Graph Attention Networks
作者:Kamesh Korangi, Christophe Mues, Cristián Bravo
机构:南安普敦大学商学院决策分析与风险部门及相关研究中心,西安大略大学统计与精算科学系
发表时间:不明确,但涵盖1990-2021年数据,最新引用2023年文献,推断为近期发表
主题:针对大规模、时间变化的中型市值股票组合优化,利用图神经网络中的图注意力网络(GAT)对投资组合构建进行优化,突破传统基于均值-方差模型的局限。

核心论点
  • 传统Markowitz的均值-方差模型存在许多限制,如对资产流动性不足、出现违约风险的公司处理不充分;

- 本文首次纳入可能违约的中型市值公司,使用时间变化的完整公司集合进行投资组合优化;
  • 利用Graph Attention Networks(GATs)结合距离相关系数和Triangulated Maximally Filtered Graph(TMFG)构建公司关系图,并设计基于Sharpe比率的损失函数直接最大化风险调整回报;

- 该方法在30年数据长期回测中表现优异,显著优于均值方差、网络特征投资组合及等权重投资组合。

该报告的主要信息传递为:深度图学习模型(尤其是GAT)能够有效处理高维、动态的关联金融资产投资组合优化问题,充分考虑非线性依赖与市场动态变化,带来更优风险调整收益。[page::0][page::1][page::4][page::9]

---

2. 逐节深度解读



2.1 摘要与引言


  • 摘要详细说明了研究动机:传统投资组合模型忽略违约风险公司、只考虑有限样本;而本文创新将所有中型市值公司纳入优化,利用深度学习捕捉非线性、动态网络关系。

- 引言部分点明传统均值-方差模型假设和应用缺陷,如正态分布、无交易成本、参数估计偏误、难以应对高维度数据等,促使学者尝试新方法,包括模糊编程、量子退火、深度强化学习等。本文聚焦网络拓扑理论,通过系统构造公司间网络,揭示传统方法无法捕获的企业间复杂关系。[page::0][page::1][page::2]

2.2 网络拓扑的应用与中型市值股票特性


  • 作者介绍企业网络构建形式及重要性。具体用无向图表示企业节点及边,证明网络内外围节点往往带来更高的多样化收益。

- 中型市值公司(市值10亿至100亿美元间)数量众多、流动性较低,收益分布偏离正态。因此,这类资产组合构造难度大,但它们可作为独立资产类别显著改善组合分散性,同时带来风险补偿。
  • 市场动态、公司更替(申报破产、新上市)导致投资组合构建需动态调整,简单指数复制策略成本高昂且效果欠佳,现有研究对中型市值投资组合较少涉猎。[page::2][page::3]


2.3 距离相关与图滤波


  • 介绍距离相关指标对捕捉非线性变量依赖性的优势,克服传统皮尔森相关仅能探测线性相关的短板。该指标对长度不等、缺失时间序列耐受力强,适合中型市值高波动资产。

- 利用距离相关构造全连接加权网络,而应用TMFG算法进行滤波,生成稀疏兼具最大信息保持的平面网络。TMFG的计算效率及可并行性质尤其适合大规模资产网络构造。
  • 该图形网络的结构不仅方便后续GAT输入,也帮助直观理解市场关系拓扑以及波动风险传播。

- 并行计算框架(SLURM、GPU、CPU混合)保证距离相关计算在合理时间内完成,体现实际应用可行性。[page::3][page::9][page::10][page::12][page::13]

2.4 图神经网络及图注意力网络介绍


  • 从早起GNN递归网络逐渐发展到图卷积网络(GCN),再到引入注意力机制的图注意力网络(GAT),加强邻居节点权重的灵活学习能力。

- GAT采用自注意力,通过可训练参数为不同邻居赋权,不仅增强模型表达能力,还能适应图结构随市场环境变化动态演化的特征。
  • 以往金融中GNN应用尚处于起步,如信用风险、欺诈检测、个股推荐等,且小规模标的为主。中型市值大规模、多样的资产背景更适合利用模型的高维特征提取能力和非线性映射能力。[page::8][page::16][page::17]


2.5 数据与特征构造


  • 数据涵盖1990年至2021年间美国所有中型市值股票,累计16,793家公司,考虑自然进出、中途破产等变化,滚动窗口内约5,000家公司。

- 以每日收盘价计算每日收益率及30日波动率序列,波动率用来刻画市场情绪和风险传导动态。
  • 构造企业特征矩阵$Xt$,每行对应一公司过去一段时间(日度收益率序列)特征向量。

- 距离相关矩阵计算复杂,采用高性能计算并行加速,保证大规模计算的可行性。
  • 找到合适的图滤波策略(TMFG),得到稀疏网络供后续GAT使用。[page::9][page::10][page::11][page::12]


2.6 网络中心性指标及基准模型


  • 设计了逆中心性指标结合了度中心性、介数中心性、接近中心性三种指标,衡量公司在网络中的边缘位置。该指标为传统基于外围资产投资逻辑的理论指标。

- 基准模型包括:
- 经典均值-方差模型,求解最优权重以均衡预期回报和波动风险。
- 网络指数模型,按逆中心性分配权重,突出外围资产。
- 等权重模型,简单分配等权重,不需训练。
  • 所有模型均使用滚动窗口动态调整,三个月为一个测试期,确保实时性及适应性。[page::13][page::19][page::21][page::22]


2.7 模型构建细节:Graph Attention Networks


  • GAT利用多头注意力机制学习邻居节点权重,不同头学习不同层次关系,如短期趋势与长期联系。

- 输入特征(收益率序列)经GAT输出高阶嵌入$H
t$,再经过两层前馈网络、BatchNorm、Dropout、L1正则化等层处理。
  • 最后,通过“重要性层”将输出分数转换为权重,权重范围[0,1]且和为1。

- 为控制权重稀疏性,避免Softmax带来的微小多头持仓,设计了归一化加权分数机制,带来稳定训练、稀疏投资组合结构。
  • 训练目标采用基于Sharpe比率的自定义损失函数,直接最大化风险调整收益,避免逐资产收益预测带来的误差积累。

- 训练中应用早停策略防止过拟合,训练数据、验证数据及测试数据确保时间上严格区分。[page::16][page::17][page::18][page::19]

---

3. 图表深度解读



3.1 图1 - 样本公司数量及违约率趋势图


  • 横轴为年份(1993-2019),左纵轴为默认率(黄色线,约1%-2.5%浮动),右纵轴为样本公司数(蓝色柱状,约4500至6200范围)。

- 展示了市场中中型股公司规模和信用风险的长期动态,验证该市场存在持续违约风险,样本公司数相对稳定。该数据基础支持用完整动态股票集合建模的合理性。[page::9]


3.2 图2 - TMFG滤波后公司网络快照


  • 展示了某一时点通过距离相关和TMFG滤波得到的股票关系网络,图为树状稀疏结构,中央几几个节点较为密集/中心,外围分支繁多。

- 网络结构体现了股价波动之间强弱联系,中央节点代表高连接性资产,外围节点代表低关联资产。
  • 该直观图形支撑作者技术路线,实现企业间局部依赖捕获。[page::14]



3.3 图3 - GAT模型架构示意图


  • 输入:每个节点包含对应公司过去收益率序列(节点特征)及邻接关系。

- GAT层输出节点嵌入,后接两层带正则化及dropout的Dense层,将节点嵌入映射到得分空间。
  • 最后“重要性层”将各个节点得分转换成投资权重。

- 该图清晰体现了深度学习模型在图数据上的端到端学习流程,说明了通过图注意力机制捕获结构性信息,再映射生成投资决策的核心步骤。[page::20]


3.4 图5 - 各模型Sharpe比率随时间变化


  • 曲线图显示1990年至2021年间四模型按4季度滚动平均Sharpe比率走势。

- GAT模型(蓝线)在前5年表现与其他模型相似,之后持续领先并稳定表现高于基准。
  • 均值方差模型经常处于最低水平。

- 表现差异在不同市场周期保持稳健,验证GAT方法普适性。体现了模型捕捉市场动态、复杂关系能力的优势。[page::26]


3.5 图6 - 投资组合加权网络中心性指标


  • 展示各投资组合基于公司权重加权后介数中心性及度中心性平均值,带误差条代表时间序列波动。

- GAT模型的中心性指标均表现出较低方差,说明其投资选择更为稳定且不偏极端外围或核心资产。
  • 网络模型中心性最低,强调选取外围资产但未必带来收益提升;均值方差模型则存在较大波动,表现不稳定。

- 结合策略绩效,提示纯外围投资虽有理论优势,但忽视违约风险可能导致性能下降。[page::26]


3.6 图7 - GAT模型投资权重在网络中分布


  • 节点颜色由浅到深绿色标示权重大小,粉色为零分配。

- 权重明显集中分布于少数外围和部分中心节点,非单一外围节点集中投资。
  • 体现模型平衡多重风险及关联复杂性,权重分配合理,避免极端分散或局部过度集中。[page::28]



3.7 图8 - 行业权重分布


  • 对四种模型在主要行业的加权分布进行比较,制造业占比最大(约40%-45%)。

- GAT模型行业配比变化较大,表明其动态调整能力优于等权和网络指数模型,但低于均值方差模型。
  • 这进一步表明GAT模型融合行业动态信息,有效管理行业风险暴露。[page::29]



3.8 图9 - 无资金分配公司百分比随时间变化


  • 仅GAT和均值方差两模型比较,GAT未分配资金公司比例极低且稳定在2%-10%左右,均值方差模型20%-80%波动。

- 说明GAT进行稀疏化控制并保证配置稳定,均值方差模型缺乏正则化易引入噪声资产。
  • 该特征关联交易成本降低,模型拟合更经济高效。[page::29]



3.9 图10 - 组合季度换手率


  • 不同模型每季度新增与关闭持仓占比,合计换手率柱状图。等权基准持仓变动约16%。

- GAT模型换手率最低(含新增关闭),波动性略大,代表有针对性调整。
  • 均值方差换手率最高,反映模型不稳或过度拟合。

- 图表确认GAT模型在风险管理和交易成本控制间取得较优平衡。[page::30]


---

4. 估值分析



本报告无传统估值(如DCF或市盈率分析)内容,重点在于组合权重的优化过程和风险调整后的收益表现。
估值的内涵通过Sharpe比率来体现,作为风险调整后报酬的综合衡量而非绝对价格水平。因此估值分析侧重于模型对风险、波动、收益动态的估计及优化,而非资产本身估价。

模型通过自定义loss函数,最大化投资组合的Sharpe比率,而权重生成和调整则通过神经网络架构实现,约束符合资金归一和稀疏化要求。敏感性反映在模型训练中的正则化参数调整以及滑动窗口设置,通过长期稳定表现体现模型鲁棒性。

---

5. 风险因素评估


  • 市场风险:模型应对市场波动及多周期风险传导,基于动态网络变化设计,能因应经济周期与市场震荡调整组合。

- 公司违约风险:含违约公司入池,故模型自然面对违约风险,且报告指出违约率约为1.5%,对组合影响显著。
  • 数据缺失及时间不均风险:距离相关指标支持不等长时间序列,防止因数据缺失导致偏差,增强模型稳定性。

- 估计风险:均值、协方差估计误差在传统方法表现欠佳,GAT模型通过端到端学习减轻该问题。
  • 交易成本风险:报告未明确计入交易成本,实际操作需注意换手率控制。GAT模型设计稀疏而控制换手率。


模型设计充分考虑风险因素,通过正则化、图滤波、对时间动态捕捉减轻各种潜在风险,提升使用安全边际。[page::1][page::9][page::28][page::30]

---

6. 批判性视角与细微差别


  • 模型创新及表现优秀,但不乏潜在偏差风险。

- 虽纳入违约风险资产,却未显式就资本结构或债务水平建模,忽略直接信用风险计量,或影响实际组合表现与风险评估。
  • 模型训练与测试均基于历史数据,未来市场结构变迁及极端黑天鹅事件敏感度未知。

- 损失函数仅基于Sharpe比率,未充分考虑收益分布非对称性(如尾部风险),模型可扩展性有待加强。
  • 实践中交易成本、市场冲击成本未明确计入,可能导致实际收益下滑。

- 网络滤波方法虽提升计算效率,滤波选择参数或影响底层信息完整性。
  • GAT模型解释性相对薄弱,决策依据难以直观展示,限制实际监控和合规审查。


综上,尽管研究具有创新性及良好理论支撑,实际应谨慎部署,重视模型假设和结果解释局限性。[page::29][page::31]

---

7. 结论性综合



该报告提出了一种融合距离相关系数、TMFG图滤波和基于图注意力网络的深度学习框架,用于动态、大规模的中型市值股票投资组合优化。通过构建时变图网络,模型不仅捕捉了公司间非线性、动态的关联,还利用GAT的注意力机制动态赋权邻居节点,实现了结构性的权重分配。训练目标针对Sharpe比率直接优化,确保了风险调整后的优异表现。

从30年历史数据实验看,GAT模型年化Sharpe比率达到1.082,显著优于均值方差(0.7)、网络指数(0.82)及等权重(0.83)等传统方法,且表现更稳定,波动更小。GAT模型在网络中心性指标上呈现低方差,偏好适度外围且非极端边缘资产,分配更为集中,投资组合稀疏且换手率更低,展示了更好的交易成本优势和稳健性。

图表清晰展现数据特征、网络结构以及模型投资权重分布情况,支持上述总结。报告结构严谨,理论依据充分,方法创新,是金融风险管理领域将图神经网络应用于真实市场组合管理的前沿研究,对未来机器学习在资产管理的推广具有参考价值。

---

参考部分重要图表整理



| 图号 | 内容摘要 | 重点说明 | 页码参考 |
|---|---|---|---|
| 图1 | 样本公司规模及违约率动态 | 验证样本动态、违约风险存在;支持动态投资池设定 | [9] |
| 图2 | TMFG滤波后构建的公司相关网络示意 | 形象展示企业间依赖结构,中心外围节点明确 | [14] |
| 图3 | GAT模型架构示意 | 明确输入、分层、权重归一过程 | [20] |
| 图5 | 各模型Sharpe比率长期趋势 | GAT长期领先稳定,传统方法相对弱 | [26] |
| 图6 | 投资组合加权网络中心性指标 | GAT选择稳定、非极端外围节点 | [26] |
| 图7 | GAT分配权重网络分布 | 权重在网络各层合理分布,突出重要节点 | [28] |
| 图8 | 组合行业权重分布 | 不同行业动态配置,GAT灵活适应行业风险 | [29] |
| 图9 | 未分配资金公司比例时间序列 | 体现GAT模型稀疏与稳定特征 | [29] |
| 图10 | 组合季度换手率对比 | GAT换手最低,交易成本优势明显 | [30] |

---

综上所述,该研究系统性、创新地将图注意力网络与金融组合优化结合,处理了大规模、动态且高风险的资产池问题。通过高性能计算及合理的图滤波、特征构造与损失设计,模型获得了实质性的业绩提升和操作优化,有望为资产管理领域的机器学习应用树立新标杆。[page::0][page::1][page::2][page::3][page::4][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24][page::25][page::26][page::27][page::28][page::29][page::30][page::31]

---

如果需要,我可以对某部分内容进行更细节的展开和解读。

报告