`

INTEGRATING LLM-GENERATED VIEWS INTO MEAN-VARIANCE OPTIMIZATION USING THE BLACK-LITTERMAN MODEL

创建于 更新于

摘要

本报告提出将大型语言模型(LLM)生成的视角融入Black-Litterman资产配置框架,通过对标S&P 500成分股的历史数据和公司元数据,预测股票预期收益并量化预测不确定性,进而优化投资组合。实证回测显示,基于LLM视角的组合优化明显优于传统均值方差模型,且不同LLM在预测乐观程度与置信稳定性上存在差异,影响组合表现,为自动化动态生成投资者视角提供了新思路 [page::0][page::1][page::4].

速读内容

  • 研究背景与目标 [page::0][page::1]:

- 传统均值-方差模型对输入参数敏感,导致组合稳定性差。
- Black-Litterman模型通过整合投资者视角缓解以上问题,但视角定义难题依然存在。
- 本研究创新性地运用LLM自动生成视角以用于Black-Litterman优化,推动视角生成的自动化与规模化。
  • 数据与方法 [page::1][page::2][page::3]:

- 选取2024年6月至2025年2月间标普500市值排名前50股票的历史价格和元数据。
- 利用LLaMA-3.1-8B、Gemma-7B、Qwen-2-7B、GPT-4o-mini 四款LLM,分别基于过去两周的数据预测未来两周的日均收益。
- 对每只股票,每款LLM回应10次,均值作为视角值(q),方差构建置信矩阵(Ω)。
- 将预测结果纳入Black-Litterman模型,实现均值协方差矩阵的贝叶斯修正,生成组合权重。
- 投组合每两周调整一次,回测8个月。
  • 主要实证结果 [page::4][page::5][page::9]:


| 指标 | S&P500 | EW | MVO | BLM-Llama | BLM-Gemma | BLM-Qwen | BLM-GPT |
|-------------|--------|-------|--------|-----------|-----------|----------|----------|
| CAGR |11.59% |35.95% | -1.89% | 67.31% | -25.93% | 14.94% | -12.76% |
| 夏普比率(年化) |0.7228 |2.5075 | 0.0087 | 2.1817 | -1.4778 | 0.5959 | -0.5054 |
| 最大回撤 |-8.49% |-5.19% |-18.28% |-12.45% |-21.24% |-15.09% |-11.57% |
- BLM-Llama模型组合表现最优,年复合增长率达67.31%,显著优于其他模型及基准。
- 等权重组合(EW)表现稳定,波动率最小,夏普率最高。
- 传统均值-方差(MVO)组合表现最差,反映其易受估计误差影响。
- BLM-Gemma及BLM-GPT表现不佳,负收益表明视角预测存在偏差或不稳定。
  • 视角分布与组合权重分析 [page::5][page::9]



- BLM-Llama视角分布体现明确的负面异常值,强化筛选效果,导致组合高度集中于优质标的。
- BLM-Gemma视角分布偏向悲观且波动大,影响组合表现。
- BLM-Qwen较为中性、谨慎,组合表现稳定但不突出。
  • 量化策略构建亮点 [page::2][page::3][page::8][page::9]

- LLM视角预测结合方差置信度,构造视角向量q与置信矩阵Ω,代替传统人工主观视角。
- 采用贝叶斯框架的Black-Litterman模型融合市场均衡收益与LLM生成视角,提升组合稳定性和预期收益。
- 组合权重优化限于无空头且全权重和为1的约束,风险厌恶系数λ取0.1。
  • 总结与展望 [page::5]

- LLM辅助Black-Litterman为投资组合构建提供了创新机制,提升投资回报与稳定性。
- 不同LLM表现差异显著,体现其预测乐观度与置信水平对组合影响关键。
- 后续研究可引入金融文本信息如新闻与财报,利用LLM的自然语言理解能力进一步丰富视角生成,并进行系统超参数调优以提升模型效果。

深度阅读

金融研究报告详尽分析


报告题目


Integrating LLM-Generated Views into Mean-Variance Optimization Using the Black-Litterman Model

元数据与概览

  • 作者及机构:

- Youngbin Lee, Suin Kim, Elice
- Yejin Kim, Meritz Fire & Marine Insurance
- Yongjae Lee, Ulsan National Institute of Science and Technology
  • 发布时间: 2025年左右(基于数据和模型发布时间)

- 研究主题: 结合大语言模型(LLMs)预测视角与经典投资组合优化,利用Black-Litterman模型提升资产配置质量。
  • 核心论点与目标:

本文探讨如何将LLM自动预测的预期收益(股票每日收益率)作为“投资者视角”,整合进Black-Litterman框架以生成更加稳定且有效的投资组合。通过多模型比较与实证回测,论证LLM生成的视角对资产配置的正面贡献,尤其在降低均值-方差优化固有敏感性方面的潜力。目标价无,主要为方法论验证及绩效对比。
  • 作者欲传达关键消息:

传统均值-方差模型对参数极度敏感,Black-Litterman模型虽改进但视角定义困难;LLMs因强大数据处理能力,可提供系统化、动态化、数据驱动的视角生成方法,提升资产配置的科学性和自动化水平。不同LLM模型表现不一,影响组合的风险收益。

---

1. 引言与研究背景



1.1 投资组合优化的挑战

  • 经典Markowitz均值-方差模型(1952)在预期收益和协方差输入上极为敏感。

- Black-Litterman模型(1992)引入贝叶斯视角融合,以市场均衡收益为先验,结合投资者主观视角调整收益期望,增强优化稳健性。
  • 如何精准、系统定义投资者视角仍是工业界和学术界的难题,传统依赖专家主观或复杂特征工程。


1.2 LLM的潜力与本研究创新点

  • 大型语言模型(LLMs)可以理解、总结大量金融历史数据和公司元信息,自动产生收益预期。

- 本研究首次系统地利用LLM生成的多重预测视角(含置信度),代替传统人工视角输入,嵌入Black-Litterman模型,验证其对实际投资组合的影响。
  • 回测采用过去两周股票数据预测接下来两周收益,频繁双周调仓,实证结果对比S&P500、等权和传统均值-方差优化组合。


---

2. 方法论详解



2.1 数据与研究设计

  • 研究对象为2024年6月至2025年2月间市值排名前50的S&P500成分股(共50只股票)。

- 调仓周期双周滚动,前两周价格数据输入LLM,获得下一周期的收益预测。此机制保证视角与市场变化高度同步。
  • 融入公司元数据(如GICS行业分类、公司名称等)加强LLM对具体股票语境理解。


2.2 LLM模型选用与输出设计

  • 采用四种最新开源及商用模型:

- LLaMA-3.1-8B(Meta)
- Gemma-7B(Google DeepMind)
- Qwen-2-7B(阿里)
- GPT-4o-mini(OpenAI)
  • 所有模型知识截止均在预测期之前,保证无未来信息泄露。

- 每只股票同一预测任务调用LLM 10次,通过返回结果的均值作为收益预期,方差代表置信度。

2.3 LLM预测视角的表达与提示设计

  • 采用结构化提示(Prompt)向LLM提供:

- 过去两周的每日收益率时间序列
- 公司信息(股票代码、名称、GICS行业及子行业)
  • 模型需基于统计趋势预测未来两周平均每日收益,无需额外解释或评论,输出单一数值。


2.4 Black-Litterman模型核心机制

  • 市场均衡收益向量 \(\pi\) 依据CAPM与市值权重得到,作为贝叶斯先验;协方差矩阵 \(\Sigma\) 由历史收益估计。

- 传统BL模型通过视角向量 \(\mathbf{q}\)(投资者对资产收益的主观看法)及置信度矩阵 \(\Omega\) 调整 \(\pi\),形成后验预期收益 \(\mu\)。
  • 本文创新点:LLM输出的均值作为 \(\mathbf{q}\),LLM预测不确定性(10次方差)构成 \(\Omega\) 对角线元素。

- 采纳的贝叶斯公式如下:
\[
\mathbf{y} = \mathbf{X}\pmb{\mu} + \pmb{\varepsilon}, \quad \pmb{\varepsilon} \sim \mathcal{N}(\mathbf{0}, \mathbf{V})
\]
其中 \(\mathbf{y} = [\pi; \overline{q}]\), \(\mathbf{X} = [I]\), \(\mathbf{V} = \begin{bmatrix} \tau \Sigma & 0 \\ 0 & \Omega \end{bmatrix}\),\(\tau=0.025\)为信心水平超参数。
  • 视角和对应资产一一关联,\(\mathbf{P}\)为单位矩阵确保视角具体到单只股票。


---

3. 实证结果解析



3.1 投资组合表现对比(图表及表格解析)



图表描述:

  • 图3 展示2024年6月至2025年2月期间不同投资组合的累计收益曲线。

- 组合包括S&P500指数、等权组合(EW)、传统均值-方差优化组合(MVO)、以及基于LLM视角的BL模型优化组合(BLM-Llama、BLM-Gemma、BLM-Qwen、BLM-GPT)。
  • 表1 汇总多项投资指标对比:年复合增长率(CAGR)、日均收益、日收益标准差、Sharpe比率、最大回撤(MDD)、VaR与CVaR等风险指标。


关键发现:

  • BLM-Llama组合表现领先

- CAGR高达67.31%,远超S&P500的11.59%和等权组合的35.95%。
- 年化Sharpe比率为2.18,也非常优异,显示收益与风险调整后表现卓越。
  • EW组合波动率最低(0.74%日标准差),Sharpe最高(2.51),稳定性强。

- 传统MVO组合表现最差,CAGR负值且Sharpe接近零,凸显传统模型对输入敏感导致收益和风险控制不佳。
  • BLM-Gemma和BLM-GPT组合均录得负收益,表明其LLM预测视角不佳,导致资产配置失误。

- BLM-Qwen表现中规中矩,不过整体收益与风险指标在中低水准。

综合上,利用LLM生成视角的黑利特曼优化在适当模型(Llama)下能显著提升投资组合表现和稳定性,验证了本文的核心假设。

3.2 LLM视角分布分析(图4解读)



图4描述:

  • 该图为不同LLM在每次调仓时对50只股票预计平均日收益率的箱形图(截断在±2%内),展示收益预期的分布及极端值。

- 横轴为时间,纵轴为预期收益率百分比。

解读及意义:

  • BLM-Llama的视角极值最多(尤其是负异常值),显示其在选股上有较强的“过滤”倾向。

- 该极端视角可能导致其组合高度集中于少数优质股票,提升收益潜力。
  • BLM-Gemma视角呈明显负偏与较大波动,表明其较为悲观且不稳定,导致整体表现不佳。

- BLM-Qwen趋于中性和谨慎,预期收益集中于零附近波动较小,体现其保守策略,因而收益表现平庸。
  • 视角的“锋利度”(差异化及置信度)对最终组合构建及表现影响显著,锐利而清晰的视角能赋能更有效的资产区分与配置。


---

4. 估值与优化模型说明



4.1 组合优化公式(附录内容解读)

  • 本文实现两种优化方法:

- 基于LLM视角的黑利特曼优化:使用贝叶斯调整后的后验收益向量 \(\mathbf{r}\) 和协方差矩阵 \(\Sigma\),并以风险厌恶系数 \(\lambda=0.1\) 最大化组合期望收益并控制方差。
\[
\min_{\mathbf{w}} \quad \mathbf{w}^\top \Sigma \mathbf{w} - \lambda \cdot \mathbf{w}^\top \mathbf{r}
\]
- 传统均值-方差基线:基于历史均值收益和协方差矩阵优化,计算方式相同。
  • 均限制条件:权重和为1,无空头(权重均非负)。


该结构保证比较公平,控制风险厌恶一致的前提下考察不同收益预测对组合的影响。

---

5. 组合权重演变图(图5解读)



图5描述

  • 展示不同LLM模型产生的黑利特曼组合在多次调仓期间对50只股票的资产配置权重随时间的变化。

- 每个条状图堆叠色块对应不同股票,颜色标识各股票。

解读

  • BLM-Llama组合配置高度集中,少数股票占据较大权重,反映其视角的极端化选择。

- 其他模型如BLM-Gemma和BLM-GPT配置较为分散且变动频繁,表现出模型视角的不稳定性。
  • 权重集中对应收益提升和更明显的股票择优能力,但也提高了组合风险和波动性。


---

6. 风险因素评估


  • LLM视角的准确性与稳定性是实现良好组合表现的关键。异常或不稳定的预测方差导致视角置信度降低,影响优化权重配置。

- 纯数据驱动的LLM视角可能缺乏足够市场宏观和突发事件敏感度,后续可引入更多文本信息和调整机制。
  • 传统MVO模型风险来自对输入均值和协方差估计的高敏感性,容易产生过度集中或极端配置。

- 本研究采取无空头约束及统一风险厌恶参数,未测试参数敏感性,可能限制风险调整灵活性。

---

7. 批判性视角与细节澄清


  • 报告样本及时间窗口较短(8个月且50只股票),未来需长周期更大样本验证结果的稳健性。

- LLM模型的预训练知识截断时间虽保证无未来数据泄露,但其推理能力及训练数据差异可能导致预测偏差,不同模型间表现差异显著。
  • 对于过于极端负面视角的股票是否存在市场高估或模型误判,报告未深入分析和验证。

- 研究方法自动化强,但在多维金融现实中仍需结合专家判断与更多非结构化数据,提升结果可信度和实用性。

---

8. 结论性综合



本研究开创性地将大型语言模型(LLMs)生成的预期收益视角,成功整合进经典的Black-Litterman资产配置框架,解决了传统均值-方差投资面临的输入敏感性与主观视角难以定量的问题。

凭借双周数据驱动的LLM视角生成机制,构建出的投资组合表现超越传统均值-方差和市场基准。特别是LLaMA模型产生的视角最为有效,导致组合收益率显著提高(CAGR约67%),并保持较高的收益稳定性(年化Sharpe>2)。

视角的分布特征及置信度对最终组合构成关键影响:锋利而有辨析力的视角(如BLM-Llama)能有效过滤劣质资产,提升组合集中度,实现风险调整后的超额收益。与之对比,视角波动大或带负偏的模型风险更高,组合表现不佳。

图表信息和时间序列资产配置展示进一步支持了结论,强调基于LLM的自动化视角生成是资产配置领域具有前景的创新路径。未来研究可强化模型调参、集成更多金融文本信息,拓展到更广泛的市场和资产类别。

---

重要图表附录


  • 图1(第2页) LLM视角生成与Black-Litterman集成流程示意图,清晰展现从股票历史价格到最终投资组合权重的闭环过程。



  • 图3(第4页) 6个组合累计收益对比曲线,直观体现BLM-Llama在整个样本期大幅领先其他组合。



  • 表1(第4页) 综合指标比较表,量化归纳了各组合收益、风险及风险调整性能。
  • 图4(第5页) LLM预测日收益视角的时间序列箱形图,揭示不同模型预期收益分布特征及极端值。



  • 图5(第9页) 不同LLM对应的资产权重时间序列堆叠条形图,显示组合权重动态与集中度的差异。




---

参考文献(部分)


文中引用了包括Markowitz(1952)、Black & Litterman(1992)、Sharpe(1964)、Idzorek(2007)等经典理论基础,并结合大规模预训练模型最新研究(如Dubey et al. 2024, Zhao et al. 2024)支持本文创新方法和实证设计。

---

溯源引用


本文数据和论点基于各章节及页码标注,分别为[page::0,1,2,3,4,5,8,9]。各图表说明和数据均依照报告原文细节展开。

---

总结:
本报告为金融资产管理引入先进NLP技术,立足稳健优化理论模型,展现了AI与传统金融经典模型深度融合的巨大潜力,为投资研究和实际资产配置提供了有效且创新的路径与工具。

报告