`

LLM-Powered Multi-Agent System for Automated Crypto Portfolio Management

创建于 更新于

摘要

本报告提出了一种基于大型语言模型(LLM)的多智能体多模态框架,用于自动化管理前30大加密货币的投资组合。该框架通过协作的专家智能体团队处理数据分析、文献融合及投资决策问题,创新性地引入组内及组间协作机制提升预测精度和解释能力。实证结果表明,该模型在分类准确率、资产定价能力及投资组合表现上均显著优于单一模型和市场基准[page::0][page::1][page::5][page::6][page::8][page::9][page::10]

速读内容

  • 多智能体架构设计概述 [page::0][page::1][page::3]


- 框架包含两个模块:专家训练模块负责利用多模态历史数据和专业文献对各智能体进行微调;多智能体投资模块利用实时多模态数据执行投资决策。
- 采用数据团队、文献团队、解释团队、市场团队、加密团队和交易团队6个团队分工协作完成投资任务。
- 组内协作通过融合多个智能体对同一子任务预测的置信度提升预测精度;组间协作允许跨团队共享短期记忆和市场信息,辅助更全面决策。
  • 多模态数据及专用专家智能体 [page::2][page::12]



- 利用行情数据(OHLC及成交量)、链上链外风险因子、新闻头条及学术文献组成多维度输入。
- 专家智能体针对不同模态数据微调生成高质量推理解释,增强模型可信度和可解释性。
- 数据涵盖30日行情K线图、加密货币市场及币种风险因子、Cointelegraph新闻等。
  • 量化因子构建与投资策略生成 [page::3][page::4][page::5]

- 采用基于LLM的多智能体协作机制,分别预测市场趋势(涨跌概率及置信度)及币种价格趋势。
- 组内协作:通过softmax概率融合各智能体预测结果实现Ensemble,抑制个体噪声。
- 组间协作:加密团队智能体接收市场团队的市场信息记忆,共同提升币种选择准确度。
- 策略细节包括根据最终预测概率对币种排序分为五档,选取“Very High”档构建投资组合。
- 交易团队通过API自动执行组合交易,完成端到端流程。
  • 关键性能验证与回测结果 [page::6][page::7][page::8][page::9]



- 分类准确率与Matthews相关系数(MCC)优于单LLM基线,尤其在币种价格趋势预测上体现显著提升。
- 团队内部预测结果不一致性显著降低,表明微调使专家智能体避免随机噪声。
- 多智能体模型预测的市场“涨”周和“跌”周收益差异明显高于对照模型,表现出更强的市场涨跌辨识能力。
- 投资组合累计收益显著优于Market和1/N等基准,在不同牛市及熊市阶段保持较强抗跌能力。
- 组合夏普比率及收益稳定性均优于主流基准策略。
  • 资产定价与风险因子分析 [page::9]

| 专家智能体 | 组合 | 均值(周) | 标准差 | 夏普比率 |
|------------|---------|----------|----------|------------|
| 多智能体模型 | Very High | 0.0144 | 0.0956 | 0.1510 |
| 多智能体模型 | HML | 0.0108 | 0.0611 | 0.1766 |
- 通过分位投资组合“Very High”和“HML”(买入最高组,卖出最低组),展示模型有效解释横截面收益差异。
- 多智能体模型在因子投资组合表现优于单LLM模型及传统风险因子,表明更强的资产定价能力。
  • 解释性性能与微调效果 [page::9][page::10]


- 微调后专家智能体生成的解释更丰富,更多引用了资产定价专业术语。
- 多维度指标(专业性、客观性、清晰度、一致性及推理合理性)评分均优于未经微调的单一智能体。
- 解释团队协助生成案例级详细解释用于训练,提升了模型的可信度和透明度。
  • 消融实验验证机制效用 [page::10]

| 组件 | Cumulative | Mean | Std | Sharpe |
|--------------------|------------|--------|--------|---------|
| 完整模型 | 0.8347 | 0.0172 | 0.0805 | 1.5425 |
| 移除某专家智能体 | 明显下降 | 下降 | 变化小 | 下降 |
| 禁用组内协作机制 | 下降 | 下降 | - | 下降 |
| 禁用组间协作机制 | 下降 | 下降 | - | 下降 |
- 各子模块对整体投资组合表现均有积极贡献,表明多智能体间的协同合作是模型优越性的关键。

深度阅读

金融研究报告详尽分析报告


报告标题


LLM-Powered Multi-Agent System for Automated Crypto Portfolio Management

作者与发布机构

  • 主要作者:Yichen Luo(University College London)、Yebo Feng(Nanyang Technological University)、Jiahua Xu、Paolo Tasca(University College London,Exponential Science Foundation)、Yang Liu(Nanyang Technological University)

- 机构背景:伦敦大学学院(UCL)、新加坡南洋理工大学、Exponential Science Foundation

发布背景与研究主题


本报告聚焦于加密货币领域,主题为利用多模态多智能体框架(Multi-agent multimodal framework),结合大型语言模型(LLM)技术,实现对加密货币投资的自动化和可解释性管理。研究背景在于加密货币由于其市场历史短暂、数据来源多样、市场波动大,投资决策复杂,传统深度学习虽有尝试但因“黑盒”特性缺乏信任和解释性,影响实际应用。本报告提出并验证了多智能体协作、多模态融合、基于大语言模型细化专业投资知识的创新解决方案。

1 引言及报告概览



该报告针对加密货币投资面临的三大挑战:资产历史短、数据多样(文本、图表、市场指标等)、复合的决策逻辑,提出采用大语言模型(LLMs)进行多模态数据整合与解释,突破单一模型在领域知识和推理能力上的不足。此外,提出了多智能体系统,将整体任务拆分子任务,分配给专门训练的专家型智能体合作完成,提升投资决策准确性与解释能力。
核心贡献为设计了多模态、多智能体合作框架,结合专家训练与实时多智能体投资模块,创新性地应用在市值前30的加密币投资管理中,采用专业投资文献融合实现知识强化,配合独有的组内、组间协作机制提升预测准确及解释性能。实验验证显示该框架在分类预测、资产定价与投资组合绩效上均优于单一智能体模型及市场基准。

该报告未直接给出评级及目标价,属于技术方法与模型性能验证的研究报告,重点传达多智能体多模态LLM在加密货币投资管理的优势及实证验证。

2 逐章节深度解读



2.1 相关工作回顾



此节梳理了加密货币资产定价领域的研究进展及单一LLM与多智能体(multi-agent)框架在投资领域的应用现状。
  • 加密货币资产定价早期研究沿袭传统资产定价理论,识别关键影响因子(网络活动、动量、投资者注意力、新闻情绪等),发展出特定的加密货币三个因子模型及趋势技术指标。

- 跨模态数据(面板数据、文本、图表模式)潜在信息丰富,但现有工作缺乏统一能整合所有模态的模型。
  • 单一LLM虽有较强文本理解及自然语言生成能力,但预测表现有限且偏差较大。

- 多智能体模型在股票领域已有应用,但加密货币领域尚稀缺,且现有多为单一模态数据(如只针对比特币、以太坊、Solana)。报告指出该工作创新点在于首个覆盖多智能体、多模态的当前市值加密币组合管理框架,并设计了独特的组内及组间协作机制(包括知识共享、置信度加权等)。

2.2 方法论与框架设计



本节系统剖析所提方案的任务形式化、框架结构及具体实现细节。

2.2.1 任务定义

  • 加密货币与现金资产配置:基于市场相关风险因子(β向量)与上周新闻数据,预测本周市场趋势,并以此决定现金与加密货币的权重分配,输出人类可读解释。

- 加密货币选择子任务:对预定币种集合,利用币种特有风险因子(α矩阵)及视觉数据(30天K线图),预测各币种未来7天的回报率,从而选择高回报子集,附带解释说明。

2.2.2 框架结构


报告提出两模块架构:专家训练模块与多智能体投资模块。
  • 专家训练模块:包含数据团队(抓取和处理多模态历史数据)、文献团队(收集相关学术文献)、解释团队(基于数据与文献生成带有专业解释的训练样本)

- 多智能体投资模块:实时抓取数据,市场团队(新闻与市场因子专家)完成市场趋势预测及现金-加密资产配置,密码币团队(密码因子专家与技术图表专家)完成币种选择,交易团队负责真实执行。
  • 组内协作机制通过融合组内多个智能体输出的置信度(基于“Rise”概率的log概率)形成加权预测,提高鲁棒性。

- 组间协作允许密码币团队利用市场团队的预测记忆,结合市场全局信息优化币种选择决策。

2.2.3 细节说明

  • 采用30天K线图、市场和币种特定风险因子、新闻头条等多模态数据。风险因子按五分位分类(非常高、高、中、低、非常低)。

- 训练过程中引入系统指令与多种prompt,指导解释团队生成包含专业解读的案例用于微调各智能体,提升解释能力与预测精度。

2.3 多智能体投资细节

  • 市场团队(新闻专家 & 市场因子专家):负责市场趋势(涨跌)两分类预测及解释,基于组内协作融合输出置信度均值判断结果,并决定现金与加密货币配置比例。

- 密码币团队(密码因子专家 & 技术专家):考虑市场团队输出(组间协作),参与币种级涨跌预测,融合组内预测生成币种涨幅概率分布,进而构建五个等权投资组合,投资最高概率“非常高”组合。
  • 交易团队实现自动交互交易所API,完成全流程资产管理。


2.4 实验设定与评估指标

  • 训练数据为2023年6月至10月数据,测试数据为2023年11月至2024年9月,避免数据泄露。

- 包含30大市值币种,同时排除低流动性币种风险。
  • 评估分为分类性能、资产定价能力、投资组合回报及解释质量四部分。

- 使用指标包括分类准确率、Matthews相关系数(MCC)、累计收益率、平均每周收益、收益标准差、Sharpe比率。
  • 解释质量基于专业性、客观性、条理性、一致性和推理性五维度评分,由GPT-4o自动评分。

- 组合性能与多基准对比,包括均等权重组合(1/N)、市场指数(纳斯达克加密指数)、比特币买入持有策略。

3 图表与数据深度解读



3.1 关键图表解读



图1(多模态数据展示)


图1全面展现了所使用的多模态数据结构,包括30天K线图及对应未来价格涨跌标签(图1a、1b),市场及币种特定风险因子的分级(图1c),以及从Cointelegraph爬取的新闻标题(图1d)。图中对风险因子进行了五分位分类,数据来源清晰,体现了数据多样性与覆盖面。图中数据为后续训练与推理提供基础,支持多模态融合。

图2(多智能体框架图示)


清晰呈现整个系统结构,包含数据团队、文献团队、解释团队、市场团队、密码团队与交易团队的工作流程及信息流。
  • 上半部分图示展示训练阶段从数据抓取、文献抓取、解释生成,到专家智能体微调的过程。

- 下半部分图示展示实际投资阶段各团队基于实时数据展开协作投资的流程。
  • 该图强调组内与组间协作机制所在流程,强化模型多方信息融合的设计亮点。


图3(组内及组间协作示意)


(a)展示市场团队内部两智能体各自风险预测的置信度差异与组合方式,绿色背景概率越高。
(b)展示市场团队对预测结果如何作为“记忆”被传递到密码团队,密码团队专家在多模态信息下进行加密货币选择。图体现协作机制对提升预测准确性的机制基础。

图4(预测概率分布与组内意见分歧)

  • (a)与(c)横纵坐标分别为加密因子专家与技术专家、市场因子专家与新闻专家对涨概率的预测,点密集区域及分布形状体现了不同模型的预测置信度模式。

- (b)与(d)柱状图展示各模型团队智能体之间预测意见的平均不一致度,结果显示多智能体框架及微调均显著降低不一致度,体现了协作与微调对预测稳定性的积极贡献。

图5(投资组合累积收益对比)

  • (a)以美元计价的累积收益,多智能体模型表现优于市场指数及等权组合,尤其在多数时间段表现更佳,只偶有局部落后,如2024年2月。绿色与红色区块标记市场牛市与熊市阶段,表明模型具备阶段适应性。

- (b)以比特币计价的累积收益,验证模型组合超越单纯持有比特币策略的能力,侧面证明资产选择与配置策略的有效性。

表1(分类准确率和MCC对比)


展示多智能体在加密币和市场预测两个分类任务上的准确率与Matthews相关系数。
  • 多智能体模型在大部分预测指标上均优于单智能体模型,尤其是MCC指标优势更为明显,体现了预测的综合准确性提升。

- 微调单智能体较原始单智能体也有一定提升,表明微调有助于模型学习历史模式。
  • 新闻因子子任务中部分情形下单智能体表现优于多智能体,提示新闻文本可能蕴含某些隐含信息多智能体未充分利用。


表2(市场团队“涨”“跌”预测对应平均回报)


不同模型预测为“涨”的周平均回报与预测为“跌”的周回报差异对比,多智能体模型在区分牛熊市表现最优,说明现金-加密配置逻辑有效。

表3(投资组合的均值、标准差及Sharpe比率)


展示完整投资期及牛市和熊市期间,不同组合的平均周收益、风险波动与风险调整收益率,多智能体组合整体指标优良,且在熊市中表现稳健,风险控制能力体现明显。

表4(五分位排序组合资产定价能力)


将30大币按预测“涨”概率或风险因子值排序分为5等份,统计各组合的平均收益、波动及Sharpe比率。
  • 多智能体模型“非常高”和“HML”组合收益显著优于单智能体模型及传统风险因子,说明多智能体框架有效捕捉跨币种风险溢价和结构性收益。

- HML组合回报统计显著,体现模型对跨期趋势及动量的解释能力增强。

图6与图7(解释性能示例与雷达图)

  • 图6展示带微调的加密因子专家与非微调单智能体对同一预测作出的自然语言解释,微调后解释更专业、专业术语丰富。

- 图7为多项解释评估维度雷达图,显示多智能体模型在专业性、客观性、条理性、推理性等方面优于单智能体,尤微调过程显著增强解释质量。

表5(消融实验)


通过逐个剔除智能体及协作机制,评估对收益率和Sharpe比率的影响。结果表明每个智能体及两种协作机制均对整体性能贡献显著,缺失任意构件均导致性能下降,凸显系统设计合理性及模块协同重要性。

4 估值分析



报告虽然无直接估值目标价,但采用了资产定价方法为评估预测准确与投资组合效能手段,具体体现在:
  • 将价格涨跌通过置信度概率映射至连续变量,用于构建多分位常规投资组合,借用传统金融中的资产定价框架(类似于Fama-French模型思路)。

- 评估基于多智能体输出的组合显著优于传统单因素模型,说明模型能够有效捕捉风险溢价,体现其估值能力。
  • 利用单智能体与多智能体的比较,展示了专家微调和协作机制提升市场解释力和投资收益率的路径。


5 风险因素评估



报告主要提示的风险点包括:
  • 加密货币市场历史数据有限,模型对未来市场的推广能力存在一定局限性,可能受市场异常事件影响。

- 单一数据模态或单一模型的局限带来的预测偏差风险,通过多智能体多模态设计部分缓解。
  • 微调过程可能引入过拟合或新增解释上的矛盾(特别是单智能体微调表现不佳的“解释一致性”指标)。

- 新闻文本信息隐含差异可能引起多智能体与单智能体之间的性能差异,存在进一步挖掘空间。

报告对缓解策略主要体现于多团队合作机制,充分利用不同智能体间的信息共享和置信度融合,提升整体稳健性,且通过丰富学术文献的专业知识加强模型的专业性与解释能力。

6 审慎视角与细微差别


  • 报告明确指出长期市场走势不完全可预测,这也限制了模型的预测准确率及策略稳定性的上限。

- 新闻专家微调带来的表现波动暗示了文本类数据的复杂属性及潜在噪声,提示未来模型设计中需更好处理文本数据的隐含信号与噪声平衡。
  • 单一LLM微调引入解释一致性下降,缺乏细粒度专业训练与模块拆解可能导致推理逻辑混乱。

- 多智能体模型虽提升准确率,仍有改进空间,尤其在更复杂的动态市场环境下的鲁棒性验证尚需更多实证。
  • 解释质量基于自动评分系统,未体现人类专家参与的深度验证,对结果可信度存在一定限定。


7 结论性综合



本报告系统设计并实现了一套基于多智能体、多模态大语言模型的可解释加密货币投资管理框架。通过任务拆解与专家微调,结合新颖的组内外协作机制,成功解决了加密货币投资数据多样性与决策复杂性带来的挑战。实证结果充分验证了该框架在分类准确率、资产定价能力、投资组合表现和解释质量上的领先优势。

核心创新点与发现包括
  • 专家训练模块利用专业学术文献与多来源数据,强化模型专业知识与解释性。

- 多智能体协同机制通过置信度融合和上下游信息共享,降低预测不确定性,提高了预测准确率和投资组合绩效。
  • 实验结果显示,多智能体框架 outperform 单智能体模型和主流市场基准,不论是在涨跌预测(包括MCC指标)还是投资组合回报(累计收益率、Sharpe比率)均具优势。

- 资产定价实验显示多智能体模型能有效解释加密货币回报差异,捕获风险溢价,具备量化资产定价能力。
  • 解释性评估表明,基于微调的多智能体模型可生成更专业、一致和逻辑性强的投资评论,提升了实际应用的可理解度和信任基础。


本研究立足加密货币投资领域的独特需求,结合前沿AI技术,提出了一套系统化、可拓展且实用的投资管理方案,推动了加密资产量化投资及其自动化交易工具的研究与应用。

图表索引(引文示例)


  • 图1展示多模态数据结构及来源[page::2]

- 图2说明多智能体训练与投资流程结构[page::3]
  • 图3细节描述组内及组间协作机制[page::5]

- 表1分类准确率与MCC对比数据[page::7]
  • 表2市场团队涨跌预测回报对比[page::7]

- 图4概率分布与不一致度分析[page::7]
  • 图5累积收益率曲线比较[page::8]

- 表3投资组合收益和风险指标对比[page::8]
  • 表4资产定价五分位组合表现对比[page::9]

- 图6对比解释样例展示[page::10]
  • 图7解释性能雷达图表现[page::10]

- 表5消融实验体现模块贡献[page::11]
  • 表6数据模态及文献关联表[page::13]


---

综上所述,该报告通过引入多模态、基于LLM的多智能体系统,成功构筑了一个创新且具解释能力的加密货币投资管理自动化架构,在预测准确性、组合表现、风险管理与解释透明度等方面均展现出显著优势,为加密资产投资领域带来了重要的理论与应用贡献。

[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13]

报告