From Deep Learning to LLMs: A survey of AI in Quantitative Investment
创建于 更新于
摘要
本报告系统综述了深度学习与大型语言模型(LLMs)在量化投资中,特别是α策略中的应用进展与技术演变。通过解析量化投资的主要流程,包括数据处理、建模预测、投资组合优化及交易执行,揭示了深度学习提升模式识别和复杂数据处理能力的重要作用。报告重点探讨了LLMs在情感提取、多模态时间序列预测与量化因子生成中的创新应用,及其在自动化投资代理中的潜力与挑战,为未来量化投资智能化提供宏观视角及前瞻方向[page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24][page::25][page::26][page::27]
速读内容
- 量化投资核心:报告重点聚焦α策略,此策略因具备捕捉市场非效率的能力而受关注,涵盖数据处理、预测建模、资产配置及订单执行等环节,形成闭环反馈机制[page::1][page::5]。

- 量化投资数据分类与特征构造[page::6][page::7][page::8][page::9]:
| 数据类型 | 分类 | 特征示例 | 说明 |
|-----------|----------------|-------------------------|----------------------------|
| 数值数据 | 报价数据、基础数据 | K线图、订单簿、财务报表 | 时间序列,频率高低不一 |
| 关联数据 | 两点及超边关系 | 行业关联、知识图谱 | 反映公司间上下游及行业联系 |
| 替代数据 | 文本、图像、语音 | 新闻、卫星图像、会议录音 | 揭示市场情绪与非结构化信息 |
| 模拟数据 | 规则/多智能体 | 仿真市场订单流 | 用于补充真实数据稀缺问题 |
- 特征挖掘包含符号因子与机器学习因子,后者灵活但解释性差,因子筛选多用过滤法以选出预测能力强且不冗余的因子。
- 深度学习在α策略预测中的应用[page::10][page::11][page::12]:
- 时间、空间及时空建模结合,采用CNN、RNN、Transformer及图神经网络等方法,捕捉资产时间动态及跨资产依赖关系。
- 预测目标分为中间目标(单资产趋势、排序)与终极目标(端到端组合优化),后者更贴近投资实务但难度更高。

- 投资组合优化方式[page::13][page::14]
| 方法类型 | 代表方法与要点 |
|----------------|-------------------------------------------------|
| 传统优化 | 马科维茨均值-方差模型,聚焦单期和多期动态控制 |
| 学习增强 | 结合深度模型预测,改进收益与风险估计 |
| 端到端生成 | 强化学习方法直接生成资产权重,兼顾收益、风险与交易成本 |
- 订单执行[page::15][page::16]
- 传统最优控制模型(如Almgren-Chriss)基于价格动力学建模执行成本与风险权衡。
- 强化学习因其灵活性成为近年来执行策略主流,利用状态、动作与回报机制进行交易决策优化。
- LLMs在量化投资中的应用聚焦两大角色:预测器与智能代理[page::17][page::18]

- LLM基预测器[page::18][page::19]
- 通过嵌入向量及finetsune模型(FinBERT、FinLlama)实现文本情感分类。
- LLM直接生成情感分类,通过prompting挖掘财务新闻情绪,显著提升信号质量与预测能力。
- 结合因果推断的多记忆交互网络实现文本与结构化关系融合,提升预测解释性。
- LLM在时序预测中的创新[page::20][page::21]
- 展示LLM零样本学习时序预测能力。
- 多模态融合,如RiskLabs模型将财务报告音视频与时序数据整合,提高波动率预测精度。
- LLM基量化智能代理架构及功能[page::22][page::23][page::24]

- Alpha-GPT等框架实现LLM与人类交互协作,自动挖掘与生成量化因子代码。
- 多模态融合智能体(FinAgent, FinVision)处理多种金融信息,提升策略鲁棒性。
- 多智能体系统模拟机构交易团队,促进协同决策并带来更优风险调整表现(TradingAgents, FINCON)。
- InvestorBench基准促进LLM金融决策性能评价,强调模型规模与性能正相关。
- 现存挑战与未来方向[page::25][page::26]
- LLM预测器面临文本情绪与市场情绪不一致、数值时序嵌入困难、实时性不足等问题。
- 智能代理需跨越数字推理不足、组合优化落后于机构标准、订单执行缺乏微观结构感知等瓶颈。
- 未来应侧重融合传统金融模型与LLM优势,实现端到端、全流程自动化智能投资体系。
深度阅读
金融研究报告深度解读分析
报告元数据与概览
- 报告标题:From Deep Learning to LLMs: A survey of AI in Quantitative Investment
- 作者/机构:Bokai Cao等,来自香港科技大学(广州)与国际数字经济学院(IDEA Research)
- 发布时间:2018年8月(文章页眉固定位)
- 主题:量化投资领域中人工智能(AI)技术的应用,聚焦深度学习(DL)与大型语言模型(LLM)在量化alpha策略中的发展与现状调研。
核心论点与目的:
报告通过量化Alpha策略的视角,系统全景展现了AI技术对量化投资流程(从数据处理、模型预测、组合优化到执行)的影响与作用。重点跟踪了人工设计统计模型阶段,深度学习深度整合阶段,以及LLM引领的新型智能自动化阶段,揭示AI带来的技术变革和未来趋势。报告首次尝试将目前分散的深度学习与LLM相关研究在量化投资领域整合,为学术与产业界提供全面视野和前瞻指南。
---
全文逐节深度解读
1. 引言与alpha策略的发展(第0-2页)
- alpha策略定义:通过捕捉证券市场非效率,预测单个资产超过基准市场的超额收益(alpha)。其核心流程分为数据处理、模型预测、组合优化和订单执行四个阶段[page::1]。
- alpha策略演化三阶段(见图1,页2):
- 传统阶段:依赖研究人员专业知识及统计模型,特征工程人工主导,模型解释性强但面对复杂市场模式有限。[page::1,2]
- 深度学习阶段:深度神经网络实现端到端学习,能自动发现复杂空间-时间关系和多模态信息,进一步提升alpha捕获能力和规模化处理[page::1,2]
- LLM阶段:LLM扩展AI在文本理解、因子生成及自动代理决策上的应用,虽仍处于初期,但展示出自动化、智能化的巨大潜能[page::2]
- 研究动机:近年DL和LLM兴起,相关成果多零散,缺乏统一框架,该调研旨在填补全貌及未来演进视角的空白[page::2]。
- 论文贡献:
1. 综合性覆盖深度学习与LLM在alpha策略完整流程的应用;
2. 从实务需求出发,强调交叉学科与应用问题驱动的研究方向;
3. 系统对比并识别传统统计模型、深度学习与LLM方法的优缺点及迭代特征[page::3,4]。
---
2. Alpha策略背景与流程概述(第4-6页)
2.1 Alpha策略细节及挑战
- alpha和对冲分支区分:
- alpha侧聚焦于预测未来价格趋势,实现超额收益;
- 对冲侧则管理系统性风险,常通过期货、期权等工具平衡风险敞口和交易成本[page::4]。
- 报告重点讨论alpha侧,因其对AI驱动的预测任务更直接相关[page::4]。
2.2 Alpha投资流水线全景(见图3,页5)
- 数据处理:多源数据(数字、关系、另类、模拟)的清洗、补齐与标准化,衍生特征(因子)构造,为后续预测打底。
- 模型预测:利用数据动态预测资产未来走势(价格、波动等),深度学习有广泛应用。
- 组合优化:根据预测输入,求解最大化风险调整收益的投资组合,涉及多目标优化与风险约束[page::5,6]。
- 订单执行:考虑流动性、市场冲击,将大额订单拆分为小批量并择时执行,降低滑点损失[page::5]。
- 风险监控与反馈:实时动态调整策略,使整体流程闭环运作。
---
3. 深度学习在Alpha流程中的应用(第6-17页)
3.1 数据处理(第6-9页)
- 数据分类(表1,页6):数字数据(报价与基本面)、关系数据(两两或超边网络)、另类多模态(文本、图像)、模拟生成数据(规则、时间序列、订单流、多代理模型)[page::6-9]。
- 数字数据示例(图4,页7):包括烛台图、限价委托簿和财报实数据等,按时间频率高低分布广泛。
- 关系数据细分(图5,页8):实体之间的静态与动态关系,影响市场联动性,图神经网络是主流建模工具。
- 另类数据:新闻、社交舆情和卫星图像等,通过深度学习抽取事件、情绪和影响因子,提升决策多样度。
- 模拟数据:规则模型、深度生成模型(VAE、GAN、扩散模型)、订单流模型和多代理模型补充真实数据不足的场景训练需要。
- 特征提取过程:构造(符号与机器学习方法)、选择(使用筛选及相关性衡量减少过拟合)两步,兼顾解释性与灵活性[page::9]。
3.2 模型预测(第10-13页)
- 建模数据内在关联(图6,页10):
- 时间相关性:使用CNN、RNN、Transformer等捕捉时序信号。
- 空间相关性:显式构建金融资产图,应用GNN及扩散模型,捕获资产间复杂互动。
- 时空耦合:联合分析时间变化和空间结构,增强预测准确度。
- 预测目标定义:
- 中间变量目标:着眼未来价格走势或资产排名,方便模型训练且灵活,但与最终组合目标存在误差累积风险。
- 端到端优化:直接以组合回报等最终指标训练模型,要求复杂,数据需求大但契合实际投资目标。
- 训练挑战:量化交易流程中执行与优化往往不可微,整合深度学习模型需结合复杂目标函数设计[page::10-13]。
3.3 组合优化(第13-15页)
- 传统方法:从Markowitz均值-方差框架出发,发展多期在线学习和随机控制技术,力图在多个持仓期内优化累积收益及控制风险。
- 深度学习助力:通过预测模块改善收益及风险估计,引入深度网络与强化学习提升策略的灵活性。
- 端到端生成:强化学习模型免标签设计,直接基于收益及风险调整目标训练,实现策略学习端对端闭环,性能表现优异[page::13-15]。
3.4 订单执行(第15-17页)
- 传统控制方法:基于Almgren-Chriss模型及其扩展,在离散或连续时间框架下通过最优控制理论降低交易成本与市场冲击。
- 强化学习方法:Q-learning、DQN、PPO等算法广泛应用于订单拆分与执行,支持针对实盘复杂市场微观结构的快速自适应。
- 多代理与模型驱动扩展:基于市场仿真系统训练多种RL执行策略,推广性强,兼具良好实证性能[page::15-17]。
3.5 现有限制与未来方向
- 自动化机器学习(AutoML):针对快速变化市场环境,减少模型开发人工成本。
- 模型解释性:深度学习“黑盒”问题在金融领域尤为关键,需深化解释AI研究予以风险管理信心。
- 知识驱动AI结合:解决数据稀缺场景下的建模困境,如长期价值投资。
- 端到端模型集成:打破阶段独立训练瓶颈,实现整体流程目标统一,提高自动化和性能[page::17]。
---
4. 大型语言模型(LLM)在Alpha策略中的应用(第17-27页)
4.1 LLM作为预测器(第17-21页)
- 背景与意义:传统量化模型偏重结构化数据,LLM扩展至非结构化文本、多模态信息解析,极大丰富信号来源和深层语义理解能力。
- 情绪提取:
- 早期基于词典、机器学习模型,逐步演变至预训练语言模型FinBERT、FinLlama等专用金融嵌入编码器。
- LLM提示工程及强提示(prompting)有效提升语境感知的情绪理解和分类准确性。
- 多模态与动态关系网络(如FININ)利用LLM表征金融新闻关联性,实现更精准的市场影响分析[page::18-20]。
- LLM直接时间序列预测:
- 零样本能力表明LLM能通过转化序列为语言形式实现时序预测,具备捕获复杂时空依赖和解释能力。
- 相关框架(如TIME-LLM,RiskLabs)结合股票价格、新闻、语音等多模态信息,展现超越传统模型的性能和解读性[page::20-21]。
4.2 LLM作为量化代理(第21-26页)
- 领域专用金融LLM及其优势:BloombergGPT、FinGPT等预训练模型显著提升行业专属任务表现。
- LLM生成因子:Alpha-GPT框架促进人机交互式因子发现,基于提示工程产生新的策略因子,实现自动化和创造性挖掘[page::21-23]。
- 智能代理架构(图9,页23):
- 结合多元数据(基本面、价格、文本、视频)实现价格趋势预测、组合优化与订单下单。
- 目前研究重点主要集中在预测智能体,优化与执行模块仍待深化[page::23]。
- 多模态与多智能体系统:
- FINMEM、FinAgent、FinVision等结合记忆层级、反思模块、多模态融合展现强决策力。
- 多智能体平台如FinRobot、FINCON及TradingAgents模拟真实交易团队,支持协作、风险监控和灵活决策,提升收益同时严格风险控制。
- 投资者基准(InvestorBench)推动金融LLM代理评测标准化及性能对比[page::23-26]。
4.3 LLM应用现状限制与未来展望
- LLM预测器角色挑战:
- 语言与市场情绪不完全一致,建议采用跨模态强化学习、细粒度调整来对齐机制。
- 数值数据表达与处理形式需创新以保留关键统计及结构信息,减少噪声。
- 实时性瓶颈需轻量架构或混合模型解决。
- 融合关系金融知识图谱实现跨资产联动建模,提高全面预测能力[page::25-27]。
- LLM代理角色待突破问题:
- 数值推理能力不足,需结合专用量化模型实现混合架构。
- 组合优化中忽视多资产配置风险约束及交易成本,建议引入神经符号方法提升数学严谨性。
- 订单执行简单假设市场完美流动性,未来需集成微观结构模拟器及低延迟推理。
- 全流程整合与系统智能化挑战明显,未来趋势是深度融合多学科传统与新兴技术,打造高鲁棒性与解释性的下一代量化系统[page::26-27]。
---
图表深度解读
图1(页2) Alpha策略演进过程
- 展示了量化投资alpha策略从依赖人工、统计模型到深度学习,再到LLM代理的三阶段进化。
- 反映技术驱动下alpha研究框架的成熟与功能跃迁,强调LLM在自动化、多模态信息加工和智能代理定位的重要性,指明现实应用尚处早期[page::2]。

图2(页3)报告整体框架
- 详细体现三大研究章节:Alpha背景与Pipeline(第2节)、深度学习在Alpha中应用(第3节)、LLM应用(第4节)内部内容结构及任务分解。
- 清晰划定四大核心模块及子任务,展现了论文在知识结构层面的清晰布局和研讨重点[page::3]。

图3(页5)量化投资典型流程
- 由数据采集(Raw Data)到因子挖掘、模型建构、组合优化、订单执行及收益监控形成闭环电子化投资系统。
- 内含数据预处理(缺失值填充、清洗)、因子选取、投资权重决策、执行策略、风险管理五大关键环节,体现量化投资复杂性与集成性[page::5]。

图4(页7)数字数据示例
- 三张子图诠释了股票价格相关的数字数据结构:标准K线图(开盘价、收盘价、最高最低价)、限价单簿(买卖挂单分布)、微软财务数据(收入、利润、净收益)示例。
- 这些是深度学习和传统统计模型主要依据的原始定量数据,有助于解释市场动态及价值[page::7]。

图5(页8)关系数据示例
- (a)表示“双边边”关系,例如持股公司与母公司的关系。
- (b)展示“超边”关系,反映行业集团或概念股集合。
- 强调金融市场实体间多维度语义关系,是基于图神经网络构建复杂空间相关性的关键底层数据[page::8]。

图6(页10)数据依赖性建模方法
- 时间序列(a):紫红色蜡烛的历史价格趋势预测未来。
- 空间关系(b):不同公司节点相互连接,表明彼此间业务关系。
- 时空结合(c):时间轴上多个公司之间周期性关系动态循环。
- 此图深刻阐述时空交织现象及其在深度模型中对应建模策略的重要性[page::10]。

图7(页18)LLM在预测中的应用主题结构
- 这张思维导图展示LLM在量化领域预测角色的多层面划分,包括基于嵌入的情绪分类、提示式情绪抽取、关系表示,以及针对金融时间序列的专门建模。
- 反映目前金融领域LLM多元应用状况与研究热点集中趋势[page::18]。

图8(页22)金融LLM及代理架构研究分类
- 框图展示LLM在金融领域的多方向研究脉络,涵盖金融专用模型、因子生成、代理设计、多模态融合及多智能体系统等。
- 说明研究现状及未来复杂系统发展方向[page::22]。

图9(页23)LLM量化代理架构
- 展示基于LLM的量化交易智能体从数据输入、价格趋势预测,到组合优化,进而订单执行的完整闭环结构。
- 细示不同类数据流(文本、价格、基本面、多媒体)输入以及目前聚焦的主要研究方向和尚待加强的模块[page::23]。

---
估值分析
本报告为调研综述文献性质,未涉及企业价格或具体金融工具估值计算,但对定量投资流程中模型阶段的预测及组合优化问题的数学建模做了详细梳理:
- 组合优化基于均值-方差框架及其扩展、多周期网络和强化学习方法,强调风险约束(波动率、CVaR)与交易成本。
- LLM与深度学习结合,致力于提升风险控制能力,辅助因子生成和投资决策,推动“端到端”深度特征学习和资产配置模型的发展。
---
风险因素评估
- 深度学习部分
- 过拟合风险依然突出,复杂模型在新市场环境中可能泛化不足。
- 黑盒特性影响解释性与监管合规。
- 多阶段模型训练目标不一致可能导致最终策略性能不稳定。
- LLM应用部分
- 语言模型与真实市场情绪和行为存在错位,风险在信号误判。
- 计算时延及实时响应性不足,金融市场快速变化造成潜在损失。
- 投资组合风险控制机制弱,执行环节对市场冲击建模缺失。
- 代理系统整体协调性和闭环反馈机制尚未成熟[page::25-27]。
---
批判性视角与细微差别
- 报告客观全面,但在论述LLM的潜力时语气积极,实际落地挑战尚未充分展开(例如数据隔夜性、实时交易低延迟等)。
- 深度学习方法依赖海量历史数据,长期价值投资等稀疏场景下潜力有限,知识驱动方法虽提及但未重点展开。
- LLM组合优化和执行阶段研究不足,表明该领域存在研究空白,需引起关注。
- 多数预测和模型建立仍处于方法论成熟期,商业实用性需进一步验证和案例深度报告。
---
结论性综合
本报告系统梳理了量化投资领域中,AI技术从传统统计软件向深度学习,再向大型语言模型的发展轨迹和应用场景。量化Alpha策略作为核心话题,贯穿数据采集、处理、预测以及投资执行全过程,报告展示了:
- 深度学习通过捕捉时空复杂依赖关系及多模态数据,极大拓展了传统模型的表现力。
- LLM作为新兴力量,尤其在文本挖掘、非结构化数据处理及智能代理架构设计方面显示了革命性的潜力。
- 当前深度学习和LLM结合的量化系统尚处于探索及初步应用阶段,面临模型实时性、解释性及风险管理等多方面挑战。
- 未来发展需重视自动化、端到端训练、知识驱动AI集成及更严谨的组合优化风险控制策略。
- 多智能体和多模态融合代表金融AI系统演进方向,有利于构建更为精准和鲁棒的智能量化投资体系。
综上,作者综合评价深度学习与LLM为量化投资技术带来的变革意义深远,但实际应用仍需跨越诸多技术瓶颈,期待更多跨学科融合创新及实证研究[page::27]。
---
# 综上所述,该报告为学术界和行业提供了量化投资中AI应用的第一手、全景式调研与洞察框架,对深度学习与LLM协同构建面向未来的量化交易系统具有重要的参考和指导价值。