`

中金 | 大模型系列(2):LLM在个股投研的应用初探

创建于 更新于

摘要

报告基于大语言模型(LLM)构建了两大核心应用框架:基本面因子挖掘与个股智能复盘。利用LLM生成的基本面因子能保持较强的金融逻辑性,创新算子提升因子有效性,回测期内IC_IR最高达0.78。同时,基于RAG方法的个股复盘体系有效提炼关键信息并输出带置信度的研判观点,提升投研工作效率和择时能力。多只核心股票的择时策略验证表明,长期综合评分大幅提升时,未来20个交易日赢率及收益率显著改善,最大回撤降低,显示LLM观点有良好的应用前景和择时实用价值。[page::0][page::1][page::6][page::8][page::11][page::12][page::16]

速读内容


LLM在个股投研的优势与应用场景概述 [page::2][page::3]


  • LLM具备创造力和处理非结构化信息的优势,但存在响应速度慢、文本长度限制及结果随机性问题。

- 主要应用于构造基本面选股因子框架和构建个股复盘体系,提升因子生成效率及复盘速度和质量。
  • 限定于核心股票池以降低处理压力。


基本面因子挖掘框架设计及Prompt引导策略 [page::3][page::4][page::5][page::6]



  • 因子挖掘分为因子生成(利用LLM创造公式)、因子计算和因子测试(依托量化平台完成)。

- Prompt设计关键:经验丰富领域用明确选股逻辑提升有效因子生成概率,经验不足领域强调思路创新。
  • 选择不同风格(质量、运营、治理类)Prompt,质量和运营类因子IC均值更高,创新型Prompt发散性佳但有效比例低。

- 有效因子数量统计显示,50个模糊生成因子中仅2个IC均值>2%,但相关性低体现发散思维。[page::5][page::6]

LLM挖掘基本面因子性能及案例分析 [page::6][page::7][page::8]


| 因子名称 | 相关性(与已有因子) | IC均值 | ICIR | 因子逻辑说明 |
|---------------|--------------------|--------|--------|--------------------------------|
| EPCF | 高 | 较高 | 高 | 盈利现金双因子,增强盈余质量因子 |
| TRI
RDEFF | 低 (<30%) | >0.03 | 0.78 | 链税研协同效能因子,创新选股角度 |
| HRASSETRESO | 低 (<30%) | >0.03 | 高 | 综合考虑人力资本及资产效率 |
  • LLM挖掘的因子多具逻辑性,采用创新算子改善传统因子效果。

- 随机性和因子逻辑与计算偏差仍是挑战。[page::6][page::7][page::8]

基于LLM的个股智能复盘系统框架与流程 [page::8][page::9]


  • 系统基于公告、研报、调研纪要等多源信息,自动提取关键事件,生成结构化事件。

- 采用RAG方法检索历史关联信息,结合prompt进行超预期判断及短期、长期研判。
  • 输出股价表现的综合评分([-1,1]),辅助投研决策与工作流程重构,大幅降低人工复盘时间。

- 示例以贵州茅台复盘显示评分与公告研报信息高度一致,研判自洽但缺乏深度。[page::8][page::9][page::10]

复盘观点的择时应用与实证 [page::11][page::12][page::13]




  • 长期综合评分大幅提升与未来20-60日股价涨幅存在弱相关性(相关系数约0.26-0.27),短期评分预测不明显。

- 多只核心股票(贵州茅台、宁德时代、招商银行、中芯国际)样本验证,长期评分上升的分组未来收益和胜率明显更优。
  • 设计简易多头择时策略:长期评分提升 > 0.07时持仓,持仓期20日,整体策略改善最大回撤,提升年化收益和信号胜率。[page::11][page::12][page::13]


多头择时策略回测表现(部分核心股票)[page::14][page::15]




  • 策略回测显示择时仓位正相关于个股净值波动,择时信号能较好捕获主升浪机会。

- 四只核心股票择时后均提升收益表现并减少回撤风险,表现稳健。
  • 年化收益和最大回撤数据支持长期综合评分作为有效择时指标。[page::14][page::15]


结论与风险提示 [page::16]

  • LLM技术可有效辅助基本面因子创造和个股复盘工作,显著提高投研效率和择时表现。

- 复盘观点可用作多头信号,但深度和准确性受限,需结合高质量报刊和个股核心因素优化prompt。
  • LLM生成结果有随机性,建议多次结果取平均,避免单次结果误导。

- 应用新兴生成模型需关注技术局限与风险,合理配置使用场景和风控体系。[page::16]

深度阅读

中金 | 大模型系列(2):LLM在个股投研的应用初探 — 详尽分析报告



---

1. 元数据与概览


  • 报告标题:《大模型系列(2):LLM在个股投研的应用初探》

- 作者:古翔、周萧潇、刘均伟
  • 发布机构:中金公司研究部

- 发布日期:2025年5月9日
  • 研究主题:大语言模型(LLM, Large Language Model)在个股投研中的应用探索,尤其聚焦于基于LLM的基本面因子挖掘和个股复盘系统构建

- 核心论点
- 随着资本市场信息量极度增长,传统人工方法复盘效率低下,难以满足实时提炼价值信息的需求。
- 报告提出构建基于LLM的智能化个股投研框架,包括“主观逻辑因子化”和“个股复盘”,提高量化因子挖掘效率和复盘效率。
- 通过充分发挥LLM在推理、创造性和非结构化数据处理上的优势,实现因子创新与复盘自动化。
  • 评级及目标价:本报告属于技术研究和应用探索报告,未涉及具体股票评级和目标价。

- 主要信息传达:LLM技术在大幅度提升投资研究效率和创新选股因子方面具有重要价值,且通过RAG方法搭建的复盘体系在市场择时中显示出一定的实用意义,但仍面临随机性和上下文长度限制的挑战。[page::0,1]

---

2. 逐节深度解读



2.1 LLM在个股投研的应用背景与价值


  • 关键内容

- 非结构化数据(公告、舆情、产业链动态等)激增,传统人工复盘难以满足需求。
- LLM在文本理解与生成,推理和创造性方面的优势使其适合处理单只股票的非结构化信息和生成量化因子。
- LLM面对的主要瓶颈为响应速度、上下文长度限制以及生成结果随机性。
  • 逻辑及证据

- 信息爆炸意味着投资者需要快速且深度处理大量文本,人工难以覆盖,且易遗漏关键点。
- LLM作为概率生成模型,能产生创新选股因子,辅助理解关键信息,并进行观点整理和初步研判。
- 限制来自技术和模型设计,必须结合特定应用场景“扬长避短”,如限定核心股票池使用或专注某些流程环节。
  • 图表解读

- 图表1(LLM在个股投研应用中的优劣势):清晰呈现LLM优势(创造力+非结构化信息处理)与劣势(速度、上下文限制与随机性)。
  • 总结

- LLM不适用于全市场大规模即刻文本处理,而在基本面因子生成和个股复盘流程中因创造力和总结能力可发挥较大作用。[page::2]

2.2 基于LLM的基本面因子挖掘框架


  • 框架设计

- 因子挖掘细分为三个步骤:因子生成、因子计算、因子测试。
- LLM主要在“因子生成”环节发挥创造力,使用prompt引导选股逻辑,生成新的因子计算公式和逻辑。
- 计算和测试需本地量化平台完成,保证精度和逻辑一致性。
  • 数据和工具

- 输入包含财报科目、算子明细(包含数学函数等)、已有因子列表。
- 设计合理性检验机制,剔除运算不可行或超出预定义范围的因子。
  • 图表解读

- 图表3展示框架流程图,流程清晰地反映信息流和判断节点,强调合理性检验的必要性。
  • Prompt设计策略

- 不同Prompt诱导生成不同类型因子(未限定方向、质量类、运营类、治理类)。
- 测试表明模糊prompt生成有效因子概率低但思路创新,限定prompt生成有效因子概率高但创新度略减。
  • 图表4数据

- 图表统计五类因子的生成总数、IC均值表现及相关性,说明明确的逻辑指导有助提高量化有效性。
  • 成果亮点

- 生成的部分因子,如EPCF利用创新算子显著优化盈余质量因子。
- TRIRDEFF因子引入税收红利、研发投入,ICIR达到0.78,超出传统因子表现,显示LLM可挖掘高效选股逻辑。
  • 不足与风险

- 因子逻辑与计算不匹配情况存在随机性。
- 生成过程本质带随机,难以完全控制质量,需要多次生成和筛选。
  • 总结

- LLM在因子生成上具备较强创造性和高效转换选股逻辑的能力,结合定量平台保证输出质量是实现突破的关键。[page::3,4,5,6,7,8]

2.3 基于LLM的个股复盘体系设计与效果


  • 设计理念

- 通过LLM与RAG(检索增强生成)结合,实现上市公司公告、研报和调研纪要多源异构数据的关键信息抽取。
- 复盘系统自动判定日度事件是否超预期,并给出短期、长期价格影响的量化评分(-1~1区间)。
- 可对接Wind等数据库,实现投研工作流数字化升级,显著提升效率,节省约70%基础信息处理时间。
  • 复盘流程

1. 信息获取(公告、研报、调研笔记)
2. 文本切分及相似性检索
3. LLM提炼关键信息
4. 关联历史信息文本检索对比
5. LLM初步研判并量化评分
  • 图表解读

- 图表8流程图清楚说明信息流转和判别机制,体现RAG技术降低“幻觉”生成概率的优势。
  • 效果示例

- 对贵州茅台(2025-04-03、04-12)进行复盘时,关键信息的准确性较高,能对应公告和研报中的实际内容,数值匹配度高。
- 不同时间点输入研报质量差异影响信息提炼完整度,高质量研报输入提升整体效果。
- 初步研判观点逻辑自洽,但在部分超预期判断上仍存在瑕疵,如单纯比较目标增加而忽视公司整体战略。
  • 改进建议

- 针对个股基础因素,prompt中可注入重点关注点,引导模型精细关注关键影响因素。
- 优选高质量研报输入,升级信息源,提高提取准确率。
  • 风险提示

- 生成性模型随机性带来的可复现性难题,建议多次生成取平均值作为参考。
  • 总结

- 该复盘体系提高了人工复盘效率和信息准确性,但还不是完美,可利用工程和prompt优化提升深度与准确性。[page::8,9,10,16]

2.4 个股择时效果实验分析


  • 评价指标

- 复盘输出“长期、短期综合评分”作为择时信号。
  • 数据分布特征

- 2023年至2025年贵州茅台复盘观点长期评分多偏正面(0.3至0.7区间),短期评分更能提示短期风险波动。
  • 相关性分析

- 短期及长期评分与未来1-5日涨跌相关性均较低(<0.1),无短线预测能力。
- 长期评分变化与未来20、60个交易日收益相关性明显提升,最高达0.274,存在弱相关择时效果。
  • 多标的回测

- 以贵州茅台、宁德时代、招商银行、中芯国际作为样本,长期综合评分的大幅提升对应未来20日平均收益提升及较高胜率。
  • 择时策略设计

- 多头策略:长期评分增幅超过0.07持仓20日,否则空仓。
- 策略回测中,择时策略最大回撤低于持有不动,年化收益均较未择时策略有所提升(招商银行除外)。
- 多只股票验证策略鲁棒性,特别在2024年9月主升浪的把握较好。
  • 图表解读

- 图表11-19详尽展示评分分布、相关系数、分组收益胜率和择时策略表现,图形可见策略有效提升回撤控制和收益表现。
  • 总结

- LLM复盘观点虽不适合短线捕捉,具备一定中期择时价值,通过量化策略可有效辅助投资决策实现风险收益效率改善。[page::11,12,13,14,15]

---

3. 图表深度解读


  • 图表1(LLM优劣势分析)

- 三个优势点:创造力、非结构化信息处理质量高、观点总结能力;三个局限性点:响应速度、上下文长度限制、结果随机性。
- 反映了当前LLM技术的适用边界,留给研究者选择应用场景的空间。[page::2]
  • 图表3(基本面因子挖掘框架流程)

- 清晰三步流程:输入数据→LLM生成因子计算公式→合理性检测→因子计算及测试。
- 设计体现了生成与测试分工,实现量化平台与LLM间协调运作。[page::4]
  • 图表4(不同Prompt下生成因子统计)

- 未限向Prompt有50个因子,但有效因子(IC>2%)较少。
- 明确方向Prompt虽然数量少,但有效因子多且相关性高,显示经验指导对质量提升重要。
- 反映经验丰富领域建议精确Prompt,缺乏经验建议发散Prompt以挖掘创新思路。[page::6]
  • 图表5-7(因子样例及有效性、相关性测试)

- EPCF因子利用创新算子改进盈余质量因子。
- TRIRDEFF等创新因子将税收、研发、人力资本引入,实现低相关且有效的新因子。
- IC
IR最大达0.78,表明因子有效性较高。
- 相关系数统计表明新增因子可以丰富投资选股因子空间。[page::6,7]
  • 图表8(个股复盘框架流程)

- 将公告、研报、调研记录输入,提炼关键事件,多轮对比历史信息,输出超预期判断及综合评分。
- 使用RAG技术避免模型幻觉,结合检索增强生成提升信息可信度。
- 体现了复盘自动化系统设计的可行路径。[page::9]
  • 图表9-10(贵州茅台复盘观点样本)

- 输出分为关键信息梳理及超预期判断,两个时间点均体现部分逻辑合理信息匹配公告研报。
- 但存在部分判定瑕疵,反映当前模型判断深度和精准度仍需提升。[page::10]
  • 图表11-14(长期、短期评分分布和未来收益分组测试)

- 长期评分偏正面,短期评分带一定风险提示。
- 长期评分变化分组与未来收益和胜率呈现明显正相关,满足中期择时需求。
- 多股表现一致,体现方法的通用性和鲁棒性。[page::11,12,13]
  • 图表15-19(择时策略回测结果)

- 策略交易信号减少持仓时期最大回撤。
- 年化收益率提升(除招商银行),反映策略能把握重要上行波段,提升投资表现。
- 多个个股回测图呈现持仓比例与股价净值对比,形象展示择时策略有效性。[page::14,15]

---

4. 估值分析



本报告聚焦LLM技术应用于投研过程的流程和方法论构建,未包括传统的估值模型或目标价推导,因此无常规意义上的估值分析部分。

---

5. 风险因素评估


  • 模型随机性风险

- LLM为生成式概率模型,文本输出带随机性,结果不可复现。
- 复盘观点和因子生成可能因Prompt微调或数据差异产生波动。
  • 技术实现限制

- 上下文长度和响应时延限制全市场全面应用。
  • 数据质量风险

- 原始公告、研报可能质量不一,信息抽取准确性取决于数据源。
  • 应用局限

- LLM未能形成完善的个股长期分析框架,对细节推断存在逻辑瑕疵。
  • 缓解措施

- 多次生成平均取值减少随机波动。
- Prompt引导明确化。
- 高质量数据源输入。
  • 总结

- 虽有不足,但通过技术细节设计和数据筛选,风险可控且可随着技术进步有所缓解。[page::8,16]

---

6. 批判性视角与细微差别


  • 报告对LLM技术持积极乐观态度,强调其创新能力和效率提升,但对部分随机性和结果可复现性隐忧的处理较为保守,机械化建议多次生成与Prompt优化,未深入探讨模型算法改进路径。

- 个股复盘示例中,超预期判断的逻辑局限未得到根本性解决,欠缺多维度事实验证机制。
  • 选股因子生成随机性可能导致大量无效或误导性因子,报告建议更多依赖经验丰富的Prompt设计,体现了现实中将人工经验引入AI辅助的重要性,也透露出LLM纯粹自动生成的局限性。

- 报告内部对因子逻辑与计算表现偏差的讨论突显LLM在财务细节理解上的局限,表明实际应用需严格人工验证。
  • 风险提示部分虽列明随机性风险,但未展开模型潜在过拟合或被训练数据隐含偏见带来的风险。

- 总体平衡客观,但偏重强调应用优势,需关注以上潜在弱点。[page::8,10,16]

---

7. 结论性综合



本报告围绕LLM在个股投研领域的应用进行了系统深入的探讨,核心贡献包括:
  • 基本面因子挖掘框架的构建

- 设计了基于Prompt引导的因子公式生成机制,利用LLM创造性能力拓展选股因子空间。
- 结合本地量化平台实现高精度因子计算和测试,确保模型生成因子可实用化。
- 生成的因子部分展现出金融逻辑合理性强、创新算子运用和与传统因子低相关性,有效选股能力较强,最高IC_IR可达0.78。
- Prompt设计表现出经验丰富领域应明确导向,经验不足领域应释放创新力的双重策略。
  • 个股复盘体系构建与验证

- 利用RAG结合LLM的技术实现对多类型非结构化信息的自动提取和事件结构化,提高传统投研效率70%以上。
- 复盘观点具备较高逻辑连贯性和真实性,输入高质量研报显著改善提炼效果。
- 超出市场预期的判断虽具一定合理性,但判断深度和细节解析仍不够充分。
  • 个股择时试验结果

- LLM输出的长期综合评分变化与未来20至60个交易日股价表现展现一定弱相关关系,短线预测能力不足。
- 多只重点股票的择时策略回测显示,该基于LLM的多头择时信号有效控制最大回撤,捕捉主升浪机会,提高年化收益。
  • 风险与改进建议

- 随机性带来模型稳定性风险,建议多次生成均值引用。
- 强化Prompt设计、引入个股核心财务指标指导,挑选优质研报数据源,有助于提升结果准确度。
  • 整体价值

- LLM技术为个股量化研究进入非结构化数据深度挖掘与智能自动化提供了全新路径。
- 结合量化平台与人工经验实现AI与传统分析优势互补,未来具备广阔发展潜力。
- 但目前仍受技术限制和随机性问题约束,需要持续迭代和多维验证保障实际应用的稳健效果。

综上所述,本报告是对LLM在个股投研应用技术路径与实践效果的首次较系统展望,验证了大语言模型在金融投研工作流中提质增效的潜力,展示了基于LLM的创新工具可在投资因子挖掘和个股动态复盘领域内驱动决策智能化的重要作用,为未来智能投研平台建设提供了宝贵参考和技术示范。[page::0-16]

---

附:部分关键图表链接示意


  • —— LLM应用优劣势分析

- —— 基本面因子挖掘框架流程
  • —— 不同Prompt因子生成效果统计

- —— 个股复盘体系流程图
  • —— 茅台复盘综合评分分布

- —— 长期评分变化分组收益率
  • —— 长期评分变化分组胜率


(等图表内容均已在以上解析中详细说明)

---

以上为《大模型系列(2):LLM在个股投研的应用初探》报告的全面、专业且细致的分析解读。

报告