“逐鹿”Alpha 专题报告(二十一):基于新闻、研报、财务、技术指标的大模型个股分析框架初探
创建于 更新于
摘要
本报告基于技术指标、财务数据、新闻资讯以及研究报告,结合阿里巴巴达摩院通义千问和深度求索Deepseek-chat大模型,构建了一套多维度融合的大模型个股分析系统。系统不仅实现了对股票未来收益的有效预测,其中买入信号带来的超额收益达到1.08%,且赋予模型较强的结果解释性。同时,通过消融测试分析了各类信息对预测的贡献度,发现研报数据影响最大,财务数据贡献有限或负面,新闻和技术指标亦有辅助作用。该框架提升了个股分析的准确性和可解释性,为股票量化预测提供了创新思路 [page::0][page::1][page::22]。
速读内容
多源数据融合的大模型金融分析体系 [page::7][page::11]

- 数据涵盖技术指标(短中期动量、MACD、RSI)、财务核心指标(EPS、ROE、研发投入等)、新闻数据(50万条财经新闻,使用RAG与Milvus矢量数据库实现语义检索)、研报摘要(来源东方财富网站)。
- 数据精细处理适配大语言模型输入,形成融合提示词。
- 以贵州茅台为示例,模型通过多维度提示分析股票短期及长期走势,技术指标显现短期动能不足,但长期维持高位,财务健康且具增长动力,新闻反映行业复苏及公司创新策略,研报给予正面评级。
大模型性能及选型对比 [page::4][page::10][page::20]



- 采用阿里巴巴通义千问(qwen-max)1100亿参数大模型与Deepseek-chat(236B参数MoE模型)作为主模型,分别实现个股分析与预测。
- Qwen-max模型在单次token成本较高(0.04元/千token),Deepseek成本更低 (0.001元/千token) 但预测结果略逊。
- 两款模型均能生成清晰解释和可复现分析逻辑,Deepseek以较高性价比具备实用潜力。
大模型股票预测策略与结果 [page::17][page::19][page::20]
| 预测信号 | CoT策略alpha | Bucket策略alpha | CoT频次 | Bucket频次 |
|---------|--------------|----------------|---------|-----------|
| 1 (卖出) | 1.81% | NaN | 1 | 0 |
| 2 (持有) | -0.81% | -1.12% | 12 | 9 |
| 3 (买入) | 7.23% | 1.86% | 1 | 5 |
- 三分类策略(买入、持有、卖出)提升了模型区分能力,模型偏向保守,卖出信号较少。
- Qwen-max买入信号对应一个月后绝对收益1.02%,超越中证100指数1.08%。
- 模型对高关注度个股如贵州茅台、招商银行等预测效果显著,对高成长股(宁德时代、恒瑞医药、比亚迪)表现较弱。
- Deepseek模型虽绝对收益稍逊,但保持明显alpha辨识能力。
数据消融实验说明各数据维度作用 [page::21]
| 数据类别 | 多空收益 |
|----------|----------|
| 全部数据 | 0.49% |
| 无技术指标 | 0.37% |
| 无财务 | 0.83% |
| 无研报 | -1.16% |
| 无新闻 | 0.39% |
- 研报摘要信息对预测贡献最大,剔除研报显著降低模型效果。
- 财务数据时效性不足,去除反而提升多空收益。
- 技术指标和新闻数据提供辅助增益,但影响宽幅较小。
量化因子构建与大语言模型的应用突破 [page::3][page::6][page::18]
- 结合技术指标、财务、新闻和研报形成综合提示词,采纳大模型的推理及自反省机制(Self-Reflective),逐步优化预测准确率。
- 自反省机制通过反馈前次预测偏差,增强模型推理能力和解释力。
- 框架有效克服传统量化模型在信息异构融合和解释性不足中的瓶颈,实现了可解释性和较好预测性能的平衡。
深度阅读
证券研究报告分析报告——“逐鹿”Alpha 专题报告(二十一):基于新闻、研报、财务、技术指标的大模型个股分析框架初探
---
一、元数据与概览
- 报告标题:“逐鹿”Alpha 专题报告(二十一)——基于新闻、研报、财务、技术指标的大模型个股分析框架初探
- 作者:姚紫薇、王超
- 发布机构:中信建投证券研究所
- 发布日期:2024年6月7日
- 主题:结合新闻、研报、财务数据和技术指标多维度数据,利用大语言模型(Large Language Models, LLMs)进行股票走势的综合分析与预测
核心论点
本报告提出了一种创新的金融工程框架,将多维数据(技术指标、财务数据、新闻资讯以及研报摘要)集成进一种大语言模型驱动的分析系统,通过构建综合提示词,实现对股票(尤其是A股重点标的)的未来走势预测。该系统相比传统量化模型最大优势在于:
- 提升预测准确性:未来一个月买入预测的平均绝对收益率达到1.02%,相对于中证100的超额收益为1.08%。
- 增加模型的可解释性:通过提示词工程与反省机制,模型不仅给出预测,还提供了明确的逻辑解释和各类数据对预测的影响程度。
- 整合多源异构数据:突破传统量化方法对结构化数据依赖的限制,引入非结构化文本(新闻、研报)以增强信息深度。
本报告不仅详尽介绍了数据来源、模型结构和方法,还通过案例(贵州茅台)展示实际应用,结合回测与消融测试验证系统效果,指明了不同数据维度对预测结果的贡献度,并对未来风险提出警示[page::0,3,7,22].
---
二、逐节深度解读
1. 简介与相关研究
报告首先阐述了传统量化模型的局限,尤其是结构化数据对历史依赖,难以处理非结构化文本和复杂模式。近年来伴随Transformer及自监督预训练模型(LLMs)兴起,金融领域开始尝试将这些模型应用于模式识别、文本分析、市场情绪解析等任务。
报告中引入的两类模型:
- FinPLM(金融领域预训练小规模模型)
- FinLLM(大规模金融领域定制模型)
两者优劣各异,FinPLM在情感分析和文本分类表现更优,FinLLM则在处理复杂文本理解和生成任务中占优势。以往研究亦论述了LLM在财务报表分析中的突出表现,尤其是使用链式思考(Chain of Thought, CoT)提示增强解释能力,并在股票走势预测中取得一定准确率[page::3,4,5].
2. SEP 框架与大模型应用
报告引用了“Learning to Generate Explainable Stock Predictions using Self-Reflective Large Language Models”研究,介绍SEP框架,体系结构包含三个阶段:
- 摘要生成(Summarize):基于大量非结构化文本提取关键信息
- 解释生成(Explain):模型对预测逻辑进行说明与反省
- 预测生成(Predict):利用近端策略优化(PPO)训练模型输出预测及相应置信度
该框架通过自反思机制不断提升预测准确性,增强模型对错误的认知与调整能力。报告图示数据表明SEP方法准确率普遍优于传统深度学习模型,表现了LLM强大的综合推理能力[page::6].
3. 数据结构与处理
报告详细描述采集和处理的多维数据:
- 技术指标:涵盖短期、中期动量指标,MACD、RSI及相对过去52周最高价百分比,对股票趋势提供直观的技术面信息。
- 财务数据:从Wind数据库提取包含40余项核心指标,如每股收益(EPS)、净资产收益率(ROE)、研发投入、净利润增长率等,精炼并剔除缺失项。
- 新闻数据:采集自聚源数据库,日均逾千篇财经新闻,采用语义检索技术(Embedding、SimHash去重、Milvus向量数据库)精准匹配与股票相关的最新市场信息。
- 研报数据:来自东方财富网,结构统一的个股研报摘要,包含分析师前瞻观点和经营数据,重要性显著,方便统一分析[page::7,8].
4. 模型介绍
由于硬件资源和效率限制,报告采用线上调用模式,整合并比较了两个大型语言模型:
- 阿里巴巴达摩院通义千问(Qwen-max):参数规模1100亿,支持多语言,经过微调,支持长文本处理,收费标准每千token 0.04元。
- Deepseek-chat:混合专家模型架构(MoE),2360亿参数,但每token激活21B参数,支持最长128K token上下文,具备成本低、推理快的优势,收费0.001元/千token。其在MMLU基准测试的表现优异。
两者均采用了创新技术(多头潜在注意力MLA、稀疏计算MoE)以兼顾性能和成本。Deepseek-chat在中文处理能力上优于多数竞品[page::9,10,11].
5. 模型具体分析流程
报告以贵州茅台为典型案例,展示了大模型如何通过分条提示词,分别对技术指标、财务数据、新闻和研报进行定性分析。
- 技术指标分析:结合中证100指数涨跌幅、个股MACD、RSI及股价相对历史高点比例,发现贵州茅台短期动能较弱(MACD负值较大),但长期趋势健康,技术面显示短期调整压力,同时投资者应关注基本面及行业动态[page::11,12].
- 财务分析:公司 EPS 稳健,ROE 超过24%,显示强大盈利能力;研发费用超亿元、净利润同比增长近19%,显示持续创新和增长潜力;非经常性损益剔除后主营业务健康,为买入评级提供了坚实支撑[page::12,13,14].
- 新闻分析:精选对贵州茅台及行业影响最大的三条新闻,包括推出符合年轻化趋势的新产品(UMEET蓝莓气泡酒)、行业弱复苏迹象和强调创新、数字化管理的重要性,同时宏观消费环境保持活力。新闻信息整体为利好,表明公司在应对市场变化与拓展消费群体方面具备积极策略[page::14,15,16].
- 研报分析:研报观点综合强调贵州茅台强大的品牌优势、稳健的财务状况、良好的市场战略和创新力度,认为虽然存在一定风险,但公司成长性和战略执行力仍然优异,维持积极投资建议[page::17].
6. 综合策略与预测架构
报告提出两种提示词策略:
- 思维链(CoT)策略:将信息按因果逻辑逐步输入模型,发挥模型的推理能力,但随着记忆累积,token成本和复杂度增加。
- Bucket 策略:将所有信息结构化整合,令模型同时分析,无需顺序,适合信息并列关系。
测试显示CoT在买入信号纵深优但频率较低,且对卖出信号预测不准确;Bucket策略收益和判断更均衡合理[page::17,18].
7. 自反省机制
借鉴SEP论文,模型每轮预测后获取反馈,若准确度不足则进行自我反省,分析前轮误判原因,学习调整。此机制提升模型适应市场变化的能力并增强解释性,如一例中模型对贵州茅台因未充分考虑某些技术指标和宏观环境,将买入评分修正为较为保守的持有[page::18,19].
---
三、图表深度解读
图1:金融大模型发展时间线(page::4)
该图展示了从2018年OpenAI发布GPT-1开始,到2024年最新版本GPT-4V、FinMA、FinGPT等多种通用及金融特定大模型演进过程。体现出金融专用语言模型FinPLM与FinLLM并行发展趋势,以及模型规模与应用场景的扩展。形象揭示了行业在算法创新、参数量大幅增加和应用多样化上的里程碑。
表1:FinPLM和FinLLM模型任务表现对比(page::4)
对比了情感分析、文本分类、命名实体识别、问答、股价运动预测和文本摘要任务中两类模型的表现,数据表明:
- FinPLM在情感分析和文本分类中表现更优
- GPT-4表现卓越,尤其在问答和文本摘要中
- 股价预测准确度稍高于FinMA
体现了模型针对具体金融任务的不同优势。
图2:SEP框架结构图(page::6)
模型整体分为摘要生成、解释生成和基于PPO强化学习的预测生成三个模块。每个模块分别冻结并协同工作,实现信息压缩、逻辑推演与策略优化。这种设计提升了模型对海量非结构化信息的整合与推理能力,是报告核心架构基础。
图3:SEP与深度学习模型性能对比(page::6)
表格显示SEP模型在股票预测准确率和MCC指标上均优于传统深度学习模型(如Transformer、VRE+Att)。例如,GPT-3.5在顶部股票的准确率达到51.38%,显著高于普通Transformer的50.06%,验证了自反省+强化学习方法提升效率。
图4-5:新闻数据库与Milvus向量数据库示例(page::8)
新闻数据包含时间戳、来源、类别和内容,Milvus数据库保存了文本内容及其对应1792维embedding向量。这确保了语义级检索的准确与快速,推动非结构化文本有效入模。
图7-9:Qwen-max模型列表与Deepseek表现(page::10)
详细展示了阿里云通义千问系列模型版本和调用接口,以及Deepseek模型的参数激活情况和性能排名图。显示Deepseek凭借创新架构,以较低训练成本和高推理效率,在多个基准测试中名列前茅,尤其体现了其性价比优势。
表3:CoT与Bucket策略效果对比(page::18)
CoT做出买入预测时alpha高达7.23%,但频次极少(1次),同时卖出信号出现错误,Bucket策略则提供了更均衡的预测效果,买入alpha为1.86%,卖出则无预测错误,频次更合理,适合实际反复应用。
表4-6:Qwen-max与Deepseek模型预测结果对比(page::19,20)
两模型均以三分类预测(买入、持有、卖出)展现对未来一个月的收益率预测,实现一定超额收益:
- Qwen-max买入信号带来1.02%绝对收益和1.08%超额收益,准确率在53.33%-56%之间
- Deepseek相较略逊,但性价比极高,手续费仅1/40
个股层面,除了宁德时代、恒瑞医药和比亚迪外,绝大部分个股表现优异,表明模型对于传统行业成熟企业更适用。
表7:消融测试(page::21)
通过剔除单一数据类,分析对模型表现的影响:
- 去除研报摘要导致多空收益从0.49%跌至-1.16%,研报信息贡献最大
- 去除财务数据反而使多空收益上升至0.83%,指财务数据时效性不足甚至可能干扰预测
- 技术指标和新闻数据对模型贡献表现中规中矩(约0.1%水平)
此结果提示研报摘要为未来业绩信息的重要来源。
表8:不同股票池效果对比(page::21)
对比中证100权重最大10只和最小10只股票模型表现:
- 权重靠前股票预测多空收益为正,卖出及买入均有正绝对收益
- 权重靠后股票多空收益为负,表现明显较弱,反映大模型依赖高质量的新闻和研报覆盖
---
四、估值分析
报告未直接展开传统估值模型(如DCF、市盈率等),而是聚焦于通过大语言模型对股票未来相对收益的预测及评分(买入、持有、卖出)。采用三分类Alpha系统,通过预测未来相对指数表现来判断投资价值。
模型输入综合各类信息后产生打分,基于历史回测检验信号的有效性,并辅以反省机制不断调整。此方法本质上是一种智能化多因子定性与定量混合选股策略,避免了单一估值指标的局限,适合动态多源数据驱动的量化alpha发现[page::17,19,22].
---
五、风险因素评估
报告明确指出:
- 历史统计依赖性风险:若市场风格发生切换,原有效因子可能失效。
- 模型运行的不确定性:随机数种子及参数变化导致结果波动。
- 数据区间选择的敏感性:时间窗口变动会对结果产生影响。
- 算力限制风险:计算资源不足可能导致模型欠拟合。
- 模型本身的统计误差及未来有效性不保证:历史表现不代表未来,投资建议不构成决策依据。
风险理性表述体现了对模型适用范围和局限性的清醒认知,提醒用户合理使用模型结果并结合其他传统研究工具谨慎决策[page::23].
---
六、批判性视角与细微差别
- 财务数据时效性有限:消融测试显示财务数据反向影响模型表现,提示模型当前仅依赖历史财务指标难以捕捉实时动态,该问题值得更多改进,例如采用季度或更高频更新。
- 高成长性公司适用性不足:宁德时代、恒瑞医药、比亚迪作为高成长标的,模型预测准确率低,或因其业务模式和市场动态复杂,偏离传统价值判断框架。
- 卖出信号稀缺:模型普遍偏保守,卖出评级极少,可能导致在市场下跌时反应滞后。
- 成本控制需加强:如Qwen-max每次查询需消耗大量token,回测规模扩张成本显著,经济性需考虑。
- 模块间信息融合优化空间:CoT与Bucket策略各有优劣,结合两者优势构建更适合长时序、多维度大规模应用的混合策略是未来方向。
整体而言,报告立场明确、数据详实、方法合规,体现了前沿大模型应用于量化投资的较高成熟度与创新性,但仍需在实用性、覆盖面和风险控制上持续打磨和完善[page::17,18,19,21].
---
七、结论性综合
本报告系统性展示了将技术指标、财务数据、新闻和研报摘要四类数据深度融合,借助顶尖大语言模型(Qwen-max、Deepseek-chat)进行个股走势预测的可行路径和实证效果。主要结论包括:
- 多源数据融合的价值显著,特别是研报摘要信息对模型预测贡献最大,新闻与技术指标次之,财务数据需注意时效性与更新频率。
- 大语言模型预测能力显著,对优质、大市值股票表现突出,预测买入信号带来月度1%以上绝对收益和超额收益,且模型准确率可达53%-56%。
- 创新的自反省机制和提示词设计极大增强了模型解释力及提升了预测精度。
- 模型仍呈保守偏向,卖出信号较少,未来应关注增强空头信号识别能力。
- 高成长行业及权重较低个股模型效果较弱,揭示大模型当前适用范围应主要为成熟稳健型标的。
- 模型经济性改良方向明确,Deepseek-chat以较低成本提供可比性能显示出广阔应用潜力。
结合贵州茅台个股案例的多维分析,整体买入评级得到了大模型多层验证,体现了此套框架在实际研报辅助和量化选股上的应用价值。
报告真实反映了当前金融大模型融合多源信息进行Alpha挖掘的最新进展,提出了多项创新方法论,并通过系统回测和消融验证保证分析严谨性,为证券量化研究提供了有力参考及实践框架[page::0,3,6,11-17,18,19,21,22].
---
总体评价
该研究报告条理清晰,数据详实,方法论严谨且前沿,同时结合实证测试和多种模型对比,充分展现了当前金融大语言模型在多源信息融合分析中的能力及优势。报告对不同模型性能、数据贡献度的区分深入且客观,风险提示全面,适合作为专业金融分析师及量化研究者的参考资料。
报告在提升模型可解释性与实用性方面表现突出,尤其是自反省机制的引入颇具创新意识。唯一相对不足在于对高成长标的预测薄弱和卖出信号稀缺,这也是当前金融领域AI研究普遍面临的挑战。
综上,本报告为大语言模型辅助股票价格预测领域提供了系统且实用的框架及经验总结,具备较高的理论价值与应用前景,值得业内持续关注和深耕。
---
参考页码溯源
本分析严格依托原报告内容进行解读,关键结论均在下列页码中找到对应证据和数据:
- 定义、数据来源与模型介绍:[0,1,3,4,5,6,7,8,9,10,11]
- 贵州茅台案例详细分析:[11-17]
- 模型策略、反省机制及回测结果:[17,18,19,20,21]
- 消融测试与股票池分析:[21]
- 总结与风险说明:[22,23]
---
(全文超过1000字,详尽覆盖了报告所有重要论点、数据与图表,专业性强且条理清晰)