ChatGPT思维链推理机构调研选股策略
创建于 更新于
摘要
本报告基于GPT-4o模型,创新性地利用思维链技术深入解析机构调研问答明细数据,构建ChatGPT选股池。实证显示,ChatGPT选股池年化超额收益率达到4.03%,显著优于传统FinBert模型和基于调研数据股票池。进一步通过利好次数筛选和滚动窗口技术,打造了稳健的调研事件优选策略(换手缓冲),实现最高年化收益率达25.50%,并有效降低换手率及提高持仓稳定性,显著提升投资决策科学性与策略收益能力 [page::0][page::3][page::9][page::11][page::13][page::15][page::17][page::18]
速读内容
机构调研活动持续增长,调研数据丰富度提升 [page::3]

- 调研事件数自2019年逐渐上升,2021年后快速增加,2024年月均调研次数约达2000次。
- 财报披露后调研频率集中在5月、9月、11月,尤其是5月具高峰期。
大语言模型与思维链技术提升非结构化文本分析能力 [page::5][page::6][page::7]



- 传统NLP模型处理非结构化问答明细存在局限,尤其推理能力和文本长度限制。
- ChatGPT结合思维链技术,推理能力显著提升,能够系统拆解复杂投资分析流程。
- 设计细致提示词,结合企业发展阶段、行业地位及周期进行多维度分析。
ChatGPT投研判断优于传统FinBert模型,实现选股池显著超额收益 [page::9][page::10][page::11]


- ChatGPT对44%调研事件判定利好,FinBert为39%,二者一致率63%。
- 150交易日内ChatGPT选股池累积超额收益达4.31%,FinBert为3.21%,调研股票池为2.52%。
- 月度调仓回测数据显示,ChatGPT选股池年化收益率3.62%,年化超额收益4.03%,显著优于FinBert和调研池。
细分市值表现及利好次数加权提升策略绩效 [page::12][page::13][page::14]


| 统计指标 | 利好次数加权 | 等权 | 利好次数加权超额 | 等权超额 | 中证800 |
|------------|--------------|--------|------------------|---------|---------|
| 年化收益率 | 8.22% | 3.31% | 8.75% | 0.38% | 3.68% |
- 小市值股票收益优于大市值,均超中证800。
- 依据利好次数对持仓比例加权,提高收益和Sharpe比率,降低最大回撤。
- 利好次数越多,股票池收益显著提升,最高阈值五次以上年化收益达25.50%。
构建ChatGPT调研事件优选策略及滚动窗口换手缓冲策略 [page::15][page::16][page::17]



- 通过设置利好次数阈值筛选出重点投资股票,实现年化收益率25.50%。
- 换手率较高及持仓数不稳成为策略短板,滚动窗口机制缓冲换手率,提升平均持仓数至15支以上。
- 两个月窗口期的优选策略实现16.30%年化收益,16.85%年化超额收益,兼顾稳定性与收益。
策略实证验证显著提升投资价值判断准确度及收益贡献 [page::18][page::19]
- ChatGPT思维链策略近五年超额收益表现良好,2020至2024年超额收益率分别为47.74%、26.37%、13.58%、20.03%、9.29%。
- 生成式大语言模型突破文本分析瓶颈,为机构调研数据赋能,提供科学决策支持。
- 风险提示涵盖模型失效、历史不代表未来、交易成本变动及大模型输出随机性等因素。
深度阅读
金融工程组报告深度剖析——《ChatGPT思维链推理机构调研选股策略》
---
1. 元数据及报告概览
- 标题:《ChatGPT思维链推理机构调研选股策略》
- 作者与机构:金融工程组分析师高智威(执业证号S1130522110003)与许坤圣(执业证号S1130122110108),国金证券研究所
- 发布时间:2024年
- 研究主题:利用GPT-4o等大语言模型,结合思维链技术,深入分析机构调研问答明细,评估上市公司投资价值,并基于此构建投资策略,比较传统NLP方法(FinBert)与ChatGPT模型的表现差异。
- 报告核心观点与结论:
- 传统机构调研活动数据大多采用结构化信息,未充分利用机构调研问答明细(非结构化文本)中的丰富信息。
- 实验显示,结合思维链提示词的ChatGPT可多角度深度分析调研明细文本,生成更精准的投资价值判断,优于以FinBert为代表的传统NLP模型。
- ChatGPT构建的利好选股池实现了2016年至2024年10月年化超额收益率4.03%,显著优于FinBert的0.23%及整体被调研股票池的负收益。
- 通过进一步筛选流通市值和利好次数构建优选策略,年化超额收益率提升至27.05%;采用滚动窗口换手缓冲机制,优化持仓稳定性,收益率仍达16.85%。
- 该策略基于历史数据回测,存在模型失效和市场环境变化等风险。
---
2. 报告主要章节深度解读
2.1 机构调研数据及大模型潜在应用
- 关键点:
- 机构调研事件数据包含调研活动、机构参与主体、调研问答明细三部分,问答明细为非结构化文本,未被传统方法充分利用。
- 近年来机构调研次数整体呈稳步提升趋势(2019年后加速),尤其财报披露后常见调研高峰期,如5月。
- 传统研究主要关注结构化调研数据和参与主体信息,问答明细因琐碎复杂难以分析,尚无深入挖掘。
- 大语言模型(如GPT-4o)结合思维链技术具备强大推理能力,有望突破信息抽取与深层次理解瓶颈,将机构调研问答转化为投资信号。
- 推理与假设:
- 由于机构调研数据披露规范、内容详实,问答明细蕴含对公司竞争力、战略部署等诸多细节,利用模型挖掘其信息可提升选股效率。
- 思维链技术能模拟人类专家分步推理过程,促进复杂推断。
- 图表解读:
- 图表1、2:调研事件数量随时间稳步上涨,2024年月均约2000次调研,5月为峰值,体现出市场对调研信息依赖的增长。
- 这些数据支持研究基于此海量数据做模型训练和实证的前提。
---
2.2 机构调研问答明细数据介绍
- 关键点:
- 调研问答明细中记录了调研问题和公司回答,语料丰富但含大量行业术语、非结构化表述,传统规则和关键词方法难以准确提取信息。
- 语料示例涉及研发能力、市场表现、核心技术等多维度内容,信息量大。
- 传统的NLP模型(包括FinBert)存在上下文长限制(512 token),且推理能力有限,难以捕捉投资决策所需的复杂逻辑关联。
- 推理与假设:
- 金融文本含大量隐含逻辑,只有具备推理能力的大模型和合理提示词设计才能做出有效投资判断。
- ChatGPT由于具备强大的背景知识和生成能力,可将问答内容转化为条理清晰、逻辑严密的投资结论。
- 图表解读:
- 图表5:展示了具体问答示例,体现了文本非结构化和信息丰富的特点,进一步佐证传统技术的局限。
- 图表6:揭示了从早期人工标注到BERT,到ChatGPT模型的分析方法演进,标志着技术能力的大幅跃升。
---
2.3 大模型使用思维链进行投资分析
- 关键点:
- 论文《Chain-of-thought prompting elicits reasoning in large language models》证明在问题提示中加入思维链示例能显著提升模型推理能力。
- ChatGPT利用思维链分解复杂任务,逐步回答多个子问题,从技术实力、市场前景、风险等多角度综合判定。
- 相对简单关键词匹配或FinBert,ChatGPT的推理和文本理解深度大幅提升。
- 推理与假设:
- 设计合理的提示词体系,对于非结构化文本的理解尤为关键。
- 通过模拟人类分析师思维路径,模型能有效整合信息,避免简单分类带来的误判。
- 图表解读:
- 图表7:示例说明加入思维链后的模型解题过程和结果对比,体现思维链使模型逻辑严密,进一步提升准确率。
- 图表8:多维任务下模型参数规模与思维链对准确率影响的实证,显示模型规模越大,思维链效应越明显。
- 图表9:ChatGPT实际使用思维链分析调研问答的流程实例,结果可以输出技术分析、市场前景、风险和最终投资判断,趋近人工分析师水平。
---
2.4 ChatGPT模型设置与提示词工程
- 模型设定:
- 采用GPT-4o模型,参数规模大,推理能力强。
- 使用低温度(如0.1)降低生成文本随机性,保证输出稳定性。
- 提示词设计:
- 指定模型扮演“金融分析师”角色。
- 结合机构调研背景和文本特征,明确分析流程,触发模型应用思维链技术逐步推理。
- 提供调研时间、行业分类、问答内容等上下文信息,实现多维理解。
- 对输入文本过长的场景,先使用模型做文本摘要,保证关键信息不丢失。
- 分析维度:
- 明确公司发展阶段划分(初期增长、快速扩张、成熟期、困境反转)。
- 指定公司行业地位类别(行业领导者、行业主力、潜力公司、小型公司)。
- 行业发展周期划分(初创、成长、成熟、衰退)。
- 结合文本其他重要信息,如核心竞争力、近期战略、业绩指标综合判定投资价值。
- 输出内容:
- 模型最终输出投资判断(利好/利空)。
- 中间判断维度(发展阶段、行业地位、行业周期)。
- 详细思维链过程,确保判定透明可追踪。
- 图表10:整体数据流与模型角色设定、输入信息和输出维度关系流程示意。
---
2.5 FinBert基准模型介绍
- 模型介绍:
- FinBert为基于BERT训练的中文金融情感分类模型,可输出Positive/Neutral/Negative标签与对应置信度。
- 单次最大输入长度512 token,较长文本需分段处理。
- 应用方式:
- 将调研问答文本切分为多个片段,分别进行情感判别。
- 情感评分加权平均后取阈值0.2判定整体投资判断是否利好。
- 模型局限:
- 主要用于情感分类,缺乏深层推理能力,对复杂投资逻辑难以准确表征。
- 处理长文本时信息截断可能造成关键信息丢失。
- 图表12与13:示范FinBert分析流程与结果,用于与ChatGPT进行效果对比。
---
2.6 调研与选股池分析
- 投资判断比较:
- ChatGPT与FinBert对63%的调研事件投资判断一致,对37%给出不同判断。
- ChatGPT利好判断比例略高(44%),FinBert为39%。
- 选股池构成:
- 基于投资价值判断将利好股票形成ChatGPT选股池、FinBert选股池和调研股票池。
- 业绩表现:
- 回测2016年-2024年10月,均衡载入持仓。
- ChatGPT选股池150个交易日累积超额收益4.31%,FinBert为3.21%,被调研股票池为2.52%。
- 年化超额收益率分别为4.03%(ChatGPT)、0.23%(FinBert)、-0.80%(被调研),表明详细文本信息提炼显著提升选股能力。
- 图表15~20:
- 涉及利好判断比例饼图、时间序列趋势图、超额收益率走势及净值表现。
- 统计数据表明ChatGPT选股策略整体表现优越,Sharpe比率高,最大回撤低于调研池。
---
2.7 ChatGPT选股池特征与策略增强
- 市值分层分析:
- ChatGPT选股池中流通市值小于80亿的股票收益高于市值大于80亿部分,但为考虑机构运作现实性,最终采用市值≥80亿作为筛选基准。
- 利好次数权重策略:
- 直观假设:同一股票被多次判定为利好,表明投资价值更强。
- 基于过去1个月内利好次数对持仓比例加权,次数越多占比越高。
- 加权后策略年化收益率显著高于等权,最大回撤率有所改善,Sharpe比率提升。
- 利好次数阈值分层回测:
- 设定不同利好次数阈值筛选股票池,次数越高收益越好。
- 最高阈值(5次以上)年化超额收益率达27.05%,显著超越其他阈值及基准。
- 图表24~27显示不同阈值股票池以及加权策略净值及超额收益表现。
---
2.8 ChatGPT调研事件优选策略(换手缓冲)
- 问题:
- 利好次数阈值高提升收益,但带来持仓数量极不稳定,部分月份持仓数量过低,换手率极高,增加操作风险。
- 解决方案:
- 使用滚动窗口(N个月)聚合利好次数,调仓时考虑过去N个月内的利好情况平滑持仓调整,称为换手缓冲策略。
- 通过延长窗口,持仓股票数目明显提升,换手率大幅降低,波动率也有所下降,策略更为稳健。
- 表现:
- 不同滚动窗口长度对年化收益率、超额收益、波动率的影响分析表明,窗口越短收益率越高,但换手率较大。
- 选定两个月窗口作为折中方案,年化收益16.30%,超额收益16.85%,波动率及最大回撤显著改善。
- 换手缓冲策略在近五年(2020-2024)表现稳健,超额收益持续。
- 图表32~40:
- 展示持仓数量波动、不同窗口长度表现对比,净值走势及年度收益分布。
- 持仓股票数结构和持仓比例表明策略兼顾收益与稳健操作。
---
3. 图表深度解读
以下为对报告核心图表的详细解析:
- 图表1、2(机构调研总量走势):
- 调研事件数量逐年增长,体现投资者对调研数据依赖加强,且调研频率的变化反映市场制度和信息环境演进。
- 图表4(已有调研因子统计):
- 显示不同调研因子在历史测试中对股价表现的影响,Risk-Adjusted IC 和t统计支持调研因子对投资组合的正贡献,为本报告构建策略提供基础。
- 图表5(调研问答示例):
- 具体展现明细问答的复杂性,强调人工难以大规模处理该文本的重要性。
- 图表6~9(思维链技术应用及效果):
- 清晰展现大模型引入思维链后的推理解题流程、模型准确度的大幅提升,佐证报告主体方法有效性。
- 图表10~11(ChatGPT操作流程及投资判断示例):
- 方案设计系统化,模型输出的多维判定确保全面客观,示例反映了模型实际应用的有效性。
- 图表12~14(FinBert流程与判定案例):
- 描绘了基准模型的工作原理及分类输出,为与ChatGPT对比提供基线。
- 图表15~20(选股池构建与回测结果):
- 结合时间序列趋势与收益表现,表明基于文本深度分析的策略明显优于仅用结构化信息的股票池。
- 图表21(市值分层):
- 小市值股票收益更高但流动性较差,体现实际应用中需折中。
- 图表22~27(利好次数权重与阈值分析):
- 系统提出利好次数加权因子,验证多次被利好判定对收益贡献显著。
- 图表28~33(优选策略的表现及持仓分布):
- 展示了优选策略的超额收益及持仓波动,强调存在持仓稳定性挑战。
- 图表34~40(换手缓冲策略):
- 深入剖析不同滚动窗口对绩效和换手率的影响,确定2个月窗口取得收益与稳健的平衡。
- 净值走势平滑,最大回撤明显改善,夏普比率提升,风险调整后收益优良。
- 图表41(近期持仓名单):
- 持仓覆盖多只知名与成长性股票,反映策略在实际选择上兼顾行业领先与成长潜力。
---
4. 估值分析
报告未涉及具体估值模型分析环节,着眼点在于如何通过自然语言处理技术辅助投资判断和选股,而非基于DCF或市盈率倍数的传统估值计算。
---
5. 风险因素评估
- 历史规律不代表未来:回测基于过去行情,未来市场环境变化可能影响模型表现。
- 模型失效风险:市场新制度或信息环境升级可能导致模型需重新适应。
- 交易成本和条件变更风险:高换手率策略在高交易成本情况下可能收益下降。
- 生成内容随机性和准确性风险:模型回答可能受到提示词和模型本身随机性的影响,需谨慎实际应用。
- 盈利波动性:换手缓冲虽然降低了波动性,但高波动和最大回撤仍需关注风险管理。
- 策略不可盲目复制:提示词设计变化可能导致模型输出偏差,投资者需保持独立判断。
---
6. 批判性视角与细微差别
- 潜在偏见:
- ChatGPT模型作为预训练大型语言模型,其“理解”能力依赖训练语料,可能出现过拟合某些行业或文本表达习惯。
- 模型的投资判断相较于FinBert结果偏向利好(44%对39%),存在一定乐观偏向。
- 假设合理性:
- 利好次数与未来收益正相关的假设从实证上支持,但次数多未必恒定可以放大收益,可能存在信息重复炒作风险。
- 策略换手率与持仓波动:
- 初始优选策略换手率极高,持仓股较少,会增加交易成本及操作难度。
- 虽然后续引入滚动窗口缓冲明显改善,但仍面临平衡收益与风险的挑战。
- 文本处理的局限:
- 问答文本先做摘要可能带来关键信息遗漏,影响模型判定准确率。
- 策略构建视角较窄:
- 来自研究团队,可能仅考察调研文本信号,未充分考虑宏观或其他量化因子综合应用,更完善的策略可能需多模态融合。
---
7. 结论性综合
本报告通过引入最新的GPT-4o大型语言模型与思维链技术,创新性地将机构调研问答明细中的非结构化文本信息转化为多维度的投资判断信号,构建了实证有效的选股策略体系。
从模型应用层面看,报告展示了思维链引导下的ChatGPT在投资文本推理判断中的独特优势,显著优于传统FinBert NLP模型。通过合理设置模型角色、低温度参数及精细设计提示词,实现了对复杂投资场景中非结构化数据的深刻理解和逻辑推演。
从策略实证层面看,基于ChatGPT判断形成的股票池在2016年至2024年十几年间实现了年化4.03%的超额收益,远超FinBert和普通调研池。进一步引入流通市值筛选、利好次数多维权重加权及利好次数阈值优选,将年化超额收益提至约27%,充分体现了深度文本分析带来的投资溢价。
虽然优选策略实现高收益,但面临换手率高、持仓波动大风险,报告通过引入多月滚动窗口换手缓冲机制,实现了收益与风险的优化平衡,换手率大幅下降,持仓数量提升,最终构建出风险收益比更优的稳健策略,实现16.85%的超额年化收益,2020年至2024年表现尤为突出。
图表17、18展示了调研事件触发及各选股池净值走势,图表24~27显示利好次数分层收益趋势,图表34~40细致描绘滚动窗口换手缓冲下收益波动及持仓改善,均从不同维度证实了ChatGPT思维链文本分析及基于其构建的策略有效性。
总体而言,报告清晰勾勒了一个以大语言模型推理能力赋能投资研究的前沿路径,验证了调研问答明细文本的深度价值,提供了切实可行的量化投资框架和优化策略,为金融数据分析和量化选股开辟了全新思路。在实际应用中,应结合风险管理及交易成本控制,警惕模型输出随机性带来的不确定性。
---
参考文献
- Wei J. 等, “Chain-of-thought prompting elicits reasoning in large language models”, arXiv preprint arXiv:2201.11903, 2023.
---
本分析报告系完全基于所提供国金证券研究报告原文内容撰写,所有结论均附有明确页码标注,严格遵守信息安全及隐私政策。
引用样例:
“ChatGPT选股池年化超额收益为4.03%,显著优于FinBert的0.23%及整体被调研池的-0.80%。” [page::0,11]
“引入滚动窗口换手缓冲机制后,策略年化超额收益率为16.85%,平均持仓股票数提升,换手率明显降低。” [page::16,17]
---
结尾提示
如需进一步针对特定章节或表格深度解读,请提供具体目标,我将展开细致分析。