`

Alpha掘金系列之八:FinGPT对金融论坛数据情感的精准识别 沪深300另类舆情增强因子

创建于 更新于

摘要

本报告基于FinGPT大语言模型对子长科技提供的沪深300金融论坛评论数据进行了情感分析,构建了包含情绪表达、分歧及变化的情感打分体系,并基于乐观情绪构建量化选股因子与舆情增强策略。研究显示,乐观情感因子单因子IC达到3.65%,多空组合年化收益率12.71%,且与基本面因子相关性低,表明情感因子能有效捕捉独立市场信息,舆情增强策略在费用调整后实现6.69%年化收益,夏普比率0.32,策略表现稳健,提供了金融论坛情绪对量化投资的增量价值证据 [page::1][page::7][page::9][page::10][page::11][page::12][page::13]

速读内容

  • 金融论坛舆情情感分析背景与数据特征 [page::1][page::2][page::4]

- 采用2018年至2023年子长科技采集的逾1300万条主帖与480万条评论数据,覆盖沪深300超260只股票。
- LKM(Large Knowledge Model)知识模型用于精准关联股民情绪与个股,克服股票代称复杂与非显式提及问题。
- 主帖与评论区别明显,评论更能反映真实投资者情绪,信噪比虽低但信息量较大。


  • 大语言模型与FinGPT技术优势 [page::5][page::6][page::7]

- LLM如ChatGPT具备零样本、少样本学习优势,泛化能力强,但调用成本较高。
- 开源模型(如ChatGLM)本地部署降低成本,FinGPT基于ChatGLM-6B微调,进一步提升中文情感分析准确度。
- FinGPT融合多源金融数据,采用LoRA等微调技术,兼顾实时性和准确性,适合大规模金融评论情绪分析。


  • 国金金工情绪打分体系构建及因子测试方法 [page::7][page::8][page::9]

- 构建情绪表达、分歧及变化三维度打分体系,针对每条评论通过FinGPT打分(乐观=1,中性=0,悲观=-1)。
- 因子IC测试与分位数组合测试验证情绪因子有效性,使用周频调仓,测试区间2018.1-2023.6。
- 评论情绪因子表现优于主帖,乐观情绪和因子IC达3.65%,多空组合年化收益率12.71%,显著优于大部分基本面因子。


| 因子名称 | IC值(%) | t统计量 | 分位数组合多空年化收益率(%) |
|----------------|---------|---------|-----------------------------|
| 乐观情感和因子 | 3.65 | 2.58 | 12.71 |
  • 舆情情感因子与传统基本面因子相关性低 [page::10]

- 情感因子与成长、价值、质量、动量及技术因子相关性均低,最高与市值因子相关0.55,但市值因子为升序因子,情感因子为降序因子,彼此区别明显。

  • 大模型金融论坛舆情增强量化策略表现 [page::11][page::12]

- 策略“乐观情绪和”选取Top 20%股票等权组合,月频调仓,手续费千分之三。
- 策略年化收益率6.69%,夏普比率0.32,超额年化收益率8.02%,信息比率1.58,最大回撤6.94%,表现稳健,显著跑赢沪深300基准。


  • 模型推理代码与技术实现 [page::13][page::14]

- FinGPT微调架构采用LoRA技术,显存和算力需求较低,支持消费级GPU推理。
- 输入提示词设计对结果影响显著,多次采样及固定随机种子为提升稳定性重要措施。


深度阅读

当FinGPT遇到论坛数据 一 沪深300另类舆情增强因子——详尽分析报告解构



---

一、元数据与报告概览


  • 报告标题:《Alpha掘金系列之八:FinGPT对金融论坛数据情感的精准识别 沪深300另类舆情增强因子》

- 作者/分析师:高智威(SAC执业编号:S1130522110003)、郭子锋
  • 发布机构:国金证券股份有限公司

- 发布日期:2023年10月16日
  • 研究主题:应用开源大型语言模型FinGPT对沪深300金融论坛数据进行情感分析,构建具有选股能力的情绪增强因子,验证其在量化选股策略中的应用价值。


核心论点及评级目标:

本文以金融论坛评论这种另类数据为切入点,应用基于ChatGLM-6B微调的FinGPT进行情感分析,重点提出通过构建“舆情情感因子”作为量化股票超额收益的有效指标。研究表明,金融论坛评论情绪的乐观程度与股票后续收益正相关,且该情感因子与传统基本面因子相关性低,体现了其作为有效另类因子的独立性。基于情感因子构造的舆情增强策略在沪深300样本内实现了年化超额收益8.02%、夏普比率0.32,且表现稳健。

报告在系统介绍数据来源、大语言模型及大知识模型应用、情绪打分体系构建、因子效能验证及策略构建等方面展开详尽分析,提供策略实施的微观视角和风险提示。[page::0,1,8,11]

---

二、逐节深度解读



2.1 另类数据情感分析的新方法



报告首先阐述情感分析作为NLP的重要分支在金融领域的应用价值,特别是在金融论坛评论中,集体投资者情绪被认为是股价变化的重要透镜。报告揭示了投资者情绪通过“情绪与决策制定”、“从众心理”、“信息扩散”、“注意力偏差”四大机制影响股票价格:乐观情绪带动买入,群体情绪引发价格波动,信息真假与注意力集中对价格带来波动效应。

该章节重点强调情绪的非理性影响力及其在量化投资中的另类作用,引出以大语言模型为工具从论坛文本挖掘情绪因子的研究动机。[page::1,2]

2.2 金融论坛评论的数据特征



本报告采集了子长科技提供的2018年1月1日至2023年6月30日的金融论坛数据,覆盖沪深300中平均每周260多只股票,累计超过1300万条主帖和480万条评论。数据具有以下显著特点:
  • 多样性与高度情绪化:评论群体来自不同投资背景,情绪表达更为丰富和多样。

- 信噪比低:大量无关、段子或推广内容干扰情绪识别。
  • 事件驱动波动:特定事件引发评论数量激增。

- 主帖与评论区别:主帖多包含新闻公告和文本,评论更反映投资者观点和情绪。

子长科技利用其核心技术——LKM(Large Knowledge Model)实现了对金融论坛评论情绪的实体精确映射和情绪量化,优势在于克服代称识别和隐含股票标注难题,效果明显优于基于关键词的老一代情绪分析技术。

图表1展示LKM核心机制,将实时数据输入知识生成模型,通过知识数据网络支持推理、判断与决策;图表3展示LKM如何映射复杂别名(如“宁王”对应“宁德时代”)并结合股价历史数据做情绪判断。

报告还将LKM与LLM(Large Language Model)进行比较,指出LLM侧重生成文本,泛化能力强但解释性较差;LKM更充分利用结构化知识,追求决策智能和实时反馈,适合金融现场需要高可解释性的情绪分析场景。

技术架构上,LKM执行分类、事件提取、关系翻译和结构化,最终构建知识图谱与行业矩阵,为投资机会挖掘提供决策基础。此外,报告用图表强调LLM与LKM的推导差异(LLM为纯输入序列到输出序列的生成,LKM利用多源数据和结构知识)以及二者在Gartner人工智能发展周期中的地位和阶段。

金融论坛主帖和评论区别中,主帖数量多且包含新闻型内容,评论数量相对较少但更直接反映投资者情绪,后续章节将证明评论数据在情感分析中价值更高。[page::2,3,4,5]

2.3 大语言开源模型落地



随着大语言模型(LLM)技术飞速发展,FinGPT及其基础模型ChatGLM因在中文能力和定制能力的优异表现成为金融文本情感分析的效能工具。
  • LLM优势:预训练使其拥有极强的语言理解和生成能力,适合低信噪比、多样表达的金融论坛评论情绪分析;可零样本或少样本完成任务,减少昂贵标注需求。

- 劣势:ChatGPT等模型调用成本高,难以大规模文本批量分析。
  • 开源模型优势:包括Alpaca、LLaMa、ChatGLM在内的开源模型支持本地部署,控制成本、保护隐私,且可根据需求微调,更适合金融领域自研应用。

- FinGPT介绍:基于ChatGLM-6B微调的金融专用开源LLM,覆盖数据源广(Yahoo、Seeking Alpha、东方财富等)、支持多种微调技术(LoRA、强化学习),具备更优的情感分析表现。

报告附图展示LLM自回归机制(图7)、HELM模型情感分析排行榜、开源LLM发展时间线(图11)、FinGPT完整架构图(图14)。展示FinGPT在情感打分任务上的权威数据集表现(图15),涵盖多语种和多数据源。

ChatGLM提供了千亿参数级模型在挑战中文任务时的优秀能力,FinGPT在此基础上通过微调适配金融舆情应用,实证其在评论情绪细腻区分中的增强作用。[page::5,6,7]

2.4 情绪打分体系构建



报告构建了系统化的情感打分体系,包含:
  • 情绪表达:投资者对股票的明确情绪态度衡量。

- 情绪分歧:不同投资者间情绪态度的差异或对立。
  • 情绪变化:时间序列上的情绪波动。


通过对论坛评论逐条打分(正面1,中性0,负面-1),实现对市场微观情绪的精准量化。使用IC(信息系数)和分位数组合回测测试因子有效性。目前使用的因子为单因子Rank IC,通过与未来一期收益的排序相关性衡量因子预测能力,分位数组合作为实证多空收益的经典方法。

测试显示金融论坛评论数据优于主帖,情感与股票收益关联更强且内容更贴近投资者观点(图19显示评论因子IC表现优于主帖因子)。

规模上,沪深300中每周约覆盖260只股票,累计数据量巨大(图20、21),评论情绪分布多元:53%中性,35%乐观,12%悲观(图22、23)。

整体而言,FinGPT打分的乐观情绪因子IC达到3.65%,单因子收益稳定且统计显著,显示出情绪因子作为选股信号的独立价值(图25、26、27、28)。此外,情绪因子与传统基本面技术因子保持低相关性(图29),尤其只与市值因子稍相关(0.55),但两者因子方向不同,进一步加强了情感因子提取的市场价外信息的属性。

报告特别指出情绪因子具有极强的同步性,即当日涨幅与当日情绪呈较强正相关(9.19%),说明论坛评论反映了即时市场反应而非单纯领先指标(图30、31)。

[- 术语注释 -]
  • 信息系数(IC):因子值与未来收益率的相关性。

- 分位数组合测试:将股票按因子值分组,做多Top组,做空Bottom组,计算多空组合收益。
  • LoRA(低秩适配):一种参数高效微调方法。


2.5 大模型金融论坛舆情增强策略



根据前述情感因子成果,报告进一步设计量化策略:
  • 构建方法:每月以乐观情绪总和因子排名选出20%股票,等权组合配置。

- 交易成本:千分之三手续费。
  • 业绩表现:年化收益6.69%,信息比率1.58,夏普0.32,最大回撤6.94%。

- 年度结果:多年份稳健超越沪深300指数,凸显策略抗周期性和抗风格波动能力(图33至35)。

报告强调,通过推演,金融论坛评论中的舆情情感提炼能为传统选股策略带来显著增量收益,信息增量显著且风险调整后性能优良,且该另类因子作为独立因子可增强量化投资组合的多样性和稳定性。

---

三、图表深度解读


  • 图1(LKM知识模型核心框架):展示了数据流实时输入、知识生成与应用模型及决策输出的全流程,说明知识驱动的情绪映射机制,支持后续情感因子高质量构建。[page::2]
  • 图3(LKM映射示意):细致展示用户帖文中的模糊表达如何通过别名匹配(“宁王”对应“宁德时代”)关联股价数据,结合贴文与行情,做出情绪推断的核心逻辑,体现了知识图谱对场景理解的贡献。[page::3]
  • 图4(LLM与LKM推导差异):直观表达两者从单纯序列生成到多维知识融合决策的区别,反映在金融情绪分析中两者互补性。
  • 图5(Gartner人工智能发展周期):指出生成型AI(GPT)及决策智能均是目前高关注核心技术,反映报告对AI发展阶段的认知基础。[page::4]
  • 图6(主帖与评论结构区别):表达两者层次结构不同,且大量主帖是新闻或自动转化内容,评论更偏向真实投资者表达,支持后期选择评论数据作为情绪分析重点。[page::5]
  • 图7(自回归语言模型输出):示例LLM预测下一个词概率,说明语言模型如何一步步构建语义,基础理解生成机制。[page::5]
  • 图11(开源LLM时间线):展示近年各大开源模型发展脉络,标示FinGPT基于ChatGLM的创新,强调技术持久迭代性。[page::6]
  • 图14(FinGPT架构):划分数据源、数据工程、模型层与应用层,突出多数据协同、微调技术及多云平台支持,强化功能模块的整体设计。[page::7]
  • 图16(情感打分体系结构):简洁展示数据清洗、信息收集结合大语言模型,构建情绪表达、分歧与变化三维度指标,体现体系全面性。[page::8]
  • 图19(主帖与评论因子IC比较):数据显示评论因子IC显著优于主帖因子,验证评论数据价值。[page::8]
  • 图22、23(FunGPT和LKM情感分布):FinGPT情感分布中中性最高(53%),乐观35%,悲观12%,而LKM乐观占比高达64%,悲观36%,差异体现两者定义与侧重点不同,但都确认了情感维度多样性。[page::9]
  • 图25~28(乐观情感因子IC测试及分位组合表现):IC约3.68%,多空组合年化收益12.7%,净值曲线平稳上涨,所有指标显示情感因子具有有效预测选股能力。[page::10]
  • 图29(情绪因子与传统大类因子相关性):相关性低(最高仅0.06),充分说明情绪因子捕获不同信号,回避信息冗余,适合多因子组合。[page::10]
  • 图30(情感因子与市值因子相关性):相关系数0.55说明大市值股票更多被讨论,但两者因子显著方向相反(市值因子升序因子,情感因子降序),进一步验证了情感因子的独立性。[page::11]
  • 图31(基本面与技术因子IC值统计):有助于将情感因子标杆为“优于80%基本面因子”评估背景。[page::11]
  • 图33(强化策略指标):年化收益6.69%,夏普0.32,回撤不到7%,信息比率1.58显示策略风险调整后亦有一定优越性。[page::11]
  • 图34~35(策略年度收益和净值曲线):进一步表明策略在多个年度内相对沪深300稳定超额,净值轨迹平滑增长。[page::12]
  • 图36(FinGPT推理代码示例):显示实际应用中的代码结构与提示词设计,便于理解技术实施细节。[page::13]
  • 图37(大语言模型训练时间和硬件):展现预训练与微调算力成本差异,微调门槛相对降低,技术可行性提升。[page::14]
  • 图38~39(输入结构对模型输出影响示例):说明LLM输出对输入格式极度敏感,提示词工程对情感识别准确率极为重要,影响模型可靠性。[page::14]
  • 图40~43(不同提示词下的情感判别变化):佐证多语言及提示词设计对FinGPT输出稳定性的挑战,表明实验结果需谨慎解读。[page::14,15]


---

四、估值分析



本报告主要侧重于情绪因子在选股策略上的有效性验证,没有传统意义上的公司估值分析部分,未涉及DCF或P/E估值模型计算。焦点在于量化投资领域中情绪因子构建与策略表现的量化研究,对估值贡献是透过策略超额收益表现间接体现。

---

五、风险因素评估



报告详细指出包括但不限于以下风险:
  1. 历史规律效用风险:基于过去数据的模型可能未来失效,市场行为具有不可预测性。[page::15]
  2. 模型预测波动风险:大语言模型采用基于上下文的概率预测,不保证所有回答准确,有回答波动性风险,可能误导投资决策。[page::15]
  3. 微调及超参数风险:不同调优方式及参数选择对模型效果影响甚大,存在过拟合风险和样本外失效风险,可能导致策略效果下降。[page::15]
  4. 市场环境变化:突发市场变化或极端事件可能使模型无法适应,带来较大波动和回撤。[page::15]


此外,报告强调数据中的噪声、多样化评论质量、提示词敏感性及模型推理误差均可能是风险点。报告整体对模型部署和策略使用设有谨慎建议。

---

六、批判性视角与细微差别


  • 模型依赖性和敏感性:报告本身承认FinGPT的结果受提示词、微调数据和模型本身能力限制,提示词设计敏感性强,模型输出有随机性(图38-43),这意味着情感因子构建仍存在不确定性。
  • 情绪因子低IC值:因子IC约3.68%,虽优于许多基本面因子,但仍属偏低,表明情绪因子预测能力虽存在但有限,可能不适合作为单一决策标准。
  • 时间同步性问题:情感指标与当日股票涨跌相关较高,反映其更多是同步指标而非领先指标,提示策略短期反应较快,但可能无法提前捕获趋势。
  • 数据覆盖偏向大盘权重股:与市值因子相关性高暗示大市值股受关注更多,小市值股票的舆情信号可能较少,策略对不同市值段覆盖存在偏差。
  • 主帖与评论选择的潜在权衡:报告选择评论为重点理由充分,但主帖中由于包含大量中立信息,其被排除可能遗漏部分有用信号。
  • 策略单一因子配置风险:基于一个乐观情感因子构建策略可能提高专注性,但缺少多因子协同验证,策略的稳健性和风险分散能力仍需进一步检验。


总体上,报告内容严谨,观点基于大量数据实证,但不应忽视情绪因子本身的固有限制及大语言模型应用在金融领域面临的挑战。

---

七、结论性综合



本报告基于子长科技提供的沪深300金融论坛大规模评论数据,运用FinGPT开源大语言模型进行情感分析,成功构建了情绪表达、分歧与变化三重维度的情绪打分体系。研究发现:
  • 金融论坛评论情感是有效的另类选股因子,尤其乐观情感和因子表现显著,具有正向预测后续股票超额收益的能力。

- 情绪因子与传统基本面及技术因子相关性低,说明其在信号层面独立性强,可以作为多因子模型的有效补充。
  • 基于乐观情感因子的量化策略在沪深300样本期间实现了6.69%年化收益和8.02%超额收益,策略净值曲线平稳,最大回撤较小,风险调整后表现出色。

- FinGPT作为基于ChatGLM微调的中文金融领域LLM,在情感打分任务上优于基础模型,适合处理金融舆情文本,体现了大语言模型在投资研究中的潜力。

图表充分展示了模型架构、数据样例、模型性能指标及策略表现,形成完整闭环。报告指出情感数据作为市场实时情绪反映,更能捕获非主流、零散观点和突发市场情绪变化,具备显著应用价值。

风险提示明确提醒模型存在历史失效、模型波动及微调可变性等风险,体现分析师精细谨慎态度。

综上,报告提供了较全面的金融论坛数据情感分析框架和策略验证,强调另类数据结合大语言模型的创新路径与实践意义,是当前量化投资领域AI赋能的重要示范,值得投资者和研究人员关注和深耕。[page::0-17]

---

综述



本报告不仅系统阐释了基于FinGPT的金融论坛情绪分析全过程(数据收集、知识图谱实体识别、开源LLM微调、情绪因子设计、策略构建和回测),而且配合大量图表(LKM和LLM比较示意、模型架构图、情绪分布、因子IC及策略收益表现)形成严密论证,强调金融论坛评论作为高信噪比另类数据的生动价值与量化选股中的增量贡献,体现了新一代人工智能工具在金融风控和投资决策中的前沿应用,实践和理论意义俱备。

报告