`

Stock Index Forecasting Using an Explainable TAFT Model with Online Data-Driven Social Sentiment Index

创建于 更新于

摘要

本文提出了一种结合基于FinBERT的社交情绪指数(SSI)与目标辅助融合变压器(TAFT)模型的金融指数预测方法。通过引入SSI作为辅助特征,模型有效捕捉社会情绪对市场的影响,实现了S&P 500指数均方误差降低33.3%。TAFT模型集成动态注意力机制,实现了模型的可解释性,显著提升了预测精度与分类任务性能,验证了情绪分析与深度时序模型融合在金融预测中的巨大潜力[page::0][page::1][page::5][page::6]

速读内容

  • 研究提出利用FinBERT对Investing.com近十二年逾23万篇财经文章进行情绪评分,构建日度社会情绪指数(SSI),并通过归一化处理体现市场整体情绪倾向[page::2].

- TAFT模型架构由TA-fusion块、Transformer及输出层构成,采用变量选择方法(VSM)动态加权目标指标及辅助指标,提升预测的相关性与灵活性[page::3].
  • SSI经格兰杰因果检验显示可在10%显著水平先于传统的消费情绪指数CSI,验证其对市场风向的提前反映能力[page::4].

  • 采用多个市场指数(S&P 500、NASDAQ、KOSPI200)及多元宏观经济指标辅助输入,实现20时间步长窗口的滚动预测[page::4].

  • 融入SSI后,多数基准模型MAE指标显著下降,其中LSTM与TFT分别下降8.79%与8.63%,Autoformer提升有限,凸显深入模型结构融合的重要性[page::4].


| 模型 | S&P500无SSI MAE | S&P500有SSI MAE | NASDAQ无SSI MAE | NASDAQ有SSI MAE |
|------------|----------------|----------------|----------------|----------------|
| MLP | 212.8867 | 208.3074 | 926.4379 | 881.8577 |
| LSTM | 215.9830 | 197.0320 | 1007.63 | 995.212 |
| Autoformer | 89.4822 | 89.2930 | 344.766 | 344.387 |
| TFT | 83.9925 | 76.7422 | 302.919 | 288.805 |
  • TAFT模型集成SSI,比最佳基准TFT模型在S&P 500上MAE降低33.3%,同时在预测精度和分类任务中均显著领先,表现稳健且具解释性[page::5].



| 模型 | S&P500 MAE | NASDAQ MAE | KOSPI200 MAE |
|-----------------|------------|------------|--------------|
| MLP | 208.3074 | 881.8577 | 11.3536 |
| LSTM | 197.0320 | 995.212 | 9.6874 |
| Autoformer | 89.2930 | 344.387 | 7.8959 |
| TFT | 76.7422 | 288.805 | 6.1687 |
| TAFT (本研究) | 51.1818 | 206.9434 | 4.3150 |
  • TAFT模型的动态注意力机制揭示了不同时期各辅助特征的重要性变化,如黄金期货在十年间占主导,疫情期间原油期货重要性暴涨,体现模型对市场事件的适应能力[page::5][page::6].

- 在30天后涨跌分类任务中,TAFT模型取得准确率0.71,F1分数0.63,显著优于其他模型,显示其潜在的风险管理与决策支持优势[page::6].

| 模型 | 准确率 | 精确率 | 召回率 | F1分数 |
|-----------------|---------|---------|---------|---------|
| MLP | 0.5139 | 0.4896 | 0.4895 | 0.4894 |
| LSTM | 0.4183 | 0.4750 | 0.4815 | 0.4039 |
| Autoformer | 0.5725 | 0.5538 | 0.5544 | 0.5540 |
| TAFT (本研究) | 0.7092 | 0.7441 | 0.6357 | 0.6302 |
  • 本文指出未来研究方向应关注多样数据源扩展、行业/领域特定情绪指标构建,以进一步提升金融市场情绪驱动模型的预测性能和实用性[page::6].

深度阅读

金融研究报告详尽分析报告



---

一、元数据与报告概览



报告标题:Stock Index Forecasting Using an Explainable TAFT Model with Online Data-Driven Social Sentiment Index
作者:Junkyu Jang, Taehwan Kim, Sung-Hyuk Park
机构:韩国KAIST College of Business
发布日期:2024年(具体会议为2024年11月14-17日的第五届ACM国际AI金融会议ICAIF ’24)
主题:股票指数预测、金融市场情绪分析、深度学习模型解释性

核心论点
本报告提出一种融合在线社交情绪指数(Social Sentiment Index,SSI)与深度学习Transformer模型的新方法,用于改进股票指数预测的准确性和可解释性。作者设计并实现了一个基于FinBERT的情绪指数构建方法及一个新型的Target-Auxiliary Fusion Transformer(TAFT)模型,通过动态注意力机制对输入特征进行加权,实现情绪指数与其它宏观经济指标的有效融合,显著提升了预测性能,并提供了模型预测行为的解释性。
主要结论
  • 在标准基准模型(包含MLP、LSTM、Autoformer、TFT)上加入SSI后,均显著降低了预测误差(均方误差MAE下降达4.9%均值);

- TAFT模型结合SSI后,在S&P 500指数的MAE上优于所有基准,提升达33.3%;
  • TAFT在分类任务中也优于其他模型,在准确率、精确率、召回率和F1值上均表现最佳;

- 该研究揭示社交情绪为金融指数预测带来了有价值的辅助信息,促进了投资决策科学化。

---

二、逐节深度解读



1. 引言(Introduction)



报告指出金融指数时间序列的非线性、噪声和无序特征使预测极具挑战性。传统时间序列方法难以捕捉此类复杂性,因而深度学习及神经网络成为主流解决方案。同时作者强调自然语言处理(NLP)在从文本数据中抽取市场情绪信息方面的潜力,并指出尽管社交情绪分析存在延迟性质疑,却可丰富数值数据不能覆盖的市场维度。基于此论断,研究目标是结合FinBERT基础上的情绪分析与深度时间序列模型,提出能充分利用情绪信息的TAFT模型。通过此架构,可提高金融指数预测准确性和模型的可解释性。[page::0-1]

2. 理论与文献回顾(Theory and Literature Review)


  • 行为金融学:指出传统金融模型(CAPM等)基于理性假设,但行为金融揭示认知偏差、羊群效应等导致投资者非理性行为,解释市场异常。研究通过引入这种人类行为侧面,为情绪指数构建提供理论依据。

- 情绪指数:历来已有学者构建多元金融指标构成的情绪指数,证明其较好的市场预测能力。现代社交媒体及网络信息爆炸进一步推高社交情绪的预测价值。
  • 机器学习与情绪分析结合:虽然已有深度模型用于股价预测,但其有效集成情绪指数仍具挑战,不同模型在对情绪数据的利用效率存在差异。TAFT模型通过动态权重机制提升这一过程能力。

- 可解释AI:强调金融领域模型解释性的重要性,指出模型不可解释性阻碍其实践应用。当前模型-agnostic方法(如SHAP、LIME)虽然通用,但缺乏动态调整能力;模型特定方法虽解释性好,但可能损失部分性能。TAFT利用动态注意力机制平衡解释性与性能。[page::1-3]

3. 社会情绪指数构建(Social Sentiment Index)


  • 数据基础:收集了Investing.com网站2012年11月至2023年10月间237,850篇相关文章,分为市场概览(42,881篇)与股票市场(194,969篇)两部分。

- 情绪评分:使用FinBERT对每篇文章进行情感评分,区间[0,1],阈值0.5划分正负面;日层面根据正负篇数计算归一化情绪指数,基准值设100,高于100代表正面情绪,低于100为负面。
  • 设计目标:该指数以日频率设定,加强对情绪波动的捕捉,避免传统情绪指标的低频数据缺陷,为预测模型提供关键补充信号。[page::3]


4. 模型架构(Model Architecture)


  • 整体结构:模型由三部分组成——TA融合块(融合目标指标和辅助特征于时间点 embedding)、Transformer时间序列建模,以及输出层(用于未来几日的指数回归预测和30日后的涨跌分类)。

- TA融合块:针对每一时刻,目标指标及N个辅助特征分别通过线性层映射到同一维度空间。针对辅助特征,利用基于自注意力机制的变量选择方法(VSM)计算各特征重要性权重$\alpha_i(t)$,形成加权辅助特征向量。随后再将目标与辅助特征拼接,再执行一次VSM生成最终embedding。此设计避免了目标指标重要性被辅助特征掩盖,且动态选择输入有助适应市场时变特征。
  • Transformer层:对整个时序embedding序列加入位置编码与[CLS]标记,捕捉长时依赖关系;[CLS]标记最终用于回归和分类任务。

- 输出层:线性或sigmoid层对应不同任务,跨多个未来时点进行多步预测。
  • 此架构创新点为动态多变量权重选择结合Transformer高效序列建模,提升预测性能和解释性。[page::3-4]


5. 经验性结果(Empirical Results)



5.1 社会情绪指数分析


  • 利用Granger因果检验验证SSI对传统月度消费者情绪指数CSI的领先性。检验结果显示所有p值低于0.1的统计显著水平,SSI能够领先CSI约1个月,被认为是有效的情绪前瞻指标。图2展示了CSI与SSI的时间序列变化走势,统计检验支撑其预测价值。

5.2 实验概况


  • 数据涵盖S&P 500、NASDAQ、KOSPI 200等重要指数,选取OHLCV指标,其中收盘价作为预测目标。辅助特征包括美元兑韩元汇率、黄金期货、WTI原油期货、利率、货币供应指标(M1/M2)、消费者物价指数(CPI)、生产者物价指数(PPI)与失业率。

- 数据处理及模型训练使用8:2划分,采用20天输入窗口预测未来1至5天指数及30天后涨跌评估,训练策略采用网格搜索调参。评估指标包括RMSE、MAE、SMAPE及分类准确率、精确率、召回率和F1。

5.3 SSI影响


  • SSI作为特征嵌入到四种基准模型(MLP,LSTM,Autoformer,TFT)中均实现了MAE的下降,LSTM和TFT表现尤为明显,分别约降8.79%及8.63%。Autoformer下降幅度极小(0.21%),提示模型结构对情绪指数利用效率的影响。此节强调仅有良好的情绪指数难以完全提升预测,需结合合适的模型设计。

5.4 TAFT模型评估与可解释性


  • TAFT相较于其他基准,MAE在S&P 500上降至51.2,比最佳基准模型TFT的76.7降低33.3%。图4(a-c)展示TAFT预测曲线高度贴合真实数据,误差小且能追踪波动。附加的动态注意力机制使模型在不同时间内对辅助特征(包括SSI)赋予不同权重,表现了其动态适应性。

- 重要性随时间变化明显,如黄金期货重要性贯穿长时段,油价因2020年疫情引发的油价负值事件而权重剧增,映射模型对极端事件的即时反应。此动态特征权重实现了模型行为的解释性和灵活性。

5.5 鲁棒性检验


  • 选取具有不同市场特征的KOSPI 200进行重复实验,基于韩国本土投资社区Naver数据同步构建社会情绪指数(K-SSI)。结果表明SSI在情绪敏感市场中的作用更为显著,TFT模型MAE降低15.9%,比北美市场效果更佳。TAFT同样表现为最低MAE。

- 分类任务方面,TAFT在多项指标(准确率0.71,精确率0.74,召回率0.64,F1 0.63)均优于其他模型,体现全方位优越性能。
[page::4-6]

6. 结论(Conclusion)


  • 本研究通过设计基于FinBERT的社交情绪指数及创新的TAFT模型,实现了股票指数预测上的显著性能提升,验证了社交情绪对金融预测的重要辅助作用。

- TAFT模型的动态权重机制和解释性设计有效提升了模型在变化环境中的适应性和决策透明度。
  • 局限性包括数据来源单一(Investing.com),未来可扩充至更多社交媒体及新闻源;目前SSI为整体市场情绪指数,未来可发展行业/板块细分情绪指标;并需注意历史数据过拟合风险,建议强化交叉验证并测试多市场多条件。

- 未来研究方向为更细粒度情绪指数及定制化模型设计,助力更精准的金融市场监测和预测。
[page::6-7]

---

三、图表深度解读



图1:模型架构示意图(page::3)

  • 描述:图示了数据预处理到输入模型的流程,左上部分为宏观经济指标和股票数据处理,右为网络爬取文本转为SSI,均归一化后作为辅助特征,以及目标金融指数“Close”价格。核心为TA-fusion区块,处理目标与辅助特征embedding及变量选择,然后输入Transformer,最终输出多步预测及30天后涨跌分类任务。

- 解读:流程清晰展现多源数据融合及时序建模过程,体现模型设计的模块化和可扩展性,为动态权重委派提供背景。加入[CLS]标记设计借鉴视觉Transformer,便于汇聚时序信息。
  • 联系文本:支持第四章模型架构的文字,说明为何模型设计能实现对辅助特征的动态挑选与融合。


图2:客户情绪指数(CCSI)与社会情绪指数(SSI)时间序列对比(page::4)

  • 描述:展示从2021年初到2023年间每日两指数规范化走势,CCSI波动较SSI略显平滑。

- 解读:SSI走势与CCSI高度相关且领先,视觉体现了SSI作为高频情绪信号的潜在预测价值。
  • 联系文本:支撑第5.1节Granger因果测试结论,强调SSI领先传统CSI指标作为消费者情绪的先导。


图3:数据预处理和模型评估工作流(page::4)

  • 描述:展示数据收集(Investing.com两类文章)、预处理(去停用词及清洗)、SSI构建(FinBERT、标注、标准化)、以及结合OHLCV和宏观指标输入多模型训练测试流程。

- 解读:突出了多步骤数据处理管线,强化了数据质量与模型融合的严谨性。
  • 联系文本:呼应5.2节实验设计,体现科学严密的实验步骤。


图4:(a-c)S&P 500、NASDAQ、KOSPI200预测结果对比,(d-f)动态辅助特征权重,(g)长时间辅助特征权重趋势(page::6)

  • 描述

- (a-c)实线为真实指数,虚线为TAFT预测结果,曲线高度吻合,预测波动被良好捕捉。
- (d-f)不同经济指标权重随时间动态变化,SSI权重在局部时间段显著,体现其时变影响力。
- (g)展示2013年至2023年S&P 500期间包括SSI、原油、黄金、汇率、M1等指标权重变迁,2020年疫情爆发时油价权重骤升,黄金权重长期领先。
  • 解读:说明模型能灵活调整权重响应市场事件,动态权重体现模型对市场环境的适时反应和解释能力;长期趋势揭示投资者对通胀和极端事件的偏好变化。

- 联系文本:与5.4节内容紧密对应,验证了TAFT在真实市场波动中的适应性和解释能力。

---

四、估值分析



本报告无直接企业估值分析内容,重点集中于模型预测准确性和解释性提升,故无估值模型讨论。

---

五、风险因素评估


  • 数据来源有限:目前仅取自Investing.com,可能遗漏其他社会媒体及新闻平台多元化信息,导致信息采样偏误。

- 情绪指数通用性有限:SSI为整体市场情绪指标,缺乏细分行业或板块情绪表现,可能影响行业特异性预测。
  • 市场环境变化剧烈:模型尽管灵活,但极端市场(如疫情期间)对模型泛化能力提出挑战,存在过拟合风险。

- 模型复杂度与解释性权衡:虽采取动态注意力机制提升解释性,但相较传统模型依然复杂,实际应用需权衡性能和解释需求。
报告对以上问题均有承认并提出未来扩展方向。[page::6]

---

六、批判性视角与细微差别


  • 报告对FinBERT作为情绪分析工具的依赖较重,若情绪模型偏差将影响SSI构建准确性;未深入讨论情绪标签误差对最终预测的影响。

- Autoformer模型在加入SSI后性能提升有限,暗示简单将情绪指标作为额外变量难以充分发挥作用,凸显集成方法设计的重要性,TAFT虽解决该问题,但其算法复杂度较高,实际部署成本与时间未详述。
  • 解释性虽为亮点,但动态注意力权重的金融经济意义需更深层次的验证,如是否能对应具体市场事件和因果关系。作者侧重模型表现,较少探讨因果经济机制的模型解释边界。

- 部分性能指标如p值所用10%显著性水平较宽松,在实证金融领域通常采用5%更为严谨,提示Granger检验结果应谨慎解读。
  • K-SSI情绪指数显示极强的情绪影响,这或与韩国市场特性密切相关,但此结果的普适性和跨市场迁移能力未探明,建议进一步跨更多市场验证。[page::4-7]


---

七、结论性综合



本报告系统提出了一个融合基于FinBERT情绪分析的社会情绪指数(SSI)与创新Transformer结构(TAFT)的金融时间序列预测模型,既强调对新型辅助特征的有效融合,又兼顾模型的解释能力。在S&P 500、NASDAQ及情绪敏感的KOSPI 200三大典型指数上,模型均显著优于传统深度学习与Transformer基准模型:
  • SSI的价值:证明每日构建的高频SSI不仅能前瞻传统月度消费者情绪,还能大幅提升多模型的预测准确度(如LSTM、TFT)。

- TAFT创新架构:通过TA-fusion步骤对目标与辅助变量分别进行加权并动态融合,配合Transformer捕捉长时依赖,自注意力机制实现不同时间点与特征的动态赋权,兼具性能与解释力。
  • 动态解释能力:通过图4展示了模型对金融宏观变量权重的随时变换,特别对突发事件(疫情引发油价波动等)的响应,体现出模型不仅是“黑箱”,更能提供可解读的投资洞察。

- 鲁棒性和通用性:通过引入市场特性差异显著的韩股KOSPI200验证方法稳健性,且在涨跌分类任务中表现同样优异,展示了方法的广泛适用前景。

最后,报告虽认可当前研究的局限,需进一步扩大情绪数据来源、细分情绪指数维度并规避过拟合风险,但整体工作为金融市场情绪驱动预测研究提供了新的理论和技术范式,预示着基于可解释深度学习的投资决策辅助系统的重要发展方向。

---

参考文献溯源


本分析中引用内容均有明确页码标注,例如本文体系及方法介绍见[page::0-4],实验数据及结果解析见[page::4-7]。

---

(注:本文各图表均已按相对路径附图,便于对照复核。)



报告