Explainable-AI Powered stock price prediction using time series transformers: A Case Study on BIST100
创建于 更新于
摘要
本研究聚焦土耳其BIST100指数中五大银行股及相关指数的股价预测,采用多种基于Transformer的时间序列模型(包括DLinear、LTSNet、Vanilla Transformer和TST),结合丰富的技术指标特征,通过SHAP和LIME等XAI方法增强模型的可解释性,旨在提升金融识别能力和投资决策透明度。实证结果显示DLinear模型在多项指标上表现优异,且XAI技术揭示模型对动量指标如RSI、MACD及趋势/波动性指标的依赖差异,为提升新兴市场投资者金融素养提供实用框架[page::0][page::1][page::2][page::12][page::16]。
速读内容
基于Transformer的多模型股价预测框架 [page::3][page::5][page::7][page::8]

- 使用DLinear、LTSNet、Vanilla Transformer、TST四种模型预测BIST100五大银行及XBANK、XU100指数日价格。
- 综合使用开盘价、收盘价、成交量及25种技术指标(如EMA、RSI、布林线、Ichimoku指标)作为特征输入。
- 数据集跨度从2015年1月至2025年3月,采用80%训练集和20%测试集划分。
- 训练中对超参数(epoch、batch size、学习率、序列长度、dropout)进行广泛调优以获得最佳性能。
各模型最佳超参数配置及性能表现 [page::9][page::10][page::11][page::12]
| 模型 | Epochs | Learning Rate | Batch Size | Sequence Length | Dropout |
|---------|---------|---------------|------------|-----------------|---------|
| DLinear | 100 | 1e-3 | 32 | 10 | 0 |
| Vanilla | 50 | 1e-4 | 64 | 10 | 0.1 |
| TST | 50 | 1e-4 | 32 | 5 | 0.1 |
| LSTNet | 100 | 1e-5 | 64 | 5 | 0.2 |
- DLinear模型表现最佳,R²最高达到0.995,MAPE均低于4%,显示极佳拟合与泛化能力。
- LSTNet次之,能够兼顾短期波动与长期依赖,MAPE约3.8%-5.8%。
- Vanilla Transformer与TST表现相对较弱,但依然保持良好预测能力。
- 误差表现受个股波动性影响明显,波动最大的QNBTR误差指标相对较低。
量化因子与模型解释性分析 [page::12][page::14][page::15]


- 利用SHAP为全局解释工具,LIME为局部解释,揭示模型对技术指标的依赖差异。
- 动量类指标(RSI_14及其不同时间滞后值)作为全局重要因素存在,短期量价特征为模型核心。
- 局部解释中,模型重视趋势指标(EMA系列)、波动指标(ATR、布林带)、Ichimoku指标等反映长期趋势和波动。
- 各股票及指数显示解释结果具有一定差异,强调模型对不同时间窗口与市场状态的灵活适应。
XAI助力金融素养提升与投资决策支持 [page::2][page::16]
- 通过XAI使复杂机器学习模型输出具备解释性,促进投资者对预测理解决策的信心与理解。
- 模型框架为未具备充分金融知识的投资者提供可靠辅助,降低信息不对称及投资盲点风险。
- 特别适用于新兴市场和波动加剧的宏观经济环境,有助于提升市场参与度和资本市场健康发展。
深度阅读
金融研究报告详尽分析报告
1. 元数据与概览
- 报告标题: Explainable-AI Powered stock price prediction using time series transformers: A Case Study on BIST100
- 作者及机构: Şükrü Selim Çalık,Andaç Akyüz,Zeynep Hilal Kilimci,Kerem Çolak,分别来自土耳其Kocaeli大学及相关机构
- 报告发布时间: 未明,但内容覆盖至2025年3月的数据
- 研究主题: 结合基于Transformer的时间序列模型与可解释人工智能(XAI)技术,针对土耳其BIST100指数中最高交易量的五家银行股票以及XBANK与XU100指数进行股票价格预测,旨在提高预测的准确性与解释性,同时促进金融素养
核心论点与结论概述:
本研究利用四种Transformer架构(DLinear、LTSNet、Vanilla Transformer和Time Series Transformer)处理时间序列股价数据,通过融合多个技术指标丰富输入特征,并采用SHAP和LIME两种XAI方法提升模型的解释透明度。研究结果表明,DLinear模型在准确率和泛化能力上表现优异,其简单线性分解结构在反映趋势与季节性因素方面表现突出。XAI方法揭示了模型对不同技术指标的依赖机制,有助于提升投资者金融素养和决策能力,特别是在新兴市场环境下具有较强的示范价值和应用潜力。[page::0,1]
---
2. 逐节深度解读
2.1 引言(Introduction)
报告指出股票市场的价格波动由供需、经济数据、投资者心理及外部新闻流等多因素复杂交织影响,表现出非线性、高波动和不确定性。尽管有效市场假说支持股价不可预测,但合理建模和变量选取可实现较高精度预测。金融素养被界定为理解金融产品和风险评估的能力,是改善投资决策的关键。现代机器学习,尤其深度学习,在非线性复杂市场预测中超越传统统计和经济计量模型,成为金融技术升级的支撑。特别是在个人投资者层面,结合AI技术提升金融素养,帮助其规避风险,实现理智的资产管理。[page::1]
2.2 可解释人工智能(Explainable AI,XAI)和相关工作
XAI区别于传统AI在于提升决策过程的透明度和可理解性,通过揭示模型内在机制增强用户信心,避免“黑盒”决策带来的盲目信任。特定于金融领域,XAI让投资者更好理解价格预测的驱动因素,帮助制定风险识别和投资策略。利用SHAP(基于博弈论的特征贡献度)和LIME(局部线性近似模型)对Transformer预测进行解释,使复杂模型输出可被非专业用户理解,促进金融素养的普及。相关文献中强调金融科技(FinTech)与AI的作用,尤其在新兴市场中金融知识相对匮乏,协同推进技术应用与金融教育至关重要。[page::2,3,4]
2.3 研究方法框架(Proposed Framework)
本节详细阐述了框架包括:
- 理论基础: 强调财务知识缺乏的普遍性及其对投资行为的影响。金融科技作为连接AI与个人财务决策的桥梁,利用大数据和机器学习提升风险管理和客户体验。研究还引用了Stock Investment自助平台等前沿工作,综合业务智能与预测模型提升初学者金融素养。
- 模型架构:
- LSTNet: 结合卷积层、门控循环单元(GRU)和自回归组成,兼顾短期局部特征与长期周期性模式,适合非平稳时间序列。
- Vanilla Transformer: 基础的自注意力机制架构,通过多头自注意捕捉全序列复杂依赖,适合序列预测但计算复杂度高。
- Time Series Transformer (TST): 针对时序优化的Transformer,通过位置编码和遮蔽机制保留时序顺序和因果关系,执行多步预测。
- DLinear: 轻量级线性分解模型,通过滚动平均拆解时序为趋势和季节性部分,分别用线性层拟合,兼顾可解释性与效率,适合实时场景。
- XAI工具:
- SHAP: 利用Shapley值理论,确保对每个特征贡献有完备、局部准确解释,统一多种解释方法,适用于任意模型。
- LIME: 通过邻近扰动及线性代理模型解释单点预测,增强局部可解释性,适合高风险应用场景。
- 数据采集与特征工程:
- 数据涉及5家土耳其主要银行股票及两大指数,时间跨度2015年1月至2025年3月,来自TradingView。
- 计算广泛技术指标,如多周期EMA、RSI、ATR、Bollinger Bands及Ichimoku系统相关指标,丰富输入特征,获取趋势、动量与波动等关键信号。
- 规范化处理和训练/测试集划分(80/20),同时利用训练集打散数据避免时间序列引起的学习偏差。
- 方法论和流程:
- 输入包含OHLCV和技术指标,归一化后喂入模型。
- 采用不同的序列长度窗口试验,寻求平衡短期信息捕获与复杂性。
- 多模型并行训练,最终选取表现最优的DLinear模型进行深入解释性分析进行决策支持。[page::4,5,6,7]
2.4 超参数调优与模型细节
- 各模型的超参细粒度调优涉及训练轮数(Epochs)、学习率(Learning Rate)、批次大小(Batch Size)、序列长度及舍弃率(Dropout)。
- DLinear表现最佳的配置是:100轮训练、学习率1e-3、批次32、序列长度10、无Dropout。
- 其他模型如Vanilla、TST、LSTNet则根据其结构差异选用不同参数组合,具体见表2。
- Dropout在轻量模型中反而不利,可能破坏时间结构信息。
- 序列长度选择体现了各模型捕获时序依赖性的不同侧重点,表现最好集中在5至10步之间。[page::8,9,10]
---
3. 图表深度解读
3.1 表1:技术指标详解
列举了包含EMA(25、50、100、200、300)、RSI、ATR、Bollinger Bands及Ichimoku系统指标(TenkanSen、KijunSen、SenkouSpanA/B、ChikouSpan)等17种指标。这些指标分别捕捉了短期到长期趋势、动量、波动性与市场结构特征,为模型提供多维时序信息。基础数据列包括开盘价、最高/最低价、成交量等,有效支持技术行情分析。[page::7]
3.2 图1:研究框架流程图 
- 流程涵盖数据采集、特征工程、模型选择及训练,最终由DLinear进行预测并通过SHAP及LIME实现可解释性。
- 展示了数据来源(股票及指数)、模型框架及解释机制的端到端设计。
- 有助于理解流程中各流程节点及模型间的关系及功能分工。[page::8]
3.3 表2:各模型最佳调参结果
|模型|Epochs|Learning Rate|Batch Size|Sequence Length|Dropout|
|-|-|-|-|-|-|
|DLinear|100|1e-3|32|10|0|
|Vanilla|50|1e-4|64|10|0.1|
|TST|50|1e-4|32|5|0.1|
|LSTNet|100|1e-5|64|5|0.2|
清晰展示不同模型由于架构差异在超参选择上的差异及优化结果,反映了模型特点与训练稳定性之间的平衡。[page::10]
3.4 表3-6:各模型评价指标(DLinear, LSTNet, Vanilla, TST)
- 指标说明: MSE(均方误差)、MAE(平均绝对误差)、MAPE(平均绝对百分比误差)、RMSE(均方根误差)和R²(决定系数,反映拟合优度)。
- 整体趋势: DLinear在所有股票及指数上的R²均超过0.984,表现最优,MAPE普遍低于4%;LSTNet次之,MAPE低于6%;Vanilla和TST表现略逊,MAPE在3%-7%间波动。
- 股票差异: ISCTR无论绝对误差还是相对误差均表现最佳,波动较小,QNBTR波动最大,误差也相对较大。指数(XBANK,XU100)由于数值较大绝对误差较大,但相对误差(RMSE与MAPE)表现良好。
- 解读: DLinear通过趋势与季节性分离,准确捕捉数据规律,实现了高精度及良好稳定性,是最为推荐的模型架构。
3.5 图2:DLinear模型预测与实际价格对比图 
- 各股票和指数的预测曲线与真实曲线高度重合,尤其在平稳及趋势明显期,体现了模型的预测精度及对市场行为的适应能力。
- 图形直观反映预测模型的有效性。
3.6 图3:DLinear模型的GARAN股票训练/测试损失轨迹 
- 在前10个epoch内损失迅速下降,训练和测试损失曲线重合且平稳,表明模型的泛化能力良好,无明显过拟合。
- 体现了模型训练的高效性和稳定性,适合真实金融市场预测。
3.7 图4-10:DLinear模型的SHAP与LIME解释示例(分别针对AKBNK, GARAN, ISCTR, QNBTR, VAKBN, XBANK, XU100)
- SHAP解读(全局): 模型普遍依赖短期动量指标,如不同时间滞后期的RSI
- LIME解读(局部): 关注点更多移向长期趋势指标(EMA200、EMA100)、波动率指标(ATR)及Ichimoku系统组成元素,反映模型对具体行情背景的敏感性和灵活调整。
- 全球与局部解释的差异强调了模型适应不同市场情境灵活调整输入特征权重的能力,验证了XAI技术在金融时序数据可解释性方面的实际价值。
- 这些解释提高了模型的透明度,为投资者提供了可信赖的决策支持依据,有助于金融素养的增强。[page::12,13,14,15]
---
4. 估值分析
此研究非典型财务估值分析,更多关注模型性能及预测准确性。基于统计学习框架和机器学习评价指标,没有引入DCF、P/E等传统估值方法。重点在于:
- 通过历史数据拟合与误差度量,验证模型的预测能力和稳健性。
- LTSNet、TST和Vanilla虽为深度学习模型,但DLinear的简单线性分解方法由于其对趋势与季节性的有效捕捉,在预测准确率和泛化能力上更胜一筹。
- 准确度被视为衡量模型价值的核心指标,间接体现了模型可以辅助投资决策,影响资产估值和买卖时点把握。
整体来看,估值工作更多体现在模型质量和应用价值层面,而非传统公司价值的财务估算。[page::10,12]
---
5. 风险因素评估
报告提及的风险主要包含:
- 市场特定风险: 股票市场本身的高波动性、非线性及多因素驱动的复杂动态,增加预测难度。特别是在土耳其这样一个经济环境波动较大的新兴市场,包括通胀、利率、政策变动、地震及选举不确定性。
- 数据范围及特征限制: 仅用技术指标和历史价格构建特征,未涵盖宏观经济变量、新闻舆情等,可能削弱长期及系统性风险的预测能力。
- 模型局限: 解释性工具虽提升透明度,但仍受限于特征工程质量,且XAI解释并非万能,存在解释误差与用户解读风险。
- 环境与适用性: 仅应用于土耳其市场,可能难以推广至其他法律、经济体制不同的地域。
报告并未详细给出针对这些风险的缓解措施,但通过多模型对比、超参调优及XAI解释,尽可能减少模型过拟合、提高用户信心,为风险管理提供辅助。[page::16,17]
---
6. 批判性视角与细微差别
- 假设依赖与数据范围局限: 研究基于历史数据及技术指标,未引入宏观经济、交易者情绪、政策新闻等多样化影响因素,可能导致模型在极端经济事件或长周期预测中的适应性不足。
- 模型偏好简单结构: DLinear凭借传统线性分解取得最佳效果,显示复杂Transformer结构并非总优于轻量线性模型,提醒对模型复杂度和解释性之间的权衡。
- 时间序列学习的打乱顺序做法: 报告中提及训练集打乱以避免过拟合,这在时间序列领域较为少见,可能导致短期依赖特征丧失,值得后续研究验证其合理性。
- XAI的解释一致性问题: SHAP(全局)与LIME(局部)的解释结果在特征重要性排序上存在差异,表明模型在实际操作中的复杂动态,但这也可能给非专业用户带来理解上的混淆,限制了接受度。
- 泛化能力受限于样本覆盖: 数据集中100%基于日级别交易数据,缺少高频、异构数据支持,对高频交易及实时风险控制场景可能不适用。
- 结论对金融素养的提升推断较为宏大,实际应用中用户理解和采纳程度依然是未知数,缺少实证用户层面验证。[page::17]
---
7. 结论性综合
本研究通过系统性地构建和验证基于Transformer的多模型时间序列预测框架,结合丰富的技术指标和先进的XAI技术,成功实现了对土耳其BIST100高交易量银行股票及两个重要指数的高精度预测。主要发现包括:
- 模型性能突出:
- DLinear模型利用时间序列分解思想,展现了卓越的拟合精度(R²最高达0.995),其对趋势和季节性成分的捕捉优于深度神经网络及标准Transformer。
- 误差指标均远优于其他结构,体现了低计算成本与强稳健性的理想平衡。
- XAI赋能透明决策:
- 利用SHAP与LIME对模型复杂预测结果进行全局和局部解释,揭示动量指标及长期趋势指标在不同市场环境中的交替作用。
- 解释性的提升不仅有助于学术研究中的模型理解,更为实际投资者尤其是缺乏专业金融知识的群体提供了可信赖的信息支持,促进了金融素养增长。
- 特征工程成效显著:
- 十余种经典且先进技术指标的结合极大丰富了输入信息,增强模型对短期波动及长期走势的感知能力。
- 这一点在复杂多变的新兴市场条件下尤为重要,提升了模型对多样化财务现象的捕捉。
- 研究框架的政策和实践价值:
- 提出了一种可重复、透明且具有较高适用性的金融预测与金融教育结合框架,为新兴市场的金融技术发展提供理论和方法参考。
- 鼓励更广泛的金融参与,提升投资者风险管理水平及市场稳定性。
- 图表深度分析支持:
- 表2明确了各模型的最优超参配置以稳定训练过程,确保结果的可复现性。
- 表3至表6以及图2-3可视化和误差评估相辅相成,验证了DLinear模型在不同资产、不同波动级别下均保持高精度预测的能力。
- 图4至图10的XAI解释图形深入展示了不同技术指标在不同时点对预测的贡献差异,体现了模型策略的灵活性和细粒度特征理解。
综上,报告明确表态推荐采用DLinear模型配合XAI工具,作为新兴市场中提升股票价格预测准确度及其解释性的重要途径,推动金融素养提升和理性投资决策,使金融科技成果更加惠及投资者群体。研究亦对未来整合宏观经济变量、情绪分析、大数据交叉验证及高频数据应用提出了可持续发展方向建议。[page::0-17]
---
总结
该报告以高度系统和严谨的方式展开,结合多种Transformer架构,利用丰富的技术指标,针对土耳其具有代表性的银行股及指数进行时间序列预测研究。其创新点在于提出并验证了DLinear模型在多方面的优越性,并首次系统整合可解释AI工具提高模型透明度,注重金融素养支持,契合新兴市场特色。通过全面表格、图形和解释分析,报告不仅呈现了模型预测能力,更提升了投资决策的可信度和科学性,具有实践与理论双重价值。尽管存在地区和特征局限,研究为未来金融市场预测与投资者教育路径提供了坚实基础和清晰指引。