Predicting NVIDIA's Next-Day Stock Price:A Comparative Analysis of LSTM, MLP, ARIMA, and ARIMA-GARC
由qxiao创建,最终由qxiao 被浏览 27 用户
作者:
- Yiluan Xing (Indiana University Bloomington)、Chao Yan (Northeastern University)、Cathy Chang Xie (Baylor University)
摘要:
- 研究目标:评估四种不同模型(ARIMA、MLP、LSTM、ARIMA-GARCH)在预测NVIDIA下一天股价的有效性。
- 数据来源:使用Yahoo Finance的API,数据时间范围为2019年4月12日至2024年4月11日。
- 主要发现:ARIMA-GARCH模型在预测NVIDIA股价方面表现最佳,尤其是在均方根误差(RMSE)方面。
关键词
- 股票预测, NVIDIA, ARIMA, MLP, LSTM, ARIMA-GARCH
I. 引言
- 背景:预测股票价格在金融市场中具有重要意义,影响投资者、交易员和金融机构的决策。AI技术的进步使得深度学习在股票预测中得到广泛应用。
- 方法:本研究使用统计方法(ARIMA)和深度学习方法(MLP、LSTM)以及它们的组合(ARIMA-GARCH)来预测NVIDIA的股价。
- 文献回顾:讨论了LSTM、ANN、SVM等模型在股票价格预测中的应用和效果。提到LSTM在处理复杂时间依赖关系方面的优势,以及ARIMA在捕捉线性趋势方面的能力。
II. 方法
A. ARIMA模型
- 描述:ARIMA模型通过自回归和移动平均方法处理时间序列数据,适用于处理非平稳数据。模型包括AR(自回归)部分、MA(移动平均)部分和I(差分)部分。
- 公式:
-
自回归(AR)部分:
-
移动平均(MA)部分:
-
ARIMA模型:
-
B. 多层感知器(MLP)
- 描述:MLP是一种前馈神经网络,具有输入层、隐藏层和输出层,通过权重和偏差连接各层。有效建模复杂的非线性关系。
- 结构:
- 输入层接收时间序列数据。
- 隐藏层使用非线性激活函数(如ReLU)。
- 输出层生成预测值。
C. 长短期记忆网络(LSTM)
- 描述:LSTM是一种改进的循环神经网络(RNN),设计用于处理长序列数据中的梯度消失和爆炸问题。通过遗忘门、输入门和输出门调节信息流动,擅长处理时间依赖和长时依赖关系。
- 公式:
-
遗忘门:
-
输入门:
-
候选记忆细胞:
-
记忆细胞更新:
-
输出门:
-
隐藏状态:
-
D. ARIMA-GARCH模型
- 描述:GARCH模型通过包含滞后条件方差来建模和预测时间序列中的波动性。ARIMA-GARCH模型结合了ARIMA的均值动态和GARCH的波动性动态,适用于捕捉金融市场的波动性聚集特性。
- 公式:
- GARCH模型:
- ARIMA-GARCH模型:
III. 实验与分析
1. 数据
- 数据集
- 数据划分
2. 模型评估指标
- RMSE(均方根误差):
- MAE(平均绝对误差):
- R平方(R2,决定系数):
3. 模型实现
- ARIMA:
- 扩展窗口法:使用训练集中的所有历史数据构建ARIMA模型,并通过Akaike信息准则(AIC)确定最优参数。
- 滚动窗口法:评估30天和60天的窗口大小,并使用最近的观察值进行模型优化和训练。
- LSTM:
- 数据归一化:使用MinMaxScaler将数据缩放到0到1之间。
- 超参数调整:单层隐藏层297个神经元,ELU激活函数,回溯窗口8天,学习率约为0.0044589,训练500轮次,批量大小64。
- MLP:
- 数据归一化:使用MinMaxScaler。
- 超参数调整:三层隐藏层每层83个神经元,ReLU激活函数,回溯窗口3天,Adam优化器,训练82轮次,批量大小9。
- ARIMA-GARCH:
- 采用GARCH(1,1)模型,结合ARIMA模型的残差进行波动性建模。
4. 结果
- ARIMA模型(扩展窗口法)在MAE、RMSE和R2值方面表现略优于其他模型。
- ARIMA-GARCH模型在RMSE方面表现最佳,但在MAE方面略高,原因是其在测试集末端的预测值有过高倾向。
\