`

Electricity Spot Prices Forecasting Using Stochastic Volatility Models

创建于 更新于

摘要

本研究基于随机波动率模型(SV)对俄罗斯电力现货市场日度电价进行预测,重点开发了包含外生回归变量(气温、工作日和自回归成分)的SV X模型。通过贝叶斯推断和Stan平台建模,SV X模型在多时段、多价格区间下表现出优异拟合和稳健的预测能力,在交叉验证和未来一周预测中均显著优于基础SV模型,适用于电力交易风险对冲与衍生品定价 [page::1][page::13][page::27][page::38][page::44]。

速读内容

  • 研究背景与问题描述 [page::7]

- 电力作为不可储存的商品,价格波动大,易出现价格尖峰,需提前预测以规避风险。
- 电力现货市场分为欧洲价区(价格区1)和西伯利亚价区(价格区2),分别具备不同消费和价格特征。
- 预测重点为峰时段(小时14)与谷时段(小时3)电价,时间频率为逐小时数据。
  • 基础随机波动率模型SV Baseline构建与验证 [page::13-21]

- SV模型假设价格对数波动率为潜在随机过程,价格服从均值为历史均价,方差基于时变波动率的正态分布。
- ADF检验确认电价序列非平稳,适合用SV模型建模。
- 贝叶斯推断估计模型参数,后验分布接近正态,模型预测分布与实际电价分布匹配较好。


- 模型拟合误差:MAE=99.18,RMSE=137.04,预测均值与实际价格相关性较弱(r=0.08)。
| Metric | SV Baseline |
|--------|-------------|
| MAE | 99.18 |
| RMSE | 137.04 |
- 波动率与价格呈“V”型关系,价格偏离均值越远,波动率越高。
  • 外生回归变量引入及SV X模型构建 [page::22-33]

- 外生变量选取及理由:
- 空气温度与电价呈非线性(立方多项式)关系,热与冷季需求高;暖温区相关系数0.39,冷温区近零。

- 工作日影响电价,周日平均价格低,周五波动率较小。

- 自回归成分(AR(1))权重显著,价格与前一日相关性高(PACF(1)=0.63)。

- SV X模型定义:
$$
y{t} \sim \mathcal{N}\left(\bar{y} + \alpha y{t-1} + \sum{i=1}^3 \betai X{t-1}^i + \gamma D{t} + \xi, e^{h_t/2}\right)
$$
- 参数后验分布均状似正态,模型预测分布与实际电价高度吻合。


- 模型拟合误差优于基础模型:
| Metric | SV Baseline | SV X |
|--------|-------------|-----------------|
| MAE | 99.18 | 85.23 (-14.06%) |
| RMSE | 137.04 | 117.91 (-13.96%)|
  • 交叉验证及模型性能对比 [page::34-39]

- 采用时间序列交叉验证,滚动窗口策略,训练集为360日,测试集为90日,共36个折叠。
- 在峰谷时段和两个价区分别测试SV Baseline和SV X模型。
| Model family | Hour | Price zone | MAE | RMSE |
|--------------|-----------|------------|----------|----------|
| SV Baseline | Peak | 1 | 105.39 | 130.53 |
| SV Baseline | Peak | 2 | 119.14 | 146.45 |
| SV Baseline | Off-peak | 1 | 104.42 | 137.50 |
| SV Baseline | Off-peak | 2 | 105.39 | 168.31 |
| SV X | Peak | 1 | 99.45 | 123.59 |
| SV X | Peak | 2 | 115.56 | 142.10 |
| SV X | Off-peak | 1 | 93.92 | 129.59 |
| SV X | Off-peak | 2 | 118.18 | 150.73 |
- Mann-Whitney U检验显示SV X显著优于SV Baseline(MAE p=0.0225,RMSE p=0.0439)。

  • 未来7天价格预测及评估 [page::40-43]

- 基于2023-05-01至2024-04-30的训练集,逐日滚动预测2024年5月1日至7日。
- SV X模型在大多数时间段及价区(除Off-peak hour+Price zone 1)表现优于SV Baseline。
- 预测误差及改善:
| Metric | Hour | Price zone | SV Baseline | SV X |
|--------|------------|------------|-------------|-----------------|
| MAE | Peak | 1 | 148.06 | 114.95 |
| MAE | Peak | 2 | 309.28 | 99.56 |
| MAE | Off-peak | 1 | 82.84 | 91.94 |
| MAE | Off-peak | 2 | 265.35 | 73.97 |
| RMSE | Peak | 1 | 191.49 | 130.60 |
| RMSE | Peak | 2 | 338.86 | 110.59 |
| RMSE | Off-peak | 1 | 91.02 | 117.76 |
| RMSE | Off-peak | 2 | 281.16 | 105.44 |
- SV X模型预测区间更窄,能更精准捕捉价格变化趋势。

  • 结论及未来方向 [page::44]

- SV X含气温、星期几及自回归成分的模型整体优于基础模型预测日电价,适合风险对冲。
- 建议针对24小时、不同价区建立更多专属模型以提升预测精度。
- 计划纳入其他气候变量(湿度、降水、风速等)及提升计算效率的专用机器学习库。

深度阅读

电力现货价格预测中随机波动率模型的详细分析报告解构



---

1. 元数据与报告概览



报告标题:Electricity Spot Prices Forecasting Using Stochastic Volatility Models
作者:Batyrov Andrei Renatovich
指导教师:Kasianova Ksenia Alekseevna
发布机构:National Research University Higher School of Economics, Faculty of Computer Science, Master of Data Science项目
发布时间:2024年
研究主题:基于随机波动率模型的日内电力现货价格预测,模型基于贝叶斯推断,结合外生回归变量,重点研究不同电力市场价格时序序列的建模与预测。

报告核心论点



本论文聚焦于利用随机波动率(Stochastic Volatility,SV)模型对电力现货市场的日内价格进行概率预测,解决其非平稳和波动率异方差的特性。首先构建基线SV模型,然后基于该模型引入外生回归变量(如空气温度、星期几指标及自回归成分)来提升性能。研究通过贝叶斯推断方法估计模型参数,并用十年数据进行交叉验证和一周的前瞻性预测。结果表明,结合外生变量的SV X模型能显著提高预测准确度,并适用于电力交易中风险套期保值衍生品定价[page::0,1,7,44]。

---

2. 逐节深度解读



2.1 引言及预测方法概览(第7-8页)


  • 介绍了电力市场特殊性:电力是非储存型商品,价格波动大且存在显著的季节性(峰谷时段及工作日/节假日差异),其价格的非平稳性和高波动驱动风险对冲需求,日内价格预测尤为关键;

- 市场区分及时间粒度:区分欧洲和西伯利亚两个价格区,针对峰时段和非峰时段分别建模;
  • 预测模型分类:指出电力价格预测方法多样,包括多主体、基本面、计量经济、人工智能及混合模型,其中统计方法侧重异方差建模,如ARCH/GARCH和随机波动率(SV)模型;

- SV与GARCH对比:SV模型将波动率视为随机过程相较GARCH具备更高灵活性和性能优势,文献支持SV模型优于GARCH[page::7,8]。

2.2 建模实现(第10-12页)


  • 贝叶斯推断框架:采用贝叶斯方法估计参数,将模型参数视作随机变量,通过先验与似然计算后验,再进行预测后验分布(PPD)抽样,实现概率化预测而非点估计;

- 开发环境:使用Python及Jupyter和VSCode,依赖Stan(PyStan接口)实现贝叶斯推断,配合sklearn、pandas等数据处理库构建模块化管线;
  • 模型实现细节:Stan程序结构包含数据、参数、模型(后验采样)及生成量(PPD预测),优化路径是基于后验参数均值计算预测,平衡计算效率与精度;

- 自定义StanModel类支持scikit-learn接口实现fit和predict方法,方便集成和交叉验证[page::10,11,12]。

2.3 SV基线模型(第13-21页)


  • 模型定义:SV模型基于对数波动率的隐变量自回归过程,价格条件分布为均值为常数,加权指数波动率下的正态分布:


\[
yt \sim \mathcal{N}(\bar{y}, e^{ht/2})
\]

其中波动率隐变量满足
\[
ht = \mu + \phi(h{t-1} - \mu) + \sigma \deltat, \quad \deltat \sim \mathcal{N}(0,1)
\]
  • 数据与探索:以欧洲价格区1号峰时段为基础,使用2023年5月至2024年4月底的小时数据;价格非平稳(Augmented Dickey-Fuller检验,p值均未达到拒绝阈值,确认非平稳);

-
模型拟合:贝叶斯采样得到参数后验,参数分布近似正态,适合后验均值预测;绘制1,000次预测分布与实际价格分布高度吻合,预测区间覆盖实际数据;
  • 波动率分析:学习到的隐波动率与价格呈V型关系——价格远离均值时波动率升高,反映市场价格波动特征;

-
模型表现
- MAE=99.18,RMSE=137.04,表现稳健但与实际价格的相关性较低(r=0.08),残差基本符合正态分布且无明显异方差性;

总结此基线模型对波动率的捕获较好,但均值假设简化,后续模型需加入时变均值和外生因子改进[page::13-21].

2.4 SV外生回归模型(SV X)(第22-33页)


  • 引入外生回归变量

- 空气温度(前一天3次多项式拟合,呈V字变化,高温区与价格正相关,低温区无显著相关);
- 星期几(依据箱式图,星期日价格较低,星期五波动率较低,表明有周期性);
- 自回归成分(PACF显示显著的1天滞后相关,采用AR(1)模型处理);
  • SV X模型定义


\[
yt \sim \mathcal{N}\left( \bar{y} + \alpha y{t-1} + \sum{i=1}^{3} \betai X{t-1}^i + \gamma Dt + \xi, e^{ht/2} \right)
\]

其中,\(X
{t-1}\)为空气温度的多项式表达,\(D_t\)为星期几指标,其他为模型参数。
  • 模型拟合:贝叶斯推断结果显示参数后验合理,1,000次预测分布覆盖实际价格,预测区间反映电价波动区间;

-
性能提升
- MAE从99.18降至85.23(提升14.06%),
- RMSE从137.04降至117.91(提升13.96%),
- 预测均值与实际价格相关性显著改善(r=0.52),残差仍符合正态且同方差;
  • 模型解释:通过偏依赖(Partial Dependence,PD)分析,模型响应温度及日期变化,验证其对于价格的解释能力[page::22-33].


2.5 交叉验证(第34-39页)


  • 方法

- 时间序列分层交叉验证,避免时间倒置泄露,使用约2014年6月-2024年4月的数据,3600日的数据窗口划分为36个训练-测试折叠;
- 比较基线SV模型和SV X模型在两大价格区(欧洲区、亚区)及峰、非峰时段的表现;
  • 结果

- SV X模型在所有组合中均优于基线模型,具体提升:
- MAE平均下降7.91%,
- RMSE平均下降6.31%;
- Mann-Whitney U检验确认两模型性能差异在0.05水平显著;
- 欧洲市场预测效果优于亚区市场;
- 尤其峰时段效果更佳;
  • 结论:外生变量对SV模型的性能贡献显著,促进更稳健精准的电价预测[page::34-39].


2.6 预测评估(第40-43页)


  • 预测策略:基于2023.05.01至2024.04.30的训练集,每天前移滚动训练,预测2024.05.01至2024.05.07的未来7天价格,包含所有8种模型组合;

-
结果
- SV X模型整体表现明显优于基线:
- MAE降低52.77%,
- RMSE降低48.54%;
- 部分场景下SV基线表现较优(如价格区1的非峰时段);
- 预测置信区间覆盖实际价格,SV X置信区间更窄,反映其更精细拟合非恒定均值带来的稳定性增加;
  • 说明:SV X模型能够更准确反映价格随外生变量动态变化而调整的均值和波动率,有助提高短期预测精度[page::40-43].


2.7 结论与未来工作(第44页)


  • 总结

- SV X模型通过引入温度、星期几及滞后价格显著改进了价格预测准确性,适应电力价格非平稳与异方差的特征;
- 未来应扩展到所有24小时+两个价格区共48模型;
- 未来可探索更多气象变量(湿度、降雨、风速等)丰富特征,提高模型泛化能力;
- 作者也在开发定制计算库EasyML以提升模型训练效率以应对大量模型需求;
  • 实际价值:研究成果可直接用于电力现货交易风险对冲及衍生品定价[page::44].


---

3. 图表深度解读


  • 图1-2:消费者价格时序和小时均价轮廓

图1展现2023年5月至2024年4月欧洲区峰时电价波动,价格范围约500至2500 RUB/MWh,均值约1593,时变波动显著;图2反映24小时价格均值,峰时段约1900,下峰低于1200,显示显著日内周期波动。
  • 图3:峰时14点和非峰时3点价格轨迹

峰时价格均值约1868,波动较大;非峰时价格均值约1058,波动较小。价格非平稳,支持ADF检验结论。
  • 图4-7:SV Baseline模型参数后验及预测覆盖

参数后验近似正态,采样预测覆盖实际价格分布(密度对比)。预测置信区间涵盖实际轨迹,符合概率预测预期。
  • 图8-9,图20-21,31-32:学得的隐波动率与价格关系

体现价格远离均值时,隐波动率升高的V形关系,内部变异范围合理,表现模型成功刻画了价格波动动态。
  • 图10,22:预测均值与实际价格散点图

SV X模型相关系数0.52远高于基线0.08,说明外生变量带来了较大预测精度提升。
  • 图11,23:残差分布和同方差验证

两模型残差均近似正态、无明显异方差,表明波动率模型的假设合理。
  • 图12-13,24:空气温度与价格关系,多项式拟合与聚类分析显示消费价格与高温相关性较强,偏依赖分析确认温度及星期几均为重要影响因子。
  • 图14-15:星期几影响和时序自相关分析(PACF)

星期日价格稍低,星期五波动率下降,PACF显示显著的七日周期相关性,支持模型使用星期变量和一天滞后自回归。
  • 图25-26:交叉验证指标分布

SV X在不同时间、区域、时段均优于基线,且Mann-Whitney U统计显著验证该提升非偶然。
  • 图27-30:未来一周预测均值及置信区间

展示不同价格区和时段的预测趋势,SV X置信区间一般较窄且能覆盖实际价格,表明更高置信度的预测。

---

4. 估值分析



本论文未涉及传统金融估值方法(如DCF、市盈率等),估值更多体现为模型性能评估:
  • 评价指标:均方根误差(RMSE)和平均绝对误差(MAE)为主要预测质量度量;

-
模型比较:模型间比较基于这两个指标,并辅以统计检验;
  • 模型复杂性-性能权衡:引入更多参数(六个用于外生变量相关系数)带来更好的拟合度,但计算复杂度提高,在Bayesian MCMC采样中计算资源消耗明显;


---

5. 风险因素评估



论文未专门设置传统意义上的风险章节,但可从以下几点考虑:
  • 模型假设风险:SV模型假设价格对数波动率为隐变量AR(1)过程,均值模型为带外生变量的线性组合,可能忽略价格非线性复杂结构或更高阶滞后效应;

-
数据风险:使用过去十年市场数据,但气候和需求模式变化可能导致时序特性迁移风险;
  • 外生变量局限性:目前仅纳入空气温度作为气候因素,其他气象变量及政策/市场因素缺失;

-
计算复杂性与运行效率风险:贝叶斯MCMC计算耗时较高,不适合实时高频预测,作者提及自研库以缓解此风险;

---

6. 审慎视角与细微差别


  • 均值假设的局限:基线模型假设均值常数,违背非平稳特性,虽以SV X改进,但仍存在简单线性回归限制;

-
自回归成分选取:只选取AR(1)可能忽视长周期或非线性滞后效应;
  • 气象变量选择有限:单一温度指标可能无法完全解释价格波动的所有外部驱动;

-
模型复杂性对性能提升的依赖:SV X性能提升依赖三个外生回归变量,若外生数据质量变差,模型泛化能力可能受损;
  • 统计测试结果:交叉验证虽显示显著改善,但部分小区间组合结果提示模型表现仍有波动性,应关注全面稳健性。


---

7. 结论性综合



本文系统构建了基于随机波动率框架的电力现货价格预测模型。通过对俄罗斯欧洲与西伯利亚两个价格区及峰谷时间段的实际小时数据分析,初步建立了基线SV模型,该模型针对异方差波动成功捕获了电价波动规律,但均值假设不足影响了预测性能。进一步引入空气温度、星期几和滞后电价作为外生回归变量,形成SV X模型,显著提升了预测准确性和相关性,得到了多指标(MAE、RMSE)和统计检验的坚定支持。长达近十年的交叉验证进一步强化了模型的普适性和稳健性。预测结果示范了SV X模型在未来一周电价预测上的优势和更狭窄置信区间,确认其更为精细的动态拟合能力。

本研究详尽剖析各类图表:从价格波动、参数后验、预测分布、残差分析、到偏依赖及自相关函数,全面展示了模型性能和外生变量的贡献机制。结论强调,不同价格区与时段特性各异,未来需针对24小时×2价格区更细粒度建模,并探讨丰富更多气象及市场驱动因素。此外,针对贝叶斯模型计算开销,作者提出自研高效ML库以满足大规模实时预测需求。该研究对电力现货市场风险管理、交易策略设计及衍生品定价具有重要应用价值。

---

参考页码统计 [page::0-47]



---

如需特定图表深度讲解或模型代码部分解读,欢迎提出。

报告