`

Stealing Accuracy: Predicting Day-ahead Electricity Prices with Temporal Hierarchy Forecasting (THieF)

创建于 更新于

摘要

本报告提出了时间层级预测(THieF)方法,通过对小时、区块及基准负荷电价的预测进行协调,显著提升德国电力市场日内价格预测准确度,误差降低幅度最高达13%,且适用多种模型架构,推荐在实际预测中应用该方法 [page::0][page::1][page::2]。

速读内容


THieF方法介绍及优势 [page::0][page::1]


  • THieF通过构建跨小时、2-12小时区块及24小时基准负荷的时间层级,将各时间层级预测结果协调融合。

- 这种非重叠的时间聚合和预测协调方法可以增强预测信号,提升整体预测准确率。
  • 实验证明,THieF显著降低了不同模型(线性回归、浅层神经网络、梯度提升树和transformer)的预测误差并减少偏差。


四种基础预测模型及其训练机制 [page::1]

  • 采用包括ARX、NARX、XGB和Mitra四种模型,输入特征涵盖过去7天价格、昨日极值、负荷及风电预测、煤气期货价格及工作日哑变量。

- 使用asinh变换稳定变量分布,基于滚动3年窗口独立训练每个模型和时间区块。
  • Mitra为基于Transformer架构的最新表格数据模型,采用零样本学习,提升复杂模型性能。


实证结果及总结 [page::2]


| Level | Model | MAE | % Gain | RMSE | % Gain |
|-------|-------|-----|--------|-------|--------|
| 1H | ARX | 26.93 | 2.8% | 39.83 | 2.7% |
| | NARX | 23.06 | 3.3% | 35.62 | 2.8% |
| | XGB | 23.34 | 4.4% | 37.05 | 5.5% |
| | Mitra | 21.37 | 1.2% | 33.31 | 1.2% |
| 24H | ARX | 20.92 | 2.0% | 30.29 | 3.4% |
| | NARX | 17.99 | 8.2% | 27.24 | - |
| | XGB | 18.80 | 11.7% | 29.50 | 7.9% |
| | Mitra | 16.56 | 8.1% | 24.81 | 13.4% |
  • 对不同层级和模型,THieF均实现了显著的MAE和RMSE提升,最长区块24小时提升最大(高达13.4%)。

- 所有误差减少均统计显著(5%水平),证实THieF方法的稳健性与普适性。

未来研究方向与应用潜力 [page::2]

  • 探索基于各层级更丰富多样模型的组合,优化计算开销;

- 推进THieF在概率预测方法中的应用;
  • 利用THieF提升层级预测的一致性,有助于指导多层级决策和创新电力市场策略。

深度阅读

研究报告深度解析——《Stealing Accuracy: Predicting Day-ahead Electricity Prices with Temporal Hierarchy Forecasting (THieF)》



---

1. 元数据与概览


  • 报告标题:Stealing Accuracy: Predicting Day-ahead Electricity Prices with Temporal Hierarchy Forecasting (THieF)

- 作者:Arkadiusz Lipiecki, Kaja Bilińska, Nicolaos Kourentzes, Rafał Weron
  • 发布时间及地点:无明确发布日期,研究涵盖2021-2024年测试期,聚焦德国电力市场

- 研究主题:提出并验证基于时间层级的预测与预测调和方法(THieF),在日间电力价格预测领域的应用及性能提升效果。
  • 核心论点:利用时间层级预测方法,将对小时级产品、不同小时块(2-12小时)和基载合同(24小时)价格的预测进行统一调和,显著提升预测准确性,最高优于传统方法13%。该提升效果在德国电力市场试验期四年内表现稳定,且适用于逻辑回归、神经网络、梯度提升(XGB)和Transformer等不同模型架构。研究建议,由于块产品交易日趋普及,且调和计算费用接近单独预测小时价格费用,推荐在实际日度电力价格预报中采用该方法。


整体而言,报告重点在于首次将THieF引入电力价格预测领域,突破以往仅应用于风电、负荷等能源指标的限制,展现了跨时间粒度预报调和的巨大潜力。[page::0,1,2]

---

2. 逐节深度解读



2.1 摘要与引言


  • 关键内容

- 阐述当前电力市场小时产品与其他时间粒度产品间的信息使用及预测不一致性问题,导致决策效率低下。
- 引入并定义时间层级预测(THieF)概念,主要通过非重叠时间聚合实现多层级数据序列的预测,然后调和以获得一致且准确的最终预测。
- 指出能源预测领域关于THieF应用的研究较少,尤其缺乏针对电价预测的案例和系统研究。
  • 理由与假设

- 时间聚合为均值计算,过滤并强化不同信号信息面,多个层级的预测融合有助于信息互补,减少单一时间尺度预测所带来的信息缺失。
- 预测调和采用基于误差协方差的最小二乘法进行加权,利用过去预测误差的估计改善当前预测一致性和准确度。
  • 核心理论优势

- 时间层级调和减少时间粒度预测冲突,强化预测稳定性。
- 通过德国市场4年数据验证,MAE和RMSE均显著下降,各时间层级均表现改进。
  • 数据点

- 预测准确度提升:小时级别1.2%-5.5%,基载价格2%-13.4%。
  • 推断

- 该技术对所有测试模型均有效,说明其方法论具有普适性。

[page::0,1]

---

2.2 时间层级与调和方法(章节II)


  • 章节总结

- 详细阐述THieF的三步构成:时间聚合构造多层级时序数据,独立基准预测生成,最后利用调和算法结合多层预测。
- 介绍关键数学公式,特别是调和矩阵$\mathbf{S}$的构建和调和计算$\tilde{\mathbf{P}}{\mathbf{d}}$。
- 说明聚合采用均值计算,区别于[4]引用的求和方式以便符合能源市场价格的统计特性。
- 误差协方差矩阵$\mathbf{W}$通过训练样本的误差收缩估计,增强稳定性。
- 提出调和每日更新,适应市场动态变化。
  • 逻辑分析

- 聚合矩阵$\mathbf{S}$将24小时数据映射到不同时间块层级,保证时间层级间预测的内在线性约束。
- 调和方法本质是广义最小二乘估计,权重依据误差协方差,确保调和预测兼顾各层级误差结构,减弱噪声。
- 方法中的加权矩阵缩放保证数值稳定性和计算效率。
  • 关键公式与参数说明

- $\mathbf{p}
d$: 天$d$每小时电价观测向量
- 聚合矩阵$\mathbf{S}$将小时序列$\mathbf{p}d$转换为多层级时间序列$\mathbf{P}d$。
- 调和公式体现了多层预测的最优线性调和过程。
  • 意义解读

- 通过多层预测调和,模型不仅能减少单层预测偏差,还能捕捉跨层级时间信息,提高预测的整体一致性和准确率。

[page::0]

---

2.3 基准预测模型构建(章节III)


  • 章节总结

- 设计和使用了四个不同架构的模型产生基准预测:线性回归ARX、非线性神经网络NARX、梯度提升树XGB及Transformer基础的Mitra。
- 利用相同的20个特征变量,含滞后价格、前一日极值、负荷预测、风力预测、煤气价格期货等,实现价格预测。
- 输入特征通过双曲反正割变换(asinh)进行稳定性处理。
- 各模型使用3年滚动窗口训练,支持每日迭代更新以适应市场波动。
- Mitra作为最新Transformer模型,在没有专门针对时间序列微调的情形下,利用零样本学习完成预测任务,体现了方法通用性。
  • 模型详细说明

- ARX:线性回归,可理解为强基线,采用最小二乘估算。
- NARX:一层浅神经网络,5个隐藏节点,用Levenberg-Marquadt训练,避免过拟合靠早停和多次训练平均。
- XGB:集成梯度树,配合贝叶斯优化调节超参数,训练迭代至1000棵树,追求预测误差最小。
- Mitra:基于12层、7200万参数的Transformer模型,预训练于合成数据集免疫过拟合风险,零样本环境下基于上下文学习进行预测。
  • 特征设计与预处理意义

- 通过滞后期价格捕捉季节性和循环效应。
- 负荷和风力预测等作为市场供需指标,结合燃料价格反映成本面压力。
- 输入数据采用区间缩放“asinh”,避免极端值对模型稳定性影响。
  • 模型创新点

- 多模型跨架构验证,检验THieF方法的通用性和稳定性。
- Transformer引入电价预测新技术路径,具有前瞻性。

[page::1]

---

2.4 实证结果与性能评估(章节IV)


  • 数据样本与外部环境

- 研究以德国EPEX电力市场数据为主,时间跨度2018年至2024年。
- 训练集包含2018-2020三年,1092天;实际测试期包含复杂市场事件如COVID-19影响、俄乌战争、天然气价格暴涨及负电价事件,确保结果在极端条件下的稳定性和实用性。
  • 表格I关键解读

- 不同层级(1H/4H/8H/24H)下四模型基准MAE和RMSE详细数据,以及基于调和后误差的百分比提升。

| 时间层级 | 模型 | MAE | MAE提升 | RMSE | RMSE提升 |
|--------|-------|---------|-----------|---------|------------|
| 1H | ARX | 26.93 | 2.8% | 39.83 | 2.7% |
| 1H | NARX | 23.06 | 3.3% | 35.62 | 2.8% |
| 1H | XGB | 23.34 | 4.4% | 37.05 | 5.5% |
| 1H | Mitra | 21.37 | 1.2% | 33.31 | 1.2% |
| 4H | ARX | 25.65 | 3.1% | 37.50 | 3.1% |
| 4H | NARX | 21.75 | 5.0% | 33.27 | 4.6% |
| 4H | XGB | 22.01 | 5.8% | 34.25 | 6.0% |
| 4H | Mitra | 20.13 | 3.7% | 30.87 | 3.5% |
| 8H | ARX NARX |24.37 / 20.54| 2.9% / 5.5% | 35.59 / 31.20 | 3.5%/4.8%|
| 8H | XGB | 21.07 | 6.8% | 32.94 | 8.2% |
| 8H | Mitra | 19.45 | 6.3% | 29.34 | 5.5% |
| 24H | ARX | 20.92 | 2.0% | 30.29 | 3.4% |
| 24H | NARX | 17.99 | 8.2% | 27.24 | 无数据 |
| 24H | XGB | 18.80 | 11.7% | 29.50 | 7.9% |
| 24H | Mitra | 16.56 | 8.1% | 24.81 | 13.4%/8.5% |
  • 发现与趋势

- 所有模型在所有层级均有显著的调和后误差下降,统计检验5%置信水平支持。
- 精度提升幅度随聚合层级增加而增强,说明时间层级调和对于较长周期(如基载24H)价格的帮助更为显著。
- XGB模型常规表现优异,且调和带来的改进幅度最大。
- Mitra虽然基础误差最低,但调和所带来的边际改进相较XGB等略小,可能因基础预测结果已较优。
  • 复杂市场环境验证

- 测试期包含极端事件如负电价大幅波动,模型及调和方法稳定表现良好,保证了实用性。
  • 图表1解读




- 图1展示了XGB模型在某测试日(2021-02-07)不同时间粒度的基准与调和预测对比。
- 预测线(橙色虚线)相对于实际数据(黑点)表现出系统性偏差,调和后(蓝色实线)显著贴近真实价格,特别在峰谷波动区域。
- 低频聚合层级(如24H)基准预测误差偏低,提供低偏差信息,调和提升了高频预报准确率。
- 该图直观展现调和如何整合多时间层级信息,平衡不同频段偏差,实现更准确价格预测。

[page::1,2]

---

3. 图表深度解读


  • 图1详解:

- 内容:XGB模型2021年2月7日电价预测在四个层级(1H、4H、8H、24H)上,比较基线(Base-XGB)和调和后(THieF-XGB)预测。
- 趋势
- 在1小时块上,基线预测偏低,调和预测显著逼近观测。
- 随时间块增长,基线预测误差减少,调和预测的改进空间相对较小,但仍可明显提升。
- 联系文本
- 图形验证了第II节中提出的THieF通过结合不同时间层级基准预测,利用较低偏差的长时段预测来调整短时段预测,减少误差的理论。
- 潜在局限
- 该图为单日单模型单层级示例,能反映趋势但不足以完全彰显模型全年稳定表现。
- 数据溯源:图片官方提供,引用页码为1。

---

4. 估值分析



本报告侧重于预测方法论与实证验证,未涉及公司估值等金融资产估值内容。故此部分无相关内容。

---

5. 风险因素评估


  • 市场异常和极端事件风险

- 能源市场价格受多重外部因素影响,如疫情、地缘政治冲突(俄乌战争)、燃料价格剧烈变化、可再生能源生产波动。
- 报告中提及测试包含负电价极端现象,尤其2023年7月2日价格最低至-500欧元/MWh,极端波动对预测模型构成挑战。
  • 模型风险

- 各模型基于历史数据,可能难以捕捉未来结构性变化如新能源快速渗透或市场规则变动。
- Transformer等复杂模型虽表现优异,但存在参数复杂性风险及训练数据偏差。
  • 调和方法风险及限制

- 误差协方差估计依赖于过去样本,若市场规则变更导致误差统计特性变化,调和效果可能衰减。
- 调和增加计算步骤,虽成本可控,仍需资源投入。
  • 缓解策略

- 持续滚动训练和调和更新。
- 多模型对比验证,避免单一模型风险。
- 将来扩展至多模型层级优化,使每层级采用最适合的预测模型,降低计算负担及提高泛化能力。

[page::1,2]

---

6. 批判性视角与细微差别


  • 报告中提出对所有层级统一采用相同基准预测模型,存在潜在非最优性,作者亦指出未来应考虑多样模型选择优化层级匹配。

- Mitra作为最新Transformer模型,虽性能好且预训练强大,但缺乏针对时间序列的特定微调,可能限制对某些细微市场结构的适应性。
  • 报告重视平均误差指标MAE与RMSE,未详述概率预测性能,未来需验证模型在极端风险预测及不确定性估计方面表现。

- 调和方法基于线性组合假设,电价特有的非线性结构可能部分未被捕获。

整体来看,报告严谨客观,实验设计充分,但后续扩展仍有空间包含多模型混合与概率预测深化。

---

7. 结论性综合



本报告首次系统地将时间层级预测(THieF)引入电力市场价格预测中,突破传统单一时间尺度限制,有效提高日间电力价格预测的准确性和稳定性。利用德国电力市场7年数据,涵盖多重市场极端情形和复杂环境,验证了4种具有代表性的基准模型——从简洁的线性回归到复杂的Transformer——均能通过THieF调和实现1.2%至13.4%的预测误差降低,且误差减少在相对粒度较大的24h基载产品层级表现更为显著。图1清晰体现了调和预测在每日小时块价格层级的显著误差修正及趋势提升。

调和的数学机制充分利用了各时间层级预测的互补信息和误差结构,实现了多时间尺度预测的一致性,其运算成本适中,具备现实应用价值。作者建议实际日度电价预测应纳入该流程,特别是随着块产品交易的普及,其价值日益凸显。

为进一步提升和完善,未来研究可探讨每时间层级多模型复合、概率预测调和及市场策略应用等方向,从而推动能源价格预测和市场决策的智能化升级。

综上,报告体现出高水平的学术深度与实践意义,技术路线与验证严密可靠,具有广泛的理论与应用推广价值。[page::0,1,2]

---

总结



这份报告通过创新性地引入时间层级预测调和(THieF)方法,实证验证了其在电力价格预测中跨时间尺度误差降低的有效性。涉及多种模型架构和四年实际测试期,涵盖了复杂市场环境,且借助数学调和机制明晰地呈现了预测准确率的系统提升。报告结构完整,数据详实,图表辅助直观,论据充分,是应用于电力市场预测的前沿研究典范。

---

如需更细节数据剖析或对某个章节补充,请告知。

报告