`

Isotonic Quantile Regression Averaging for uncertainty quantification of electricity price forecasts

创建于 更新于

摘要

本文提出了一种新颖的基于线性等长约束的量化回归平均方法iQRA,用于对电力价格点预测的不确定性进行概率预测。实证以德国日次电力市场为例,涵盖2015-2024年数据,iQRA在准确性、可靠性和计算效率方面显著优于现有方法,且无需调参,能够生成校准良好的置信区间,支持风险管理和决策优化[page::0][page::1][page::4][page::5][page::6][page::7]。

速读内容


研究背景与意义 [page::0][page::1]

  • 传统机器学习电力价格点预测精度高,但缺乏不确定性估计,限制了决策的风险管理能力。

- 提出iQRA方法,结合量化回归平均与单调性约束,实现概率分布预测,提升不确定性量化性能。

数据与基线模型 [page::1][page::2][page::3]


  • 利用2015-2024年德国电力市场数据及相关负载、可再生能源和大宗商品价格作为输入。

- 采用NARX前馈神经网络基线点预测模型,结构包含输入层(历史价格、负载、外部变量)、单隐层5神经元和输出层,网络每天滚动重训练生成25份点预测。

不确定性量化方法比较 [page::3][page::4]

  • 对比传统的Conformal Prediction(CP)、Historical Simulation(HS)、Isotonic Distributional Regression(IDR)、Quantile Regression Averaging(QRA)、Lasso正则量化回归平均(LQRA)等多种方法。

- iQRA通过对线性量化回归系数施加单调非负约束,实现了结构正则和自动变量选择优势,无需正则强度调参。

性能评估指标及结果 [page::4][page::5][page::6]


  • 采用平均覆盖误差(ACE)、尾部偏差(Tail Bias)、PINBALL分数(PIPS)及连续排名概率分数(CRPS)评估概率预测的可靠性与尖锐度。

- iQRA在多个置信区间水平(98%,96%,90%,80%)的ACE和尾部偏差表现优异,PIPS为所有模型中最低(与LQRA表现相近),CRPS在多年测试中稳定靠前且优于除LQRA外所有方法。
  • iQRA覆盖率好且误差分布均衡,优于CP、HS及IDR等。


计算效率与变量选择分析 [page::6][page::7]


| 方法 | 计算时间 |
|---------|----------------|
| CP | 1 ms |
| HS | 1 ms |
| IDR | 100 ms |
| QRM | 10 s |
| iQRA | 20 s |
| QRA | 30 s |
| LQRA | 600 s |
  • iQRA引入单调约束减少了线性规划规模,计算效率显著高于LQRA。

- 变量选择热图显示,iQRA和LQRA均优先选择极端预测,iQRA无需调参且有效自动筛选重要变量。

结论与展望 [page::7]

  • iQRA提供了一种准确、稳定且高效的电价不确定性量化方法,适合实际运营风险管理。

- 未来可考虑iQRA在其它领域推广应用及自动识别单调协变量的研究拓展。

深度阅读

金融研究报告深度分析报告


报告标题:


Isotonic Quantile Regression Averaging for uncertainty quantification of electricity price forecasts

作者与发布机构:


Arkadiusz Lipiecki 与 Bartosz Uniejewski
具体发布机构未在摘要中明确提及,但文中引用大量电力市场与统计学领域顶尖研究,推测为学术性科研机构或大学相关团队。

发布时间与主题:


报告发布时间不详,引用文献中最晚为2024年,推测为2024年左右。
主题聚焦于德国电力现货市场的日间电价预测不确定性量化,尤其是采用机器学习点预测模型结果的后处理技术,旨在提高电价概率预测的准确性与置信度。

---

一、元数据与概览(引言与报告概览)



报告核心论点:


本文针对电力市场高波动性问题,提出了一种新的概率预测模型——Isotonic Quantile Regression Averaging(iQRA),通过在Quantile Regression Averaging (QRA) 的基础上引入单调性约束,提高了电价预测的准确性和区间置信度,实现了更可靠且计算效率更优的预测。

点预测虽精确但缺乏不确定性描述,iQRA弥补了该不足。
利用德国电力日间市场的10年数据集(含极端事件如疫情和国际局势影响)进行实证,对比多种后处理方法,iQRA均显示出更优的预测置信区间校准度和预测分布的尖锐度。
  • iQRA方法天然不需调节超参数且简化了模型复杂度,且具备自动变量选择能力。


评级与目标价:


报告性质为方法学研究和实证检验,不涉及投资评级或目标价设定。

主要信息传递:


作者强调在电力市场的不确定性管理中,预测准确率与预测区间可靠性同等重要,iQRA为机器学习点预测模型提供了一种高效且可靠的后处理工具,优于现有方法且具备实用推广潜力。

---

二、逐节深度解读



1. 引言部分

  • 关键论点:点预测虽能高效预测电价,但其固有的预测误差导致决策风险,必须通过不确定性量化技术来补足,使得电价预测不仅提供期望值,更给出概率分布以支持风险管理。

- 逻辑与依据:由于电力市场价格波动频繁、事件驱动明显,单纯点估计不足以描述风险,而后处理基于点预测的模型独立于基础模型训练过程,更适合实际多模型依赖的场景。
  • 新颖性:尽管理论上单调性或序贯约束早有研究,作者提出将其灵活应用于线性量化回归形成iQRA,提高了建模效率和预测性能。

- 研究设计:实证范围涵盖德国市场重大时间窗口,考虑疫情及地缘政治等极端事件,验证模型稳健性。

2. 数据描述

  • 包含从2015年至2024年的小时级别电力现货价格、系统负荷、风光发电预测及煤炭、天然气、原油、欧盟碳排放权市场价格等。

- 数据预处理考虑时间转换(冬夏令时切换)等因素,数据整合严谨。
  • 滚动窗口策略:1456天训练点预测,接着364天窗口用于后处理模型校准,然后应用于1833天的测试。这保证了模型动态适应市场变化。

- 图1(电价及相关变量时间序列)展现了数据的季节性、波动性与几个重要时间截点,有助于理解后续模型训练与评估的时间结构。

3. 点预测基线模型(NARX神经网络)

  • 模型结构:基于非线性自回归加外生变量(NARX)神经网络,单隐层含5个tanh神经元,输出层线性结合。

- 输入变量:前几天相同小时电价、最高最低价、系统负荷与可再生能源(风、光)预测、关键商品价格与工作日虚拟变量。
  • 训练细节:应用Box-Cox变换稳定方差,使用最大似然最优化(Levenberg-Marquardt算法),滚动窗口每日训练并生成25个相互独立的点预测组成集成。

- 数据异常处理:特别注重峰值异常及电价尖峰的影响,转换技术减弱噪声,提升泛化表现。
  • 模型输出:每小时独立建模,满足电价分小时动态异质性。


4. 不确定性量化方法


A. 竞争方法介绍:

  • Conformal Prediction(CP):分布自由的预测区间作法,适合交换序列,间接产出对称置信区间,缺点为区间宽度固定。

- Historical Simulation (HS):基于历史误差分布,与CP异曲同工但对非对称分布更友好。
  • Isotonic Distributional Regression (IDR):基于全概率分布估计的单调分布回归,直接估计预测的CDF。

- Quantile Regression Averaging (QRA):基于点预测线性组合估计不同分位数,常用且效果优异。
  • Lasso Quantile Regression Averaging (LQRA):QRA的L1正则化版本,带变量选择,提升模型泛化能力。


B. iQRA细节

  • 核心思想:给定量化回归模型,约束对回归系数非负以保证预测分位数随输入单调递增(即符合分布的随机序关系),这不仅提升了预测合理性,且简化问题复杂度,无需调参正则化项。

- 与IDR思想相似,但作用于线性框架且兼具解释性和可操作性。
  • 约束实现简便,直接通过线性规划中删除负系数变量完成。


5. 评估指标与实验设计

  • 评估指标

- 平均覆盖误差(ACE):预测区间覆盖率与理论置信度的偏差。
- 尾部偏差(Tail Bias,TB):上下尾部误差覆盖的均衡性。
- Pinball Score (PS):单点分位预测误差度量。
- Prediction Interval Pinball Score (PIPS):结合上下预测分位分数的区间评分。
- Continuous Ranked Probability Score (CRPS):整体概率分布与观测值偏差的积分度量。
  • 实验设置:以上指标分别在98%、96%、90%、80%置信水平下测评,考察不仅准确率也考虑置信区间尖锐度,提高预测实用性。


6. 主要实验结果


图3(ACE与TB比较):

  • iQRA在所有置信度下均显示出较低的平均覆盖误差及尾部偏差,尤其明显优于标准QRA和IDR。

- CP和HS虽在置信区间覆盖率上表现较好,但存在显著尾部偏差。
  • IDR表现较差,显示作为独立方法用于电价预测的不稳定性。


表I(PIPS评分):

  • iQRA在98%置信水平表现最佳,较大区间覆盖能力出色。

- LQRA略优于iQRA于较窄置信区间(96%、90%、80%),显示L1正则对提升尖锐区间有效。
  • 两者差异统计上不显著,均显著优于其他方法。

- QRM表现稳定,中等水平。

表II(CRPS评分):

  • iQRA与LQRA表现最好,长期(2020-2024年)均优于其他方法。

- iQRA2024年表现略优,统计显著。
  • IDR个别年份表现良好,整体不及iQRA。

- QRA表现最差,说明无正则化的线性回归限制了泛化能力。

计算性能与变量选择(表III与图4):

  • iQRA在计算时间上优于QRA和LQRA,尤其LQRA由于需多次解优化问题,耗时远超iQRA。

- iQRA天然具备变量选择能力:回归系数因单调性约束被筛选,显示极端预测(最小、最大值)最关键,且上下分位数预测对应不同极端变量。
  • 该性质无需调节超参数,减轻调参负担,提升模型解释性。


---

三、图表深度解读



图1(价格与驱动指标时序图):

  • 展示了2015年-2024年德国电力市场日间电价、系统负荷、可再生能源发电及煤炭、天然气、油价和碳排放权价格的小时数据。

- 折线清晰显示价格及外生变量月季节性及长期趋势波动。
  • 训练、校准、测试窗口分界通过垂直虚线标注,体现动态训练策略。

- 该图支持数据质量管理和模型在诸多市场条件下的稳健性验证。


图2(NARX神经网络结构):

  • 显示输入层包括历史价、负载、再生能源、商品价格及工作日虚拟变量;单隐层含5个tanh激活神经元,输出层线性输出预测。

- 架构简洁透明,支持快速训练及多小时独立输入处理。


图3(ACE与Tail Bias散点图):

  • 每个子图对应不同置信水平,纵轴表示平均覆盖误差,横轴表示偏向哪侧尾部的误差。

- iQRA、LQRA、QRM聚集于图中心偏上方,表现优异。其他方法普遍偏离中心,特别是IDR散布较远。


图4(变量选择可视化):

  • 热度图显示不同时分位数模型选用的基础预测排序位置。

- 两者均显示预报集合首尾预测变量(最小最大)最频繁被利用,中间预测较少被选入。
  • iQRA略表现出集中度和规则性,说明其单调约束具备良好变量筛选效果。



---

四、估值分析


  • 本文不涉及企业估值,技术性金融估值工具较少,主要聚焦统计建模与风险量化领域。

- 使用的数学工具包括线性规划构型的量化回归优化,带单调约束的参数空间缩减。
  • 计算复杂度分析显示iQRA约束降低了解空间维度及计算负载,优于经典QRA和Lasso QRA的方法成本。


---

五、风险因素评估


  • 电力价格波动受极端事件驱动,也存在模型假设风险。

- 传统点预测模型难以捕捉尾部风险,iQRA通过概率预测增强风险感知能力。
  • 不确定性量化准确性影响决策风险管理效果不确定,若单调性假设违背实际,模型表现可能受限。

- 报告未特别指出缓解措施,但iQRA无调参设计降低人为设定风险。

---

六、批判性视角与细微差别


  • 报告强调单调性约束的优点,但未充分讨论实际数据中可能违背该假设的极端场景对预测性能的影响。

- 作为线性模型,iQRA在极端非线性关系的表现仍存在未知。
  • 计算效率虽优,但与深度非线性模型结合后如何表现未展开。

- IDR表现不佳,可能是参数或实现细节影响,值得进一步研究。
  • 虽然iQRA不需超参数,但这一刚性约束在某些市场环境可能过于简化。


---

七、结论性综合



本文提出的Isotonic Quantile Regression Averaging (iQRA),通过引入针对点预测集成的单调性约束,成功提升了德国日间电价的概率预测准确度和区间校准度。

通过10年高维数据和极端事件覆盖的实证研究,iQRA不仅在平均覆盖误差、尾部偏差、PIPS和CRPS等指标上表现优异,且兼顾模型复杂度和计算效率,避免了需调参的正则化方法的复杂度负担。此外,iQRA具备变量选择功能,自动聚焦极端分位点预测变量,这与电价波动特性高度契合。

报告明确阐述,iQRA实现了模型可解释性、操作简便性与预测性能的良好平衡,适合支持电力市场风险管理和决策制定。展望未来,iQRA具备伸展至其他领域及自动挑选单调回归变量的潜力,为机器学习预测不确定性量化领域提供了新的思路和工具。

---

总体评价



本报告内容详实,实证数据充分、方法选择科学,实验设计合理,评价指标多元且严谨。重点强调方法创新及其优越性,特别详细解释了统计学与优化技术,覆盖了数据预处理、模型构建、性能评估和计算资源需求全链条,利于学术与工程实践推广。唯一不足是在极端市场环境下单调约束的适应性讨论略显不足,是未来改进的方向。

---

[page::0,1,2,3,4,5,6,7]

报告