`

Orderbook Feature Learning and Asymmetric Generalization in Intraday Electricity Markets

创建于 更新于

摘要

本论文针对欧洲电力日内市场价格的概率预测问题,提出从orderbook中提取384个特征,结合LASSO量化回归实现特征筛选。评估多类传统统计模型、树模型及深度学习模型在德国与奥地利两个国家及两种产品(60分钟和15分钟)上的表现,发现深度学习模型整体优于其他模型。核心贡献还包括跨国家和跨产品类型的泛化能力研究,发现泛化存在明显的非对称性:从流动性较高的市场(如德国)训练的模型能较好泛化到流动性较低市场(如奥地利),反之则性能大幅下降,揭示了流动性对模型泛化的关键影响。[page::0][page::1][page::4][page::5][page::6]

速读内容


订单簿特征提取及选择 [page::1][page::2]

  • 提取384个价格和交易量统计特征,包括最低价、最高价、价格百分位数等,覆盖不同的回溯时间窗口(1分钟至全部交易历史)。

- 利用$\ell_1$正则化的线性分位数回归(LASSO扩展)筛选出最优特征,最终采用排名前5的特征进行后续建模任务。
  • 价格百分位、极值和15分钟、60分钟窗口提取的特征贡献最大,交易量相关特征贡献较小。


机器学习模型比较 [page::2][page::4][page::5]


  • 采用6种模型评估:线性分位数回归(LQR)、分位数K近邻(QKNN)、分位数LightGBM(QLGBM)、分位数XGBoost(QXGB)、分位数多层感知机(QMLP)、分位数Kolmogorov-Arnold网络(QKAN)。

- 深度学习模型(QMLP和QKAN)在平均AQL损失上领先,优于传统统计和树模型,且QMLP训练效率更高,选为后续泛化实验的基线。
  • 不同市场与产品的预测难度排序为:德国60分钟 < 奥地利60分钟 < 奥地利15分钟 < 德国15分钟,部分因交易活跃度和价格波动相互影响。


量化模型泛化能力及非对称现象 [page::5][page::6]


| 场景 | 迁移策略 | AQL均值 | 说明 |
|---------------|-------------|--------|-----------------------------------------|
| 跨国家:DE→AT | 目标市场训练 | 4.20 | 性能良好 |
| | 反向AT→DE | 23.84 | 性能显著下降,表现不佳(非对称泛化) |
| 跨产品类型:60→15分钟 | 目标市场训练 | 6.56 | 性能稳定 |
| | 反向15→60分钟 | 8.17 | 泛化性能下降 |
  • 定义损失比率$\mathcal{L}$与交易量比率$\mathcal{C}$,发现当$\mathcal{C}\geq1$时,表现接近目标训练,$\mathcal{C}<1$时损失比率迅速上升,验证流动性驱动下的非对称泛化现象。

- 该现象强调高流动性市场训练模型更具泛用性,低流动性市场训练模型难以迁移至流动性更高的环境,揭示了流动性对模型泛化的决定性影响。

结论及未来方向 [page::6]

  • 提出了丰富的订单簿特征集,验证价格极值和百分位相关特征相较传统VWAP及最新价格具有更强预测力。

- 深度学习方法,尤其是QMLP,为概率性电价预测提供了优越的性能和效率。
  • 泛化研究揭示依赖流动性的非对称转移现象,为未来跨市场模型部署和电力市场流动性研究指明方向。

- 未来工作包括拓展更广泛特征集,探索更高效超参调优,以及关注北欧电力市场和市场效率演变对模型的影响。

深度阅读

金融研究报告详尽分析报告


报告标题:Orderbook Feature Learning and Asymmetric Generalization in Intraday Electricity Markets
作者:Runyao Yu, Ruochen Wu, Yongsheng Han, Jochen L. Cremer
机构:Delft University of Technology(荷兰),Austrian Institute of Technology(奥地利)
发布时间:未明确标注具体日期,但引用了2024-2025年的最新文献,推测为2024年底或2025年初。

---

1. 元数据与概览



本报告聚焦于欧洲电力市场(德国和奥地利)的日内市场电价的概率预测,重点为开发和选取基于订单簿(Orderbook)特征的机器学习及深度学习模型,并研究模型在不同国家和不同时间粒度产品(60分钟与15分钟)之间的泛化能力。作者认为目前大部分研究依赖简单的价格指标(如成交量加权平均价VWAP与最后价格),而订单簿中蕴含着丰富未充分利用的信息。

报告核心论点:
  • 从订单簿中提取384个特征,含价格百分位数、极端价及VWAP等,再运用特征选择筛选出一组有力特征。

- 基于筛选特征,进行广泛的模型基准比较,涵盖经典统计、树基集成及深度学习模型。
  • 跨国(德国与奥地利)和跨产品类型(60分钟与15分钟)系统测试模型的泛化能力。

- 揭示了一个重要的“非对称泛化”现象:模型和特征从流动性更强的市场能较好迁移到流动性弱的市场,反向迁移性能显著下降。

最终报告重点强调流动性在模型迁移中的核心作用,并推荐基于深度学习的QMLP模型作为强力基线。

---

2. 逐节深度解读



2.1 引言(Introduction)与背景


  • 报告首先指出,日内市场电价预测关键在于准确捕捉不确定性,关联交易决策。

- 传统研究多用VWAP和最终价格作为输入,基本假设市场具弱势效率(last price能代表全部信息),因此忽略了订单簿中诸如价格分布、价格动量、成交量统计等丰富信息。
  • 技术手段从经典统计(线性回归)过渡到复杂的深度学习(MLP、LSTM、Transformer)。

- 研究多集中于德国大市场和单一产品类型,缺乏跨国和跨时长产品的统一对比,导致理解局限。
  • 明确提出研究动机:系统提取订单簿特征、多模型对比、跨国与跨产品泛化测试,揭示流动性与泛化能力相关的“非对称”现象。


2.2 预备知识(Preliminary)


  • 定义预测目标指标 $\mathrm{ID3}$ 为:交割前180分钟内成交交易的成交量加权平均价(VWAP)。

- 精确数学定义了 $\mathrm{ID
3}$,包括买卖双边市场、不同时间窗口的交易集合,强调预测时间窗口的设计(德国$\deltam=30$分钟,奥地利$\deltam=0$)。

2.3 特征提取与选择(Feature Extraction and Selection)


  • 特征提取: 对买卖双方,采用多种回溯窗口(1、5、15、60、180分钟及完整历史)提取价格和成交量的统计特征,包括最小值、最大值、均值和多层百分位数(10%、25%、45%、50%、55%、75%、90%)等,合计384个特征。

- 窗口内无交易时,采用下一长窗口;无历史交易时样本剔除。
  • 特征选择: 采用带有$\ell1$正则的线性分位回归(LASSO的分位数版本——Linear Quantile Regression, LQR)筛选最有价值特征,实现特征稀疏化,去除冗余和噪声特征,从而提升模型泛化能力。


2.4 模型比较(Model Comparison)


  • 模型种类:

- 经典统计:线性分位数回归(LQR),K近邻分位数回归(QKNN)
- 树基模型:LightGBM(QLGBM),XGBoost(QXGB)
- 深度学习:多层感知机(QMLP),Kolmogorov-Arnold网路(QKAN)
  • 使用Optuna框架进行参数调优(贝叶斯优化,100次试验)。


2.5 评估指标(Evaluation Metrics)


  • 概率预测指标:平均分位数损失(AQL),分位数交叉率(AQCR)。AQL衡量模型预测置信区间的准确性,AQCR衡量不同置信区间预测一致性。

- 点预测指标:均方根误差(RMSE)、平均绝对误差(MAE)、决定系数$R^2$。
  • 为评估泛化能力,定义转移策略(A→A,B→A,A+B→A),与流动性度量(以平均成交交易数为准),引入损失比率$\mathcal{L}$和交易数比率$\mathcal{C}$衡量泛化性能与市场流动性关系。


2.6 实验设计与数据分割(Experiment)


  • 数据涵盖2022-2025年,分训练(2022-2024年初)、验证(2024上半年)和测试(2024下半年至2025初)。

- 预测频率:60分钟产品每60分钟预测一次,15分钟产品每15分钟预测一次。

---

3. 图表深度解读



3.1 图1 — 电价指标$\mathrm{ID3}$直方图与趋势(第1页)



  • 展示德国和奥地利60分钟与15分钟产品的$\mathrm{ID_3}$价格分布,包含2022-2024年不同年度数据颜色区分。

- 明显看到2022年能源危机导致价格分布高偏态且广泛散布,2023-2024年逐渐恢复稳定。
  • 价指数波动性按顺序递增:AT 60-min < DE 60-min < AT 15-min < DE 15-min,反映不同市场与粒度的波动性差异。


3.2 图2 — 特征选择分析与影响(第4页)



  • (a)特征类别的重要性分布:价格百分位数占近30%,最小价和最大价分别占26.3%和21.9%,成交量相关特征贡献相对较小。

- (b)不同回溯窗口贡献占比:15分钟窗(23.4%)和60分钟窗(20.6%)贡献最大,1分钟窗贡献仅11.3%,可能因交易波动剧烈且存在噪声。
  • (c)买卖双方特征重要性略微倾向买方侧,但差异不大。

- (d)模型测试AQL损失对不同特征集表现:
- 使用全特征集优于基于15分钟VWAP(Naive1)和最后价格(Naive2)的简单基线,提升测试准确率10%以上。
- 仅用前5个最重要特征即可达到全特征集近似表现,显示弱特征存在冗余。
- 以此决定后续模型仅用前5特征输入。

3.3 表3 — 各市场、产品及分位数的前5重要特征(第4页)


  • 各个市场(德国、奥地利)、产品时间粒度(60-min、15-min)及不同分位数(0.1、0.5、0.9)下,前5个影响最大的特征不尽相同,且主要为各种价格极值和价格百分位数,进一步印证价格特征主导地位。


3.4 表4 — 不同模型性能比较(第5页)


  • 深度学习模型QMLP和QKAN在所有市场和产品类型中均优于统计模型(LQR)和树基模型(QLGBM, QXGB)。

- 15分钟产品预测困难显著高于60分钟产品,整体AQL值更高。
  • QMLP比LQR平均降低AQL约3.45%,AQCR也显著更低(0.01%对比0.04-0.19%),显示概率预测更可靠。

- QKAN和QMLP表现类似,但QKAN训练开销远高(约9.7倍时间),从成本效益角度推荐QMLP作为基线。

3.5 表5 — 跨域(国家与产品)泛化表现(第6页)


  • 跨国泛化:

- DE→AT迁移表现基本持平甚至提升,AT→DE迁移AQL骤升(60-min产品23.84比3.30差异巨大;15-min产品80.15比6.56更是灾难性),表明从流动性较高的德国市场到奥地利较顺利,反向迁移失败明显。
  • 跨产品泛化:

- 60→15分钟产品转移相对顺利,AQL无明显恶化;而15→60分钟严重退化。
  • 此外,联合训练(DE + AT)通常能缓解迁移损失,提升目标域表现。

- 跨国及跨产品的迁移效果通过损失比率$\mathcal{L}$与成交笔数比率$\mathcal{C}$关联,表现为$\mathcal{C}\geq1$(流动性更高域迁移到更低):$\mathcal{L}\approx1$(无损失),$\mathcal{C}<1$则损失扩大。

3.6 图3 — 市场流动性与模型性能关系(第6页)



  • (a)不同市场和产品的成交笔数柱状对比,DE 60-min最高,AT 15-min最低,流动性梯度明显。

- (b)损失比率与交易数比率关系图,验证非对称泛化现象:$\mathcal{C}\geq1$时迁移损失不增,$\mathcal{C}<1$时呈指数型增长,损失倍增。

---

4. 估值分析



本报告集中于机器学习算法性能的评估与特征工程优化,无传统金融资产估值环节(如DCF、市盈率等评估方法)。模型选用与比较以预测准确率和概率预测稳定性指标为主,不涉及估值定价框架。

---

5. 风险因素评估



报告明确指出影响预测和模型泛化表现的关键风险因素
  • 市场流动性差异: 流动性不足导致订单簿信息稀缺,特征稳定性和模型泛化能力受限。

- 事件驱动及价格波动剧烈:如2022年能源危机导致价格分布高偏态及直方图尾部异常,增大模型预测复杂度。
  • 产品时间粒度差异:15分钟产品波动性大且成交笔数少,不利于模型训练及泛化。

- 特征构造的局限性:当前选用的384个特征仍局限于经验特征,可能遗漏更具预测力的高阶特征或结构性信息。
  • 模型和超参数调整不足:贝叶斯调参虽有效,但超参数空间及尝试次数有限,可能未达到最佳。

- 地理范围限制:仅限于中欧核心市场(德国和奥地利),未涵盖更广泛的欧洲电力市场(如北欧)。

报告建议:扩大特征探索,强化超参数调节,关注市场效率发展趋势,并探索更广市场适用性。

---

6. 批判性视角与细微差别


  • 非对称泛化现象虽被报告强调且由流动性解释,但流动性以成交笔数简单衡量,未考虑订单簿深度、价差等多维度流动性指标,可能导致解释略显单一。

- 报告对QKAN神经网络结构缺乏进一步细节讨论及其复杂度对实际部署的潜在限制,认为训练时间过长是主要问题,但未来可优化空间值得探讨。
  • 15分钟产品的高波动性和稀疏交易特点指出模型泛化差,但报告没有具体提出解决措施(例如采用更细粒度的时间序列模型或数据增强手段)。

- 由于特征提取框架及模型训练主要基于历史数据,未提及如何动态适应电价趋势与政策变化,未来版本或可结合在线学习或自适应模型。
  • 报告未详细披露测试样本数据规模和分布,可能影响模型泛化性能的置信度。

- 训练测试区间包括2022年能源危机这一异常区间,可能造成部分模型过拟合异常现象,缺少关于数据异常处理的说明。

---

7. 结论性综合



本报告全面展开了基于订单簿信息的欧洲日内电力市场电价概率预测研究,取得了以下主要成果:
  • 丰富特征提取:

提取384项订单簿统计特征(价格百分位、极端值、VWAP等),凭借LQR正则选择显著提升预测性能,且仅需前5个重要特征即可实现近似全特征效果。说明订单簿中价格相关指标信息密度高,成交量特征贡献有限。
  • 模型评估与选择:

深度学习模型(尤其是QMLP)在概率预测任务中整体优于经典统计和树基模型,表现稳定且计算性价比高。QKAN架构虽功能强大但训练时间成瓶颈。
  • 泛化能力评估与非对称现象揭示:

研究揭露市场流动性强弱直接导致模型迁移表现的非对称性:流动性强市场模型可成功迁移至流动性弱市场,但流动性弱市场模型迁移至强市场效果差,验证了市场流动性对订单簿驱动模型稳定性的关键作用。
同样时间粒度间跨产品泛化亦呈现此现象。
  • 实证图表支撑:

价格波动和分布图表展示了不同市场和产品的差异,特征重要性的饼图和柱状图直观揭示信息贡献分布,模型性能评估表明深度学习优势,迁移性能表格加深理解非对称迁移机制。
  • 研究贡献与展望:

本文项目为统一多市场、多产品、电价概率预测的先驱工作,强调流动性维度对电力市场模型设计的战略意义。未来工作建议继续扩展特征集合,优化超参数寻优,监控市场演化对模型稳定性的影响,并涵盖更多欧洲区域市场。

综上,作者通过科学严密的特征工程、系统多模型尝试和考察跨域迁移,提出了对于订单簿驱动日内电价概率预测具有前瞻意义的见解和方法推荐,尤其对实践中希望部署多市场通用模型的利益相关者提供了宝贵指导。[page::0,1,2,3,4,5,6]

---

致谢



本分析总结综合了报告提供的全部章节和图表,涵盖数据、方法、模型、结果及其解读,内容全面且深入,意在为研究人员和实务操作人员提供清晰、权威的信息支持。

报告