研报&论文

使用机器学习技术对配对交易的最优再平衡频率进行分类

由googleglass创建,最终由googleglass 被浏览 2 用户

文章简介


摘要

本文提出了一种基于机器学习(ML)的方法,用于预测配对交易算法(PTA)的最优再平衡频率(ORF)。研究使用了来自Binance交易所的50种加密资产的高频(按分钟)价格数据,并构建了所有可能的两资产组合。这些组合根据相关性被分为三组:正相关、弱相关和负相关。通过模拟PTA并计算每对资产的ORF,研究发现随机森林(RF)、逻辑回归(LR)和支持向量机(SVM)在短期和长期应用中对ORF范围分类的表现最为出色。负相关组合的分类性能最佳,而正相关组合的准确率最低。此外,通过验证数据集验证了所提ML程序的稳健性,证明了ORF范围分类在实际交易市场中的适用性。

作者

Mahmut Bağcı 和 Pınar Kaya Soylu

期刊

《伊斯坦布尔证券交易所评论》(Borsa Istanbul Review)

发表日期

2024年


研报总结

研究背景

配对交易是一种通过定期调整两个资产配置来获取利润的交易策略。其核心在于选择合适的再平衡频率(ORF),以最大化利润并控制风险。然而,ORF的选择受到多种因素的影响,包括资产之间的相关性、市场波动等。本文通过机器学习技术,探索如何准确预测ORF范围,以优化配对交易策略。

研究方法

  1. 数据来源:研究使用了来自Binance交易所的50种加密资产的高频价格数据(按分钟计算),涵盖2022年和2023年的数据。
  2. 配对交易算法(PTA):PTA通过定期调整两个资产的权重来实现利润最大化。研究假设初始资产权重相等,并通过模拟交易来计算每对资产的ORF。
  3. 机器学习模型:研究使用了六种监督学习算法(逻辑回归、支持向量机、K最近邻、决策树、随机森林和朴素贝叶斯)来分类ORF范围。输入变量包括组合的均值、方差、偏度、峰度、风险价值(VaR)和相关系数,输出变量为ORF。

实验设计

  1. 相关性分组:所有资产组合根据相关性分为三组:正相关(>0.3)、弱相关(-0.3 ≤ r ≤ 0.3)和负相关(< -0.3)。
  2. ORF分类:ORF范围被分为四个类别:非常高频率(≤1小时)、高频率(1小时 < 频率 ≤ 1天)、中等频率(1天 < 频率 < 1周)和低频率(≥1周)。
  3. 模型训练与验证:使用75%的数据作为训练集,25%的数据作为测试集。通过100次随机抽样(bootstrap方法)计算每种模型的平均准确率。

关键发现

  1. ORF分布:正相关组合的ORF大多集中在中等频率范围(1天到1周),而负相关组合的ORF则集中在低频率范围(超过1周)。这表明,随着相关性从正向变为负向,最优再平衡频率逐渐降低。
  2. 模型表现:随机森林(RF)在正相关和负相关组合中表现最佳,逻辑回归(LR)和支持向量机(SVM)在弱相关组合中表现最佳。朴素贝叶斯(NB)在所有情况下表现最差。
  3. 验证数据集:通过2024年1月和2月的数据验证了RF模型的稳健性。结果显示,负相关组合的分类准确率最高,正相关组合的准确率最低。
  4. 实际应用:配对交易算法(PTA)在短期(月度)和长期(年度)应用中均优于被动持有策略。在短期应用中,PTA在91.80%的正相关、81.89%的弱相关和53.86%的负相关组合中表现更好;在长期应用中,PTA在所有组合中均优于被动持有策略。

结论

本文通过机器学习技术成功预测了配对交易的最优再平衡频率范围。研究结果表明,通过合理选择再平衡频率,可以显著提高配对交易的利润。此外,所提出的机器学习方法具有较高的准确率和稳健性,可以应用于实际交易市场。未来的研究可以探索更多特征变量和先进的机器学习算法(如深度学习或集成学习),以进一步提高ORF范围分类的准确性。

正文

/wiki/static/upload/7f/7f279fab-ba47-44ef-af4b-97698e036a60.pdf

\

标签

机器学习配对交易
{link}