研报&论文

一种基于机器学习的模型用于识别高频交易

由googleglass创建,最终由googleglass 被浏览 14 用户


简介

本文旨在开发一种基于机器学习技术的概率模型,以识别高频交易(HFT)。该模型能够进行精确的日内识别,解决了现有HFT识别框架缺乏广泛接受标准以及代理指标带来的不一致性问题。通过利用学术数据,该模型为未来的HFT研究提供了更好的一致性和可重复性。通过引入模糊逻辑,概率模型使政策制定者在制定政策时拥有更大的灵活性。研究使用了法国资本市场BEDOFIH数据库的数据,并开发了一个能够准确区分HFT的稳健分类模型。此外,通过逆向工程将模型转化为可解释的回归树,增强了模型的可解释性,同时不损害其预测能力。本研究为推进HFT研究提供了有价值的见解,并为在不同市场环境中识别HFT提供了一种可转移的方法。


研究内容

研究背景

高频交易(HFT)是金融市场中一种利用高速计算机系统和复杂算法进行超快速交易的策略。HFT在现代金融市场中占据重要地位,尤其是在美国和欧洲市场。然而,由于缺乏统一的定义和识别方法,HFT的识别一直是一个挑战。现有的识别方法主要依赖于交易者身份信息或特定的交易行为代理指标,这些方法存在局限性,无法提供一致和可重复的结果。

研究方法

  1. 数据来源:研究使用了法国金融市场监管机构(AMF)提供的BEDOFIH数据库数据,涵盖2017年5月4日的高频交易数据。
  2. 特征工程:研究提取了16个特征,包括订单价格、订单生命期、订单深度、与最佳买卖价的差异等。
  3. 机器学习模型:研究尝试了多种机器学习算法,最终选择了随机欠采样提升(RUSBoost)方法,因为它在处理类别不平衡数据时表现出色。
  4. 模型解释:通过逆向工程将复杂的集成模型转化为可解释的回归树,以便更好地理解模型的决策过程。

关键发现

  1. 模型性能:RUSBoost模型在识别HFT方面表现出色,具有较高的真阳性率(TPR)和真阴性率(TNR)。在测试数据中,该模型的TNR平均为73.69%,TPR平均为99.86%。
  2. 特征重要性:研究发现,订单生命期、订单状态、账户类型和交易组特征(recs)是区分HFT和非HFT的关键特征。
  3. 模型解释:通过回归树的解释,研究揭示了HFT订单的典型特征,例如订单生命期短、倾向于交易高流动性证券等。
  4. 实时识别能力:该模型能够利用公开的订单簿数据实时识别HFT,为监管机构提供了实时监控和管理HFT活动的工具。

结论

本研究通过机器学习技术开发了一个能够准确识别HFT的概率模型,并通过逆向工程增强了模型的可解释性。该模型不仅在法国市场表现出色,还具有在其他市场环境中应用的潜力。通过提供一种标准化的HFT识别方法,本研究为理解HFT对金融市场的影响提供了新的视角,并为政策制定者提供了灵活的政策制定工具。未来的研究可以进一步探索该方法在不同市场中的适用性,并优化模型以提高其识别精度。

详细正文

/wiki/static/upload/b2/b21082cd-5a33-4d06-9a7b-d3d38f191656.pdf

\

标签

机器学习高频交易
{link}