High-Frequency Stock Market Order Transitions during the US-China Trade War 2018: A Discrete-Time Markov Chain Analysis
创建于 更新于
摘要
本研究采用一阶齐次离散时间马尔可夫链模型,分析了2018年美中贸易战期间六大行业高频股票市场订单的转移动态。通过卡方检验确认订单序列服从马尔可夫性质,估计转移概率矩阵并据此计算稳态分布、平均再现时间、谱间隙及熵率。研究发现,高波动日交易者更加活跃且大量限价单被故意撤销以影响市场,尤其在财经银行板块全执行订单表现出显著的循环模式,显示其在贸易战中的韧性。类似的谱间隙和熵率表明交易策略在高低波动日较为一致。该分析对理解极端宏观经济事件下的市场行为和制定交易策略具有重要参考价值 [page::0][page::1][page::7][page::10][page::11][page::13]。
速读内容
- 研究背景与目的:使用高频股票订单数据,结合一阶齐次离散时间马尔可夫链(DTMC)模型,分析2018年美中贸易战期间不同波动性日的订单转移动态,涵盖能源、财经银行、快消、医疗、IT和房产六大行业以揭示极端宏观事件下交易策略特点 [page::0][page::1][page::2][page::3].
- 波动日选择方法:依据交易日内最高价与最低价的差,经归一化后基于均值加减标准差确定高低波动日,实现准确分类 [page::3].
- 卡方检验验证:对所有股票订单序列进行$\chi^2$独立性检验,结果p值均远小于0.01,支持订单序列服从马尔可夫性质,确保DTMC模型适用 [page::6].
- 转移概率矩阵特征:高波动日中,满执行卖单后立即添加买限价单($F B \to A A$)及满执行买单后添加卖限价单($F A \to A B$)的概率显著高于低波动日,且加单到删单转移概率升高(约39% vs 34%),体现活跃交易及可能操纵市场的虚假限价单行为;此外,高波动日转移矩阵对角线概率下降,表明订单惯性减弱,市场参与者更多样化。财经银行板块展现满执行订单的高自转移概率,显示其抗压性 [page::7][page::8][page::9][page::10][page::13].

- 稳态分布与平均再现时间(MRT):订单$A B, A A, D B, D A$共占95%以上稳态概率,执行订单仅占4%内,体现大多数限价单意图为撤销而非执行。高波动日中执行订单$F B$和$F A$的稳态概率较低波动日有所上升。财经银行板块中$F B$和$F A$的MRT更大,显示满执行订单的重复出现间隔较长,暗示未信息化投资者跟进行情而晚于知情者执行 [page::10][page::11].
- 谱间隙、弛豫率与熵率分析:不同波动日间谱间隙及弛豫率差异不显著,指订单转移至稳态的速度相似,或说明高低波动日交易策略相近。财经银行板块谱间隙较小,弛豫率较大,表现出更长记忆效应和转换拖沓。熵率显示约60%不确定性,反映整体订单序列具备较高随机性 [page::11][page::12].

- 结论:高波动日交易更为活跃且限价单多为操控市场的虚假订单。财经银行行业在贸易战期间表现出稳定而韧性的交易模式。该DTMC模型分析方法为理解极端宏观经济事件下股市行为并制定量化交易策略提供了方法支持,并建议未来研究可扩展至其他极端市场环境及更细粒度时段分析 [page::0][page::13].
深度阅读
专题研究报告详尽分析报告
报告标题
High-Frequency Stock Market Order Transitions during the US-China Trade War 2018: A Discrete-Time Markov Chain Analysis
作者及机构
Salam Rabindrajit Luwang等,出自印度锡金国立技术研究所物理和数学系及印度海得拉巴国际信息技术研究中心计算科学与生物信息学中心。
发布日期
2024年5月10日
研究主题
本报告以2018年中美贸易战期间美国六大行业高频股市订单数据为研究对象,探讨基于一阶时间齐次离散时间马尔可夫链(DTMC)模型的股票订单转换动态。通过对订单序列的统计分析,验证马尔可夫性质,并提供市场参与者行为的深刻洞见。
---
1. 元数据与报告概览
该报告以中美贸易战2018年期间的高频订单数据为基础,应用基于一阶离散时间齐次马尔可夫链模型,研究股票市场订单的转换动态。核心论点在于:
- 不同类型订单的转换过程符合马尔可夫性质(经卡方检验验证)。
- 高频波动日交易者行为活跃,尤其体现在“添加后删除”限价单频繁出现,推断存在一定市场影响或操纵行为。
- 通过计算转移概率矩阵、稳态分布、均值重现时间、谱隙、熵率等参数,作者指出在高低波动日间,交易策略在整体上较为相似。
- 特别指出金融与银行板块抗压力强,存在重复的“完全成交订单”模式,反映出此类股票在贸易战中的韧性。
作者最终目的是为交易者和投资者提供在极端宏观经济事件下,理解订单动态及制定相应策略的参考框架。[page::0,1,12,13]
---
2. 章节逐节深度解读
I. 引言
- 阐述了近年来高频交易技术的发展,及其导致订单数量和修改频率的增加。强调市场自动化和低延迟交易对订单流影响显著。
- 讨论不同类型订单的市场行为,如限价单可能被部分执行、修订或取消,反映了交易者行为多样性和策略复杂性。
- 进而引出研究必要性:在极端市场环境下,利用订单数据掌握潜在交易行为,对风险管控极为关键。[page::0]
II. 研究背景与文献综述
- 描述美国-中国贸易战引发的市场高波动,强调利用VIX指数等体现市场恐慌程度。
- 明确本研究选取能源、金融与银行、快速消费品、医疗保健、信息技术、房地产六大行业,基于其贸易战影响。
- 点出此前虽有以宏观视角、股价波动及市场联动性为主题的研究,但尚缺乏对“订单转换动态”的深度分析。
- 介绍了马尔可夫链模型在多个领域(物理、医药、社科、金融)中的应用,阐明本研究采用一阶DTMC的原因:简单有效、适合分析离散的订单类型状态空间。
- 详细介绍离散时间马尔可夫链(DTMC)模型的数学基础,状态空间有限,时间齐次假设,转移概率矩阵的构建及其物理含义,强调其适用性和计算便利性。 [page::1,2]
III. 数据描述
- 数据来源于Algoseek,数据时长涵盖当天交易时段04:00 - 20:00 EST,数据量巨大,一天约20-40GB,包含NASDAQ全市场订单。
- 采用EmEditor预处理大体量CSV数据,最终筛选18只股票,6行业各3只。
- 订单类型具体介绍,分为添加(Add)、撤销(Cancel/Delete)、执行(Execute/Fill)等类别,买卖两个方向(Bid/Ask),共10种订单状态,构成DTMC状态空间。
- 此外,报告示例订单序列形式,强调对这一瞬时切换序列进行DTMC建模分析。 [page::2]
IV. 方法论
A. 高频与低频波动日的选择标准
- 计算股票单日最高与最低价差,标准化后依据均值加减标准差阈值确定高低波动日。
- 该指标简单直观,有效区分不同波动状态。
B. 依赖性测试(卡方测试)
- 使用卡方统计量检验订单序列的状态转移是否独立。
- 原假设为序列状态独立,备择假设为序列符合马尔可夫性质。
- 以$(r-1)^2$自由度检验统计量,结果支持拒绝独立假设,维护马尔可夫模型适用性。
C-D. 马尔可夫链模型定义及参数估计
- 具体介绍一阶时间齐次DTMC数学形式,状态转移概率$p_{ij}$的性质,转移矩阵构造,及最大似然估计(MLE)方法计算转移概率。
- 进一步介绍状态的通信性、遍历性(irreducible)、周期性及其统计学意义。
E-G. 关键统计量定义及计算
- 稳态分布:长期状态概率分布,反映在序列中各订单类别的平均占比。
- 平均重现时间:某订单从出现到下一次出现的期望间隔,揭示订单频率与市场关注度。
- 谱隙与松弛时间:转移矩阵主要特征根差,评价链汇聚稳态速度,反映市场状态记忆长短。
- 熵率:系统状态的预测不确定性,表示订单状态转换过程的随机性与复杂度。 [page::3-6]
---
3. 关键图表及数据深度解读
图表1、2:六行业高低波动日转移概率热力图
- 每幅热图表示10阶(订单类别)转移概率矩阵,用颜色梯度深浅表示概率大小;列为当前订单,行为下一订单。
- 发现的主要趋势包括:
1. 全成交售卖订单向添加买入订单转移($F B\to A A$)和全成交买入订单向添加买入订单($F A\to A B$)在高波动日概率明显更高(约从47%升至52%、从45%升至51%)。反映高波动日交易者更频繁地快速下新订单。
2. 添加限价单向删除限价单($A B\to D B$等)的转移概率高于低波动日(约高5%),提示市场操控行为可能增多(虚假挂单以误导市场)。
3. 对角线自循环概率在高波动日普遍较低,即订单惯性减少,显示更为复杂和活跃的订单动态,参与者多样。
- 金融与银行板块表现出显著的高自循环概率,说明完全成交订单频繁自我连续,体现该板块动态稳定,市场抗风险能力强。
此一系列数据和图形有效佐证了文本论述,被用于支撑交易行为异质性及市场操控假设。


表II:各订单类型稳态分布
- 添加($A B,A A$)和删除($D B,D A$)订单长期占比超过95%,执行类型仅占4%以内,显示大部分订单为非真实成交,意图制造市场流动性假象。
- 高波动日执行订单稳态概率略高,暗示此时市场活跃度和真实成交增加。
表III:订单类型均值重现时间(MRT)
- 添加和删除订单的MRT较短,重复频繁;充分反映订单操作密集。
- 金融板块执行订单MRT高,暗示完整交易发生较分散,支持市场悉听尊便、价格稳健观点。
表IV及图3:谱隙、松弛时间及熵率分析
- 各行业高低波动日差异不大,均表明订单转移向稳态分布收敛的速度相似。
- 金融板块谱隙较小,说明状态依赖性强、记忆长,交易行为更连贯。
- 熵率约为最大值的60%,表示订单序列的随机性与不可预测性适中,交易策略整体上稳定。

---
4. 估值与模型分析
本研究未涉及传统市盈率估值或现金流折现等财务估值方法,研究核心集中于订单序列的统计建模与市场行为动态解读,估值重点在于DTMC模型的适用性与内在稳定性验证。
- 转移概率矩阵由MLE方法估计,确保参数最大似然估计合理性。
- 马尔可夫性质经卡方检验强支持,确认模型假设有效。
- 一阶时间齐次假设简化参数估计,且被数据支持。
---
5. 风险因素评估
报告明确指出:
- 市场存在活跃操纵行为风险,表现为高频添加与撤销限价单(虚假订单制造假象)。
- 高频交易活跃增加市场不确定性,尤其在高波动日表现明显。
- 不同类型交易者的同时存在(经验丰富与噪声交易者)可能引发市场非理性波动。
风险潜在影响包括市场流动性虚假、投资者误判导致损失等,报告未具体提出缓解策略,但建议投资者关注行业韧性(如金融板块)并识别操控迹象。
---
6. 审慎视角与潜在局限
- 马尔可夫模型假设状态转移仅依赖当前状态,忽视更高阶历史依赖,可能简化了复杂交易行为。
- 时间齐次假设可能低估市场结构在不同时间段的状态转移差异。
- 高频交易数据极大,但研究仅选取18只股票样本,尽管覆盖6行业,样本代表性仍有待提升。
- 虚假订单识别基于转移概率和删除行为推断,需结合其他市场监测工具以验证操纵行为,存在解释偏差风险。
- 未涉及订单规模、交易量等重要维度,未来研究可丰富模型复杂度。
---
7. 结论性综合
本报告通过一阶时间齐次离散时间马尔可夫链模型,结合高频股票订单数据(10类状态),深入剖析了中美贸易战期间六大行业在高低波动日的订单转换动态。
- 订单转换符合马尔可夫性质,模型统计显著且合理。
- 高频波动日特征为
- 增加订单后随即删除订单概率显著上升,提示市场操纵可能。
- 完全成交订单后迅速跟随添加订单概率增加,显示高频活跃交易。
- 订单自循环概率降低,订单类型多样,交易者行为复杂。
- 金融与银行行业展现出独特的高自循环执行订单概率和高MRT值,反映其市场韧性与投资价值。
- 谱隙和熵率分析表明不同波动条件下订单动态趋于稳定并且高度随机但相似,暗示交易策略的连续性和一致性。
- 本研究为理解极端宏观经济事件期间的订单流动和交易行为提供了科学量化工具和数据支持,对于高频交易策略设计、风险管控与市场监管具有重要启示价值。
报告强调市场操纵风险依然存在,提醒投资者理性决策,同时推荐关注抗压行业以规避系统风险。未来研究可扩展至其他极端事件和更广泛样本,丰富模型复杂性(如更高阶马尔可夫链、订单规模分析)以提升分析深度。
---
溯源页码:[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13]
---
备注:
此分析报告结构紧凑、论据充分、定量严谨,深刻揭示了高频股市订单的复杂转移机制和宏观经济事件的影响,为交易决策和市场行为理解提供了宝贵方法论。