`

【广发金工】2024精选深度报告系列之十一:订单维度解耦的22个长短单因子

创建于 更新于

摘要

本报告基于海量Level 2逐笔订单数据,创新构建22个长短单因子,通过成交完成时间区分订单为长单和短单,并利用订单维度解耦方法提炼有效因子组合。精选长短单因子组合在2021-2023年多市场板块测试中表现优异,展示了较高的RankIC、年化收益率及夏普比率,显著优于基准指数,体现了基于高频订单数据挖掘的量化因子优势,为A股量化策略提供新的视角和工具[page::0][page::2][page::8][page::14]。

速读内容

  • Level 1与Level 2数据对比与特征:Level 1为3秒一笔快照,数据相对简单;Level 2包含更丰富快照及精确毫秒级逐笔订单数据,是挖掘有效因子的关键数据源。[page::1][page::2]

- 长短单因子定义:基于订单实际成交完成时间统计,按照成交时长均值加多倍标准差界定长单,构建了多种长买单、长卖单及组合因子,长短单因子包含丰富交易信息且相互线性相关,无需额外短单因子构建。[page::2][page::3]
  • 因子表现回测(5日与20日换仓):

- 长单占比中的LongBuySell1p0表现最佳,RankIC均值最高可达11.7%,年化收益率约22%,夏普比率达到1.49,最大回撤较低。
- 因子平滑处理提升了部分风险指标但略微降低了收益性指标。

| 因子名 | RankIC均值 | 胜率 | 多头年化收益率 | 最大回撤率 | 夏普比率 |
|----------------|------------|------|----------------|------------|----------|
| LongBuySell
1p0 | 11.7% | 72% | 21.78% | 6.84% | 1.49 |

[page::3][page::4]
  • 订单维度解耦因子:将长短单细分为4种属性(长买长卖、长买短卖、短买长卖、短买短卖),构建12个复合因子。其表现同样稳健,特别是ShortBuyShortSell1p0因子在多空组合回测中年化收益达到55%以上,表现优异。


| 因子名 | RankIC均值 | 胜率 | 多头年化收益率 | 最大回撤率 | 夏普比率 |
|------------------------|---------------|--------|----------------|------------|----------|
| ShortBuyShortSell1p0 | -11.7% (绝对值) | 28% | 21.65% | 6.79% | 1.49 |

[page::5][page::6][page::7]
  • 精选长短单因子组合构建与实证:

- 采用因子值排序前K名构建Top-K组合,20交易日调仓,双边千三费率。
- 全市场(A股全指)Top-150平均年化收益21.41%,夏普比率1.31,最大回撤18.7%,同期基准为-8.5%。
- 创业板Top-150年化收益21.52%,2023年表现更优,年化收益达25.69%,夏普比率提升至1.76。
- 沪深300Top-50组合年化收益6.61%,夏普比率0.35,超越指数-13.79%表现。
- 中证500、中证800、中证1000等板块因子同样表现稳定,均实现显著超额收益。













[page::7][page::8][page::9][page::10][page::11][page::12][page::13]
  • 风险提示:策略基于历史数据统计建模,市场政策、结构变化可能导致因子失效;量化模型差异或产生不同结论;投资需注意风险控制。[page::1][page::14][page::15]

深度阅读

【广发金工】2024精选深度报告系列之十一


订单维度解耦的22个长短单因子——海量Level 2数据因子挖掘系列(二)



---

1. 元数据与报告概览


  • 报告标题:【广发金工】2024精选深度报告系列之十一:订单维度解耦的22个长短单因子

- 作者/机构:广发证券广发金融工程研究团队
  • 发布日期:2024年9月18日

- 研究主题:基于Level 2逐笔订单数据,构建长短单因子,筛选表现优异因子组合,实证分析这些因子在A股主流板块中的超额收益表现。

核心论点

本报告在广发金工“海量Level 2数据因子挖掘系列”的背景下,利用交易所订单撮合机制中委托订单被拆解完成的不同时间维度现象,构建22个长短单因子,描述委托订单成交完成时长的分布与占比,结合多维度订单维度解耦技术,挖掘出有效的交易信号。进一步挑选优异的长短单因子,构建精选组合,实证回测显示该组合在A股全市场及各主流板块均实现显著的超额收益。报告还强调了基于深度数据和复杂统计方法下的量化研究风险提示。

---

2. 逐章深度解读



2.1 摘要(第0页)


  • 关键观点

1. 在量化投资中,数据的完整收集和深层次数学建模至关重要。
2. 根据“订单成交完成时间”差异,拆解委托订单为长单(成交时间较长)与短单(成交时间较短)。
3. 报告基于此构建22个长短单因子,组成精选因子组合。
4. 采用Top-K选股策略,20交易日换仓,扣除双边万三手续费实测,组合在2021-2023年全市场及主要板块表现均远超对应指数。
  • 量化表现(2021-2023):

- 全市场:RankIC均值13.2%,胜率80.5%,Top-150年化收益21.41%,最大回撤18.70%,夏普比1.31 (同期中证全指为-8.5%)。
- 创业板:同RankIC,胜率80.3%,Top-150年化收益21.52%,最大回撤29.49%,夏普比1.07,2023年单年年化收益达25.69%,最大回撤9.39%,夏普比1.76。
- 沪深300:RankIC10.2%,胜率65.9%,Top-50年化收益6.61%,最大回撤14.87%,夏普比0.35 (同期沪深300-13.79%)。[page::0]

2.2 Level 1与Level 2行情数据介绍(第1-2页)


  • Level 1行情数据为3秒一笔的快照,包含基础的价格、成交量和盘口5档数据信息。

- Level 2行情数据频率一致,但数据结构更丰富,包括10档申买申卖数据,最优买卖价前50笔委托,逐笔订单数据等,且逐笔订单数据是构成其他快照的根本数据。
  • 逐笔订单数据包括每笔订单时间(毫秒级)、价格、数量、买入卖出订单号等详细元素。

- 本报告基于这一高频且详尽的Level 2逐笔订单数据,继承此前基于订单大小维度的94个因子构建,2024年转向对长短单持续时间维度的深入挖掘。

2.3 长短单因子构建(第2-3页)


  • 订单撮合拆解:同一委托可能被拆为多个成交订单,这些拆分订单成交时间各异。

- 将成交订单成交完成时长统计后,定义长单阈值为“当日成交完成时间均值 + N 倍标准差”:
- 长单比例约15.8% (N=1.0),6.7% (N=1.5),2.3% (N=2.0)。
  • 构建6个最基础长单占比因子(长买单和长卖单分别对应三个阈值),加上长买+长卖的组合因子,形成9个因子,其中长单因子与短单因子线性相关,不需额外构建短单比因子。


2.4 因子实证效果(表2-5,第4页)


  • 回测采用不同换仓周期(5日/20日)、是否平滑处理,均显示长买长卖因子表现优异。

- 5日换仓时,LongBuySell1p0因子多头年化收益约22.63%,夏普比率接近1.27,最大回撤约16%。
  • 20日换仓长短单因子表现更加稳定,LongBuySell1p0因子表现最佳,年化收益率逼近23%,最大回撤10%以内,夏普高达1.54。

- 多空组合表现更佳,年化收益可达37%至55%,夏普比也显著高于多头。
  • 因子平滑虽略降收益,但有助于降低最大回撤,整体表现稳健。[page::3, page::4]


2.5 订单维度解耦长短单因子(第5-7页)


  • 长短单因子进一步从订单买卖方向解耦,分为四类:

- 长买单长卖单
- 长买单短卖单
- 短买单长卖单
- 短买单短卖单
  • 共计12个解耦后的因子,通过细分长短单属性,挖掘更为精准的交易信息。

- 表6-9显示在不同换仓周期、平滑与否条件下,LongBuyShortSell1p0、ShortBuyLongSell1p0、ShortBuyShortSell1p0因子表现优异。
  • ShortBuyShortSell1p0因子表现特别显著:

- 5日换仓多头年化收益22.53%,夏普比1.27
- 多空组合年化收益55%,夏普比3.78
- 20日换仓多头年化收益23%,夏普比1.53
- 多空组合年化收益近38%,夏普比2.31
  • 解耦因子具有良好的可操作性及超额收益能力。


2.6 精选长短单因子组合实证(第7-13页)


  • 采用因子值排序,前K个股票构建Top-K组合,20日换仓,双边万三交易成本,回测2021-2023年。

- 多板块覆盖:
- 全市场:Top-150组合年化21.41%,最大回撤18.7%,夏普比率1.31,远超同期中证全指-8.5%。
- 创业板:Top-150组合表现优异,2023年单年年化收益达25.69%,最大回撤低至9.39%,夏普比1.76,对应创业板综指同期-5.39%。
- 沪深300:Top-50组合年化6.61%,最大回撤14.87%,夏普比0.35,明显跑赢-13.79%同期沪深300指数。
- 中证500、中证800、中证1000:均实现正向年化收益率(约7%-11%),同时超额收益显著。
  • 各板块因子胜率在65%-80%之间,RankIC稳健,组合换手率适中(一般60%-80%之间),夏普及信息比率均表现积极。

- 净值走势图表(图2-7)清晰反映出组合在不同股票池的持续上升趋势,明显优于对应指数。

---

3. 图表深度解读



图1:高斯分布示意(第3页)



高斯分布
  • 说明了使用成交完成时间服从正态分布的假设,根据均值和标准差定义长短单阈值。

- 数据分布的尾部阈值(+1σ、+1.5σ、+2σ)对应不同长单比例,支持构建多重阈值因子的逻辑。

表2~表5:长单占比因子不同换仓周期及平滑处理回测表现(第4页)


  • 明确揭示了不同长短单因子及组合因子(LongBuy、LongSell、LongBuySell)在5日/20日换仓下的RankIC均值、胜率、年化收益和风险指标。

- LongBuySell1p0表现最优,20日换仓最大回撤较低,夏普比优于5日换仓,表明相对中长期换仓周期更适合因子运用。

表6~表9:订单维度解耦长短单占比因子表现(第6-7页)


  • 解耦后的12个因子展示了多头、多空组合下的性能差异。

- ShortBuy
ShortSell_1p0为负相关因子,表现卓越,值得策略重点关注。
  • 因子平滑后,整体波动和最大回撤有所下降,表现更加稳健。


图2-7 & 表10-15:精选因子组合净值表现及分年度统计(第8-13页)


  • 净值图展示不同Top-K组合在各个板块连续上涨的趋势,优于对标指数显著。

- 各板块年度统计表详细披露了年化收益率、最大回撤、换手率、波动率、夏普比率和信息比率,充分量化组合风险收益特征。
  • 组合换手率和波动率适中,回撤控制较好,反映出因子组合的良好实用性和风险控制能力。


---

4. 估值分析



本报告主要为量化因子研究,不涉及直接的公司估值分析,因此无额外DCF或市盈率等传统估值方法。但通过因子回测的RankIC、胜率、年化收益率等量化指标,衡量因子投资价值与组合表现。

---

5. 风险因素评估(第1页、第14-15页)


  • 政策及市场环境变化风险:量化模型基于历史数据统计,未来政策调整或市场微观结构改变可能导致模型失效。

- 市场结构与交易行为变动风险:市场行为模式突变下,所构建因子或策略的有效性可能衰减。
  • 模型差异风险:不同量化模型、参数选择和数据源可能产生不同结论,投资者不应盲目套用报告结论。

- 报告未提供明确的缓解策略,但明确指出风险因素,建议读者审慎对待,结合多重分析及动态监控制定策略。[page::1, page::14, page::15]

---

6. 批判性视角与细微差别


  • 事实基础扎实:报告依托丰富的Level 2数据和精细的拆解技术,创新性地利用“成交完成时间”维度对订单进行长短单分类,扩展了量化因子的构建思路。

- 模型假设谨慎:采用高斯分布假设虽合理,但实务中订单时间分布可能受到极端事件和市场微结构等影响,导致非正态分布,潜在偏差未详述。
  • 因子独立性:长单占比因子与短单因子高度线性相关,报告合理选择使用长单因子替代短单因子,避免冗余。

- 策略交易成本考虑:考虑到双边万三的手续费,实测结果仍显著强于基准,提升实证的说服力。
  • 风险提示充分:模型依赖历史数据有效,可能存在失效风险,符合量化策略的常见限制。

- 表格中部分多空组合及平滑因子数据稍显复杂,部分文字段落存在OCR错误及排版瑕疵,影响理解,但整体数据趋势和结论明确。
  • 不涉及宏观因素或行业基本面分析,建议结合宏观及行业视角进一步增强策略稳健性。


---

7. 结论性综合



本报告以广发金融工程研究中心独家获得的Level 2高频逐笔订单数据为基础,创新提出基于订单“成交完成时间”维度的长短单因子,结合订单维度的多维度解耦方法,构建出22个强有效因子。进一步筛选出表现最优的长短单因子组合,采用Top-K选股策略和合理换仓周期,在2021-2023年期间,对A股全市场及创业板、沪深300、中证500、800、1000等主要板块进行严格回测,均取得超越同期大盘指数的显著超额收益。

实证数据充分支持该因子组合的强预测能力和交易实用性:
  • 因子RankIC均值高达10%-13%,胜率稳定在65%-80%;

- 年化收益率普遍显著正向,最高超过21%(全市场Top-150);
  • 最大回撤得到合理控制,多空组合的夏普比率表现尤其优秀,超过3.0,显示风险调整收益优异;

- 换手率在合理范围,手续费考量已纳入,提升了策略现实可行性。

该系列研究展现了Level 2数据在构建高频量化因子上的巨大潜力,再次印证深度数据解耦分析结合高效交易策略的应用价值。同时,报告清晰揭示在结构性风险、市场行为变迁等外部环境下模型潜在失效风险,提醒投资者谨慎决策,动态跟踪模型表现。

综上,本报告不仅提供了极具创新性和实效性的长短单因子模型框架,也为量化投资者在A股市场中捕捉超额收益提供了重要路径,具备较高的参考和应用价值。

---

主要引用溯源


  • 因子定义与基本数据特征分析见第0-3页;

- 长短单因子回测与表现详见第4-7页表2-9;
  • 精选四大板块回测表现及净值图详细统计见第8-13页(图2-7,表10-15);

- 风险提示与模型局限性见第1、14、15页。

---

感谢您阅读本报告的详尽分析,如需进一步具体解读或策略落地辅助,请联系广发金融工程研究中心。

[page::0, page::1, page::2, page::3, page::4, page::5, page::6, page::7, page::8, page::9, page::10, page::11, page::12, page::13, page::14, page::15]

报告