【广发金工】基于Level 2数据的跳跃因子
创建于 更新于
摘要
本报告基于Level 2逐笔成交数据,构建和分解跳跃相关因子,包括跳跃波动率、累计值和成交额占比,结合跳跃方向和大小进行分类刻画。通过滚动5日与20日平滑处理,月度和周度调仓的实证回测显示,部分因子长期表现稳健,最高因子RANK_IC达到9.89%,多空策略年化收益超40%,且因子内部相关性和与风格因子的联系得到验证。本报告展示了多个绩优跳跃因子及其分年度收益和风险指标,为基于高频数据的选股因子开发提供了实证支持 [page::0][page::5][page::8][page::10][page::20][page::22]。
速读内容
研究背景与数据介绍 [page::0][page::1][page::2]
- 本报告基于股价跳跃—扩散模型,利用Level 2数据中的逐笔订单信息构建跳跃因子,深度挖掘股价跳跃信息对选股的有效性。
- Level 2数据相比Level 1拥有更丰富的快照和逐笔订单数据,支持更细粒度的跳跃因子构建和分析。
跳跃因子构建体系 [page::3][page::4][page::5]
- 跳跃因子主要包括跳跃波动率(如RRJV及其派生因子)、收益累计值(如JSR2drop)、成交额占比和振幅类因子。
- 波动率类因子考虑价格变动正负方向及跳跃大小,且对批量订单价格无变化进行特殊处理。
- 表1~表4详细列示各跳跃因子分类及含义。
实证回测数据与方法 [page::5][page::6]
- 回测区间2020-01-01至2025-07-18,剔除ST、停牌、上市不足一年等股票,采取MAD去极值和Z-Score标准化处理。
- 调仓周期包括月度和周度,滚动窗口平滑5日与20日,交易费用按千分之三计收。
- 因子分为10组进行多空测试,评价指标包含RANKIC、ICIR、IC胜率、年化收益率等。
因子绩效表现汇总 [page::6][page::7][page::8][page::9]
- 波动率类因子RRJV系列表现突出,滚动5日月度平滑下RRJV因子RANKIC最高达8.18%,多空年化收益27.8%,多头费后年化收益19.3%。
- 收益累计值因子JSR2drop表现更佳,RANKIC最高9.89%,多空年化收益22.1%,多头费后年化收益13.1%。
- 振幅因子R
- 月度和周度换仓结果显示,周频换仓时因子IC略下降,但多头收益有边际提升。
绩优跳跃因子分组与年度收益分析示例 — RRJVrolling20 [page::10][page::16]

- 因子IC值大部分为正,IC累计呈上升趋势,表现稳定。
- 分组收益显示前二档累计收益显著高于后档,高换手率反映该因子流动性好。
- 多头净值稳步上升,空头净值表现较弱,多空净值整体呈显著上升趋势。
- 2021年、2023年因子表现尤为突出,夏普比最高达2.05,2025年回升明显,最大回撤控制合理。
其他绩优因子示例
- RRJVNrolling20、JPRrolling20、SRJVrolling20、JNRWrolling20、RABSrolling20、JSR2droprolling20等因子均体现稳定正收益,部分因子夏普比超3,最大回撤均可控。
- 所有绩优因子均呈现不同程度的超额收益,回测均基于严谨的数据预处理和费用假设,兼顾风险和收益平衡。
因子相关性与风格因子关系 [page::20][page::21][page::22]
- 跳跃因子与传统风格因子存在一定相关性,收益累计值跳跃因子与市值和PB估值相关较强,反映高估值与小盘活跃股票的跳跃特性。
- 因子内部相关性较高,波动因子相关性集群明显。归一化处理减少了因子间的相关度,提高了独立选股能力。
结论与风险提示 [page::0][page::22]
- 跳跃因子利用Level 2高频数据深度挖掘股价跳跃对收益的预测作用,实证结果表明多个因子具有稳定的选股能力和良好的回测风险收益表现。
- 策略在市场结构、政策及交易行为变化时存在失效风险,投资者需持续关注市场环境变化和因子表现稳定性。
- 本报告为基于高频跳跃因子的量化选股提供系统性构建框架和性能验证,有助于推动量化投资研究深化和实务应用。
深度阅读
【广发金工】基于Level 2数据的跳跃因子 —— 深度分析报告解构
---
一、元数据与概览
- 报告标题:《基于Level 2数据的跳跃因子》
- 作者及团队:张钰东(广发证券资深金工分析师)、安宁宁(广发证券首席金工分析师)、陈原文(广发证券资深金工分析师)
- 发布机构:广发证券金融工程研究中心
- 发布日期:2025年8月15日
- 主题:利用深度且高频的Level 2市场数据,构建并测试股价跳跃相关因子,包括跳跃波动率、跳跃累计值、跳跃成交活跃度等,探讨这些因子在选股策略中的表现与效果。
核心论点:基于Level 2的逐笔成交订单数据,结合跳跃-扩散股价模型的学术理论,构造多维跳跃因子。经系统回测,跳跃因子在不同换仓频率(周频、月频)下均表现出正向预测能力和较好的选股效果,部分因子IC值显著,且多空策略回撤风险可控。报告强调跳跃因子可揭示价格波动中的非连续信息冲击,对捕捉市场短期涨跌动能具有重要价值。[page::0,1]
---
二、逐节深度解读
1. 研究背景
报告指出,量化投资者依赖于海量市场数据和数学模型发掘价差规律。传统基于Level 1快照数据的研究较浅,而Level 2数据凭借其更详尽的十档深度和逐笔成交信息,提供了微观粒度下的市场动态分析可能。本报告继承此前基于跳跃-扩散模型的学术成果,利用Level 2深入刻画股价跳跃,力图发掘具备超额收益的跳跃相关因子。
2. Level 1与Level 2行情数据介绍
报告详述了两类数据的区别:
- Level 1数据:3秒一笔的快照数据(最高、最低、开收盘价,5档买卖挂单量等),信息量有限。
- Level 2数据:更精细的快照(10档买卖价量、50笔最佳委托)、且包含连续当天逐笔订单数据,时间精度毫秒级。这些逐笔订单数据记录订单序号、价格、数量、买卖标志、撤单信息等,是所有快照数据的基础。
表1清晰展示两者数据内容对比,凸显Level 2数据对交易行为研究的关键价值。[page::1,2]
---
3. 跳跃因子研究理论基础
报告基于几何布朗运动带跳跃模型描述股价动态:
\[
dpt = \mut dt + \sigmat dWt + Jt dqt
\]
各项分别代表漂移、连续扩散波动及跳跃冲击。用高频数据计算的已实现方差$RVt$可拆分成连续部分(积分波动率$IVt$)和跳跃部分(跳跃波动$QJt$)。多阶变差估计法辅助有效推断积分波动率,进而得到跳跃分量。
此外,引用Zhou和Zhu(2011)、Jiang和Zhu(2017)关于累计绝对跳跃收益作为信息冲击代理的研究,强化了跳跃因子对短期价格动能的解释力。
这一理论推动报告构建跳跃波动率和跳跃累计收益两个核心因子类别。[page::2,3]
---
4. 跳跃因子构建细节
(一)跳跃波动率因子
定义跳跃波动率因子$RJVt = \max(RVt - \hat{IV}t, 0)$作为跳跃波动的代理,进一步细分为:
- 正跳跃波动与负跳跃波动(反映涨跌波动不对称性)
- 大小跳跃波动(区分跳跃震荡幅度)
- 无实质价格变动的批量订单剔除版(对批量成交的处理影响)
- 归一化处理(对价格波动率相对数值的调整)
表2展示了多种波动类因子名称、含义及参数处理标签,如:RJV、RJVN、RRLJV、RJVP等,覆盖方向、大小和剔重三维维度。[page::3,4]
(二)跳跃累计值因子
基于收益泰勒展开,构造累计收益跳跃因子(JLR,JNR,JPR,JSR等),同样考虑跳跃的正负与大小分类,反映累计跳跃收益的大小效应。
见表3,收益累计类因子指标一览及含义简述。[page::4]
(三)跳跃成交额关联因子
结合跳跃订单成交额占比,统计有跳跃的订单成交额占股票总成交额比重,辅助解释跳跃信息的实际成交活跃度。
表4给出了成交占比和累计振幅类因子基本信息。[page::4,5]
---
5. 实证回测设计与数据处理
- 数据范围:全市场A股,剔除非上市、ST股、涨跌停、上市未满1年等异常样本。
- 因子处理:采用MAD去极值,Z-Score标准化和平滑处理(滚动5日和20日)。
- 回测期:2020年1月至2025年7月。
- 调仓周期:月度和周度换仓,交割价格为调仓日次日均价。
- 交易费用:卖出千分之三。
此处设计符合行业主流量化回测体系标准,合理排除样本污染与极端值,兼顾短中长期表现。[page::5]
---
6. 实证回测结果详解
(一)5日滚动月度换仓
- 波动率类因子IC平均高于5%,归一化因子表现优于原始因子,例如RRJV因子IC达8.18%,ICIR0.68。
- 多空策略年化收益显著,RRJV多空收益27.8%,多头费后收益仍达19.3%。
- 部分因子如RSRJV表现负IC,表明某些波动类相对值因子可能反向或无效。
- 收益累计类因子JSR2drop表现突出:IC达到9.77%,ICIR0.76,多空年化22.1%、多头13.1%。
- 成交占比类因子整体表现平平,振幅因子RABS表现尚可,IC ~9.41%,多空年化25.8%。
- 详见表5、6、7。[page::5,6,7]
(二)5日滚动周度换仓
- 因子IC值整体下降,换仓频率提高导致信号稳定性有所削弱。
- 但多空收益和多头收益边际提升明显,例如RRJV多空年化达48.8%,多头21.6%。
- 收益累计类因子JSR2drop依旧保持较好IC及收益。
- 成交占比因子表现一般甚至负面。
- 详见表8。[page::7]
(三)20日滚动月度 & 周度换仓
- 长期平滑后因子表现与5日滚动一致,波动率类和收益累计类因子均保持较好稳定性。
- 20日滚动的RRJV因子IC在7.50%左右,较5日略有优化,兼顾风险平滑。
- 周度换仓下,多头收益高达28.2%。
- 详见表9、10。[page::8,9]
(四)绩优因子月度及周度表现分析
报告重点展示了包括RRJV、RRJVN、JPR、SRJV、JNRW、RABS等代表性因子在20日滚动月度及周度换仓下的分组收益情况、累积净值、多空策略表现及年份绩效特征。
- IC值波动较大但总体呈现正向趋势,累计IC稳定提升(如RRJV累计IC超5)。
- 因子分组收益呈现明显梯度分化,高组别收益显著优于低组。
- 多头累计净值曲线强劲,空头净值下降,确认因子有效择时能力。
- 年化收益率高峰多出现在2021年、2023年及2025年,夏普比多在1以上,2025年某些因子达到4+,最大回撤可控。
- 图片详情见图1~44及相应表11~21。[page::10~20]
---
7. 相关性分析
- 跳跃收益类因子与市值、PB等风格因子存在一定相关性,反映跳跃现象在小盘和高估值股票中更活跃。
- 因子内部相关性高,尤其是波动类因子之间高度相关,但归一化处理后相关性有所下降,提示标准化操作改变因子特性。
- 表22至24分别展示了因子和风格因子相关性矩阵及内部相关系数,显示收益类因子如JNRW、JPRW间相关性极高(0.9+),而与波动类因子呈负相关。
- 这表明跳跃因子系列存在信息重叠问题,同时不同类型跳跃因子可能互补。
- 此分析有助于组合构建及因子选取决策。[page::20,21]
---
8. 风险提示
报告诚恳指出:
- 模型基于历史数据统计和历时量化测算,未来市场环境或政策变动可能导致策略失效。
- 市场结构与交易行为变更存在不可控风险。
- 结论受限于量化模型及参数假设,不同模型间可能出现差异。
- 投资者应警惕策略非通用性及模型局限。
该部分体现专业审慎态度,提醒用户科学理解因子有效性。[page::22]
---
三、图表深度解读
以RRJV因子为例(2025年8月页10):
- 图1(因子IC曲线):短期IC表现波动显著,但累计IC平稳上升至5%以上,显示因子具持续预测力。
- 图2(分组收益):不同分组累计收益递减,最高分组超过1.5倍收益,且换手率达到80%+,体现高换手活跃择时能力。
- 图3与图4(多头空头累计净值):多头净值长期稳步上升至2.7倍,空头净值萎缩,验证稳定的多空双向盈利可能性。
- 表11(年度绩效):最高夏普比4.49(2025年),最大回撤13.9%,超额收益稳定,反映风险调整后收益出色。
类似表现亦见于多个核心因子(RRJVN, JPR, SRJV等),尽管IC与收益水平差异存在,但均符合统计学显著性格局。降频换仓通常降低IC但多空收益边际提升,揭示换仓频率对策略稳健性的影响。
整体图表精炼支持主要论述,结合实证数据验证跳跃因子的有效性和策略操作价值,呈现了丰富量化研究成果。[page::10~22]
---
四、估值分析
报告未涉及传统估值模型,焦点聚集于股价跳跃因子的效用检验及策略性能评估,对DCF或PE等估值无直接分析,符合金工研究的量化模型性质。
---
五、风险因素评估
详见第八点“风险提示”,明确指出模型可能失效风险、市场结构变动风险及模型间差异,体现了报告对量化因子策略局限的充分认识,提示投资者保持理性。
---
六、批判性视角与细微差别
- 数据与模型依赖性强:研究基于Level 2高频数据和高维统计分解,模型依赖假设如跳跃-扩散,对异常市场波动及结构变迁敏感,可能导致短期因子表现波动。
- 换仓频率权衡:周频策略IC下降,但收益提升,暗示滑点、交易费用和市场冲击成本的平衡尚未深入讨论。
- 因子相关性:因子间高度相关性可能导致实操组合冗余,缺乏多因子融合策略及风格中性调整,未来研究空间广阔。
- 实证区间受限于2020-2025年,特殊年份如2022年多数因子表现疲软,显示市场环境变化对策略绩效影响显著。
- 指标一致性:部分表格存在略微错乱或异常标记(如表中少数符号乱码),但整体不影响核心结论。
- 无宏观和市场情绪因子对比:缺少对传统量化因子(如动量、价值)的交叉验证,因而难以评估独立增益贡献。
- 风险提示中未给出风险概率或缓释策略,建议后续加强此方面的实证研究。
---
七、结论性综合
本报告基于精细Level 2数据,利用跳跃-扩散理论构建了包含多维度跳跃波动率及累计收益的跳跃因子体系。系统回测涵盖五年半的市场数据,使用不同换仓频率和平滑周期评估因子表现,结果显示:
- 跳跃因子普遍表现出显著的预测能力(IC常超5%-9%),其中流水滑点调整后的多空策略年化收益可达20%-40%,多头策略也有稳定正收益;
- 因子分组收益差异明显,展示出强烈的选股能力和风险调整收益优势;
- 跳跃波动率因子和跳跃收益累计因子各具特色,能够捕捉价格非连续波动与信息冲击效应;
- 换仓频率对因子表现显著影响,周频换仓因子IC下降但收益提升,战略执行时需权衡;
- 相关性分析提示因子间信息重叠与市场风格关联,为下一步多因子组合构建提供启示;
- 风险提示涵盖模型失效和市场结构风险,提醒投资应用需谨慎。
图表分析佐证上述结论,核心因子的IC曲线和累计净值均显示长期稳健的预测优势与收益潜力。
总体而言,本报告通过对高频微观市场数据的深入挖掘,有效创新了量化选股因子体系。跳跃因子不仅丰富了波动性和价格行为的理解视角,也为主动投资者提供了科学且实用的工具。
---
参考文献
报告引用与遵循了多个学术权威文献,如Andersen等(2001)关于跳跃-扩散模型的高频波动分解方法,Barndorff和Shephard(2004,2010)的波动率多幂次估计理论,Zhou和Zhu(2011)及Jiang和Zhu(2017)关于跳跃收益对信息冲击的实证等,兼具理论深度与实证功底。[page::2,3]
---
总结
此份《基于Level 2数据的跳跃因子》报告,堪称量化领域采用高频微观市场数据构建跳跃相关因子的系统典范。其方法论严谨,实证体系完备,数据与图表清晰支撑论点,具有较强的策略可行性和投资参考价值。与此同时,报告对模型假设限制和市场风险的认知体现了高度的专业审慎精神。建议在实际应用中注重因子融合与风控动态调整,以实现跳跃因子最大的投资效能。
---
图表示例引用
例如,报告第10页图1为RRJV因子IC值信息:

说明因子IC虽短期波动,但累计IC右轴轨迹稳定上升,验证其有效性。
---
(本分析所引用页码严格对应原文分页,便于溯源核查)[page::0-22]