基于委托订单数据的 alpha 因子
创建于 更新于
摘要
本报告基于深交所逐笔委托订单数据,构建并分析了五个alpha因子:盘前撤单比例、早盘买卖单大小比、订单绝对价格分歧程度、订单相对价格分歧程度及改进APB因子。研究表明盘前撤单比例与未来收益负相关,早盘买卖单大小比能够反映大资金买卖意图,订单价格分歧程度体现投资者对价格的分歧影响了短期走势,改进APB因子在捕捉低价买入压力方面较原因子效果提升显著。因子回测覆盖深交所样本,分组多空收益稳健,且部分因子信息独立于市值、波动等传统因子,为A股量化选股提供有效工具 [page::0][page::3][page::4][page::5][page::7][page::9][page::14].
速读内容
逐笔委托订单数据特性及样本说明 [page::2]
- 深交所逐笔委托数据最早可追溯至2012年下半年,上交所2021年5月开始提供相关数据。
- 研究主要基于深交所样本,取交易区间2012-12-31至2021-06-30。
- 逐笔委托数据包含订单时间、委托价格、委托量、买卖方向等字段,基本可重现交易过程。
盘前撤单比例因子定义与表现 [page::3][page::4][page::5]
- 以开盘集合竞价第一阶段(9:15-9:20)撤单比例均值作为因子,反映“镰刀”行为。
- 在中证全指深市样本中,因子原始值和行业市值中性后的RankIC均大于4%,表现持续稳定。
- 分组对冲年化收益由G0组的-4%到G9组的6%,因子收益单调且多空组合净值呈持续上涨趋势。



早盘买卖单大小比因子构建及回测效果 [page::5][page::6]
- 以早盘买入订单量与卖出订单量的对数比率均值作为因子,刻画资金雄厚投资者的买卖动向。
- 原始因子在沪深300样本中RankIC最高达6.92%,行业市值中性化后表现仍佳。
- 多空组合收益与撤单比例类似,呈显著正收益,最大回撤明显小于撤单比例因子。



订单价格分歧程度因子定义及表现 [page::7][page::8]
- 通过订单委托价格的加权对数价格计算波动反映投资者对股票价值分歧。
- 绝对价格分歧程度因子多头收益和空头收益均显著,分组年化收益最高超过20%。
- 订单相对价格分歧程度因子表现略逊,相关性较低但信息更独立。
| 样本空间 | 绝对价格分歧RankIC | 行业市值中性RankIC | 多空月收益 | 夏普率 | 最大回撤 |
|---------|------------------------|--------------------------|------------|---------|----------|
| 中证全指 | -7.92% | -7.01% | 20.81% | 1.95 | -14.99% |
| 沪深300 | -7.40% | -3.97% | 7.74% | 0.74 | -22.65% |




订单数据改进的APB因子构建与回测 [page::9][page::10]
- 将APB因子中成交量加权价格替换为买入委托量加权的平均价格,更直接反映买入压力。
- 改进APB因子相较原APB因子提升超过1%的RankIC,且多空组合收益更稳定。
- 分组表现显示Top组合收益明显提升,改进后因子在近几年多空组合净值表现稳定。
| 样本空间 | 原APB RankIC | 改进APB RankIC | 改进APB 多空月收益 | 夏普率 | 最大回撤 |
|---------|--------------|----------------|--------------------|--------|----------|
| 中证全指 | 5.29% | 6.66% | 22.76% | 2.31 | -20.83% |
| 沪深300 | 5.09% | 6.90% | 11.99% | 1.06 | -23.62% |






因子相关性分析 [page::11][page::12][page::13]
- 订单因子整体与传统大类因子相关性低,早盘买卖单大小比与反转因子负相关显著。
- 盘前撤单比例与非流动性因素有一定相关性,改进APB相较原APB提供了明显信息增量。
- 订单相对价格分歧程度与其他量价因子相关性较低,信息更独立。
- 双变量分层后部分因子多空组合月均回报率提升,显示因子互补性良好。
风险提示 [page::0][page::14]
- 量化模型存在失效风险,极端市场环境或未来制度变化可能冲击因子表现。
- 深交所数据特征在上交所适用性存在不确定性,需谨慎推广。
深度阅读
《基于委托订单数据的 alpha 因子》详尽分析报告
---
一、元数据与报告概览
- 报告标题:《基于委托订单数据的 alpha 因子》(因子选股系列之七十六)
- 发布时间:2021年7月22日
- 作者及机构:东方证券研究所,证券分析师朱剑涛、王星星
- 研究主题:以A股市场的逐笔委托订单数据为核心,通过构建多种新型alpha因子,探讨这些因子的选股效力及其潜在投资价值,主要聚焦深交所数据,以期对沪深两市股票构建覆盖全市场的alpha因子体系。
- 核心论点:
- 逐笔委托订单数据几乎涵盖股票交易的全部市场层面信息,能够重现交易过程,具有极高的研究价值。
- 通过盘前撤单比例、早盘买卖单大小比、订单价格分歧程度等因素,揭示投资者行为及其与未来收益的关联。
- 基于买入订单的委托数据对原有PRB因子(买卖压力因子)进行改进,显著提升了因子表现。
- 构建的多个alpha因子表现稳健且信息独立,可以补充目前常用因子体系。
- 风险提示:
- 量化模型存在失效风险。
- 极端市场环境可能大幅冲击模型表现。
- 深交所规律在上交所的适用性不确定。
总体上,报告旨在利用高频订单数据挖掘投资信号,为量化投资提供新工具,推动市场因子研究前沿发展。[page::0,14]
---
二、详细章节解读
2.1 数据说明
- 本报告基于A股L2级别行情数据中的逐笔委托数据,这类数据涵盖了投资者以何时、何价、何量发出买卖委托,包括委托新增、撤回的完整时间戳,能够理论上重现撮合成交全过程。
- 上交所与深交所数据差异:两者的数据字段含义、订单类型定义存在差异,例如市价单在上交所通过“剩余撤单”或“剩余转限价”间接表现;深交所则直接标注订单类型。因数据的时长覆盖不同,深交所数据可追溯至2012下半年,上交所则自2021年5月起提供。
- 本报告因子测试仅以深交所股票为主,样本期为2012年12月31日至2021年6月30日。
- 数据字段涵盖证券代码、订单日期、时间、订单号、订单量、价格、委托类型以及买卖方向[page::2]
---
二、盘前撤单比例因子
- 定义:
- 盘前集合竞价的第一阶段(9:15–9:20)允许对挂单自由撤销,投资者可通过观察挂单撤回情况推断对手盘挂单价量。
- 盘前撤单比例定义为该阶段撤单订单占挂单总量的比例,报告用过去20个交易日均值作为因子数值。
- 逻辑:
- 高撤单比例被视为“镰刀”效应的衡量,反映市场投机或操纵倾向,盘前撤单比例越高,股票未来表现平均越差。
- 因子测试表现:
- 在中证全指及多样样本空间,因子原始值和行业市值中性化后的RankIC均显著为负,均在4%左右区间,表明撤单比例与未来收益呈负相关。
- 多空组合的月度收益分布呈明显梯度,撤单比例高的组别收益最低。
- 时间序列表现稳定,长期有效,但近期波动有所增加。
- 示意图:
- 图2显示了常见指数成分股中深交所股票的年均数量,确保样本空间广泛。
- 图3表盘前撤单比例在不同指数样本内的表现数据表,显示RankIC与多空收益等关键统计数据。
- 图4-5分别展示多空组合收益分组柱状图、月度RankIC走势及净值和回撤情况,验证因子强劲但存在时点波动风险。
总结:盘前撤单比例是辨别短期市场投机和潜在操纵的有效信号,且与未来低收益存在稳定负相关关系,适合用于量化选股模型中剔除风险较高股票。[page::3,4,5]
---
三、早盘买卖单大小比因子
- 定义:
- 早盘半小时内订单反映了夜间信息释放后的市场反应。
- 该因子计算早盘买入订单量与卖出订单量的比值,且采用对数方式调整后,过去20日均值作为因子标准。
- 规避了交易主动买卖方向划分的争议,直接用订单买卖方向数量刻画资金流向。
- 逻辑:
- 大资金在早盘的买卖方向可以指示后市股价走势,买单占优的股票后续表现更优。
- 因子表现:
- 在沪深300等多个样本空间均显示正向表征,因子值高对应未来收益更高。
- 市值大盘表现尤为明显,且时间序列在特定阶段(2016~2017、2019~2020)表现更优。
- 图示说明:
- 图5为样本空间汇总表,RankIC达~4-7%且t值显著,月度收益良好。
- 图6分组收益柱状图、月度RankIC和多空净值曲线展示了因子选股效力,高买入组收益最高、多空组合稳健增长。
总结:早盘买卖单大小比因子提供了资金动向信号,能够捕捉市场情绪转向和大资金意图,因子效果稳定且具有理论逻辑支持。[page::5,6]
---
四、订单价格分歧程度因子
- 定义:
- 投资者委托价格反映投资价值认知。
- 价格分歧度通过对订单价格的加权对数方差计算,既有绝对价格分歧(订单价格对比平均水平),也有相对价格分歧(订单价格相对于当时最近成交价的对数偏差)。
- 过去20交易日平均值作为因子。
- 逻辑:
- 代表投资者对股票价值判断的分歧程度。
- 高分歧度往往导致短期股价高估,缺乏做空机制时股价高估更显著,未来收益率倾向较低。
- 因子表现:
- 两类价格分歧度因子均呈现显著负向预测能力,在沪深300及多个样本空间均有效。
- 分组中空头端收益更显著,但多头端仍有一定正收益。
- 订单相对价格分歧度与绝对价格分歧度相比,在相关性上较低,更加独立。
- 图表解读:
- 图7、图8为两个因子的样本表现统计表,数据呈现RankIC在-4%至-8%区间,ICIR和t值均显著负向。
- 相关分组收益柱状图显示明显的收益差异,多空组合净值曲线反映结构稳定但波动加大。
- 图9-10展示月度RankIC波动与组合收益,显示因子稳定的统计意义。
总结:订单价格分歧程度因子有效体现市场短期过度投机现象,具有显著的未来收益负预测力,为风险控制因子提供重要线索。[page::7,8]
---
五、订单数据改进的APB因子
- 背景及定义:
- 原APB因子基于成交量加权价格与成交价格加权价格的比值,用于度量买卖压力。
- 本报告创新地用买入订单委托量加权的平均“最新成交价格”(订单新增时点价格)替代成交量加权价格,形成改进后的APB因子。
- 过去20交易日均值作为因子数值。
- 逻辑:
- 在价格低位时,买入订单较多表明买入压力较大,预示未来股票表现较好。
- 因子表现:
- 改进APB因子的RankIC在所有样本空间均优于原APB,提升了超过1个百分点。
- 分组收益更为显著,尤其是多头端表现出更稳定和持续的正收益。
- 时间序列显示改进后的APB因子在原APB因子波动和回撤期保持稳健表现。
- 图示说明:
- 图11、图12分别为原始和改进APB因子在各样本的表现对比数据表。
- 图13、图14为改进后因子的分组收益和组合走势,均显示优于原有因子。
总结:订单数据改进的APB因子有效捕捉买卖压力,增强了因子的稳定性和选股能力,是订单数据深度利用的重要成果。[page::9,10]
---
六、因子相关性分析
6.1 与常见大类因子相关性
- 定义的订单相关因子变量为L2F0至L2F4,分别代表盘前撤单比例、早盘买卖单大小比、订单绝对价格分歧程度、订单相对价格分歧程度、改进的APB因子。
- 相关性分析结果:
- 多数订单相关因子与传统因子(如价值、成长、流动性、反转等)Spearman值均较低,尤其早盘买卖单大小比(L2F1)与反转高度负相关(-39.6%),表明两者捕捉不同的风险因子或市场特征。
- 盘前撤单比例和订单绝对价格分歧度与投机类指标(如波动、换手)相关性较高,指示存在信息重叠。
- 两两分层分析进一步验证了订单因子显著提升了传统大类因子的选股收益。
- 图15、16详细展示了因子与大类因子在因子值和收益(RankIC)统计量上的相关关系及分层分析结果。
6.2 与常见量价因子相关性
- 分析涵盖日内量价因子,如成交量、换手率、波动率、价格跳跃指标等。
- 发现早盘买卖单大小比(L2F1)和订单相对价格分歧程度(L2F3)与常见量价因子相关性均低于15%,且部分呈负相关,信息更加独立。
- 改进APB因子与原APB高度相关,但改进版本仍带有明显的信息增量。
- 图17至图20详细展示相关系数和因子双因子分层后的月度选股绩效。
总结:5个订单因子在与传统量价大类因子及因子体系的相关性普遍较低,证实其信息独立性及补充价值,且部分因子因低相关性体现出极好的组合优化潜能。[page::11,12,13]
---
七、总结与结论
- 逐笔委托订单数据作为高频市场信息几乎覆盖交易全流程,利用其构建alpha因子具有理论及实践重要性。
- 基于盘前撤单比例量度的“镰刀”效应因子与未来收益负相关,具有风险提示意义。
- 早盘买卖单大小比因子有效捕捉大资金买卖意图,正向预测未来收益,尤其在大市值股票中更为明显。
- 订单价格分歧程度反映了投资者认知的异质性,高分歧度导致短期股价高估,负向影响收益。
- 基于订单数据改进的APB因子明显优于传统版本,性能稳定,能更好刻画买卖压力。
- 相关性分析显示这些因子信息独立且对现有因子体系产生有力补充,具备实践运用价值。
- 风险仍然存在,特别是模型在极端环境下可能失效,同时基于深交所数据,规则在沪市适用性待验证。[page::14]
---
三、图表解读
- 图2(深交所成分股年度平均数量柱状图)
此图反映了不同指数(如中证全指、中证800、沪深300等)对应的深交所股票年均数量,持续增长趋势说明研究样本空间不断扩大,为后续因子测试提供数据支撑和统计稳定性。[page::3]
- 图3(盘前撤单比例 因子表现统计表)
表中展示了不同样本空间的RankIC、ICIR、t值、多空月收益、夏普率、最大回撤等关键指标。原始因子和行业市值中性化因子均表现出稳定负相关关系,支持撤单比例为负因子假设,最大回撤较小显示波动控制良好。[page::4]
- 图4-5(盘前撤单比例 多空分组年化收益及组合净值)
分组收益图表明因子值较高组收益最低,多空对冲表现良好;净值曲线平稳上升,回撤有限,因子具有实战应用潜力。[page::4,5]
- 图5-6(早盘买卖单大小比表现)
指标统计表和分组收益柱状图显示早盘买单占优的股票表现更佳,因子在沪深300表现尤为突出。净值曲线持续上升,表明因子长期稳定有效。[page::6]
- 图7-10(订单价格分歧程度表现)
包括绝对价格分歧和相对价格分歧。均显示显著负相关,分组表现良好,风险信息敏感。[page::8]
- 图11-14(原始与改进APB 因子对比)
改进后APB在所有统计指标上均优于原始APB,尤其多空收益更稳定、最大回撤降低,展示新因子增强版的实用价值。[page::10]
- 图15-20(相关性分析表格与分层)
详细列举了订单因子与传统价值、成长、流动性、反转、投机、分析师预期等大类因子的相关性,以及与量价因子的相关性和双因子分层后的月均收益,验证因子独立性与增量信息的挖掘效果。[page::11,12,13]
---
四、估值分析
本报告作为因子研究类分析,未涉及个股估值模型和目标价制定,重点在alpha因子构建与检验。因子以RankIC、多空分组收益和夏普率等统计量衡量选股能力,后续投资组合构建采用行业和市值中性化处理,保证因子表现的稳健性和独立性。
---
五、风险因素评估
- 量化模型失效风险:模型基于历史数据,有可能在未来不同市场环境中失效或效果大幅下降。
- 市场极端环境冲击:如剧烈波动、流动性枯竭等极端情况,可能引发因子失灵或风险暴露。
- 深交所与上交所适用性差异:研究主要基于深交所数据,上交所结构差异可能导致因子效果无法直接迁移。
- 数据偏差及样本限制:虽然逐笔委托数据精细,但因数据采集误差可能带来偏差,且上交所数据时间跨度短限制覆盖面。
报告中未提出具体减缓策略,但提醒投资者警惕因子失败风险并持续跟踪模型表现。[page::0,14]
---
六、批判性视角与细微差别
- 报告采用了当前可获得的最细粒度市场数据,理论严密且设计合理,但仍依赖多种假设:
- 逐笔委托数据虽然详尽,但因技术与规则差异,模拟撮合过程仍存在偏差。
- 部分因子如盘前撤单比例可解释为“镰刀”率,但具体操纵机制尚未完全验证,解读时应谨慎。
- 早盘买卖单大小比剔除了主动买卖之争论,但对投资者类型划分未深究,可能隐含异质性。
- 价格分歧度因子假设缺乏做空机制导致短期高估,适用范围较窄,极端行情下可能失效。
- 各因子测试依赖深交所数据,尽管可拓展至全A但尚无实证,存在迁移风险。
- 部分图表因符号表达偏差,公式表述不够清晰,可能对复现产生障碍,需结合上下文理解。
- 报告强调因子与传统因子低相关性,但未来多因子模型的优化整合效果及稳定性尚无深入探讨。
综上,报告在现有研究框架内扎实展开,但未来仍需基于更多市场环境下的动态测试及策略回测验证稳定性和普适性。
---
七、结论性综合
本报告系统挖掘了A股市场逐笔委托订单数据中的多项核心信息,构建了五个关键alpha因子:
1)盘前撤单比例因子,反映集合竞价阶段的撤单行为,负向映射未来收益,揭示短期投机和操纵风险。
2)早盘买卖单大小比因子,表征大资金早盘买卖方向,正向预测股票表现,具备资金面引导效果。
3)订单绝对及相对价格分歧程度因子,度量投资者价格认知差异,高分歧度预示股价短期高估和后续收益下降。
4)订单数据改进的APB因子,有效提升了原APB因子的表现,更精准地刻画低位买入压力与未来收益的正向联系。
5)因子相关性分析表明这些订单相关因子与传统以及量价因子具有较低相关性,信息独立性强,具备明显增量价值。
整体因子在深交所股票样本中表现稳定,均实现了较好的选股能力和风险调整后收益。尤其是改进APB和早盘买卖单大小比因子,在多个维度均展现出优异的统计性质。
报告充分利用逐笔委托订单的细节数据,创新性挖掘出市场微观结构信息对投资风格及未来收益的影响,提供了新颖且有效的量化选股视角。
同时,报告亦明确指出模型存在市场极端冲击风险及沪深两市数据结构不同导致的适用差异,建议投资者审慎使用并动态跟踪模型效能。
综上,报告突破传统因子研究框架,借助高频委托订单数据为A股量化因子库注入了新的活力和潜力,具备较高的理论价值和应用前景。[page::0-14]
---
参考图示摘要(部分重要图表示意)
-

-

---
以上为本报告的极致详尽解读与分析,系统呈现了主要内容、章节分解、数据剖析及潜在风险,供专业投资机构和策略研究人员参考。