`

大小单重定标与资金流因子改进——市场微观结构研究系列(16)

创建于 更新于

摘要

本报通过重新划定大单与小单的金额阈值,提出了基于逐笔数据和截面回归剔除涨跌幅影响的MOD修正法,构造资金流改进因子CNIR。结果显示,主力资金划分阈值最优约为2万元,改进因子年化收益达27.86%,信息比率显著提升;资金流Alpha更多来源于主力大单而非小单,且因子在中小盘股票上表现更佳,有效刻画了资金流的微观结构与主力行为特征,为量化选股提供了重要工具 [page::0][page::5][page::8][page::10][page::11][page::16][page::17][page::18][page::19][page::20]

速读内容

  • 大单、小单划分标准的重定标:常规的20万大单标准存在缺陷,金字塔分布显示多数订单金额中位数约1万元,本文利用逐笔数据设定44个阈值进行敏感性测试,发现最优大单划分阈值为约2万元,远低于传统标准,有效性更佳 [page::4][page::9][page::10]

  • MOD修正法提升因子有效性:通过截面回归剔除资金流向(大单买卖金额比)与同期涨跌幅的相关性影响,剥离反转因素,优化资金流因子表现。修正后因子(NIRMOD)多空信息比率(IR)由约2.63提升至4.76,多空收益和回撤表现均优于原始因子 [page::5][page::8]

  • 大单资金流为Alpha主要来源:基于不同阈值,分别测试大单和小单NIRMOD因子表现,大单因子多空年化收益率超过25%,较小单高约4%;小单主要承担流动性供应角色,贡献有限 [page::11]

  • 因子参数敏感性及阈值分域差异:测试显示资金流因子表现呈抛物线形态,低于10万元的阈值内因子有效性增强,约2万元最优;不同选股域划分阈值存在显著差异,大盘股(沪深300、中证500)阈值较高且模糊,小盘股(中证1000及全市场)阈值较低且曲线更平滑,受机构拆单影响 [page::10][page::13][page::14]



  • CNIR因子构建及收益增强:结合Wind超大单、大单、中单合并定义广义主力资金,采用MOD修正法后构造CNIR因子,月度Rank IC及多头净值表现稳定,因子多头年化收益27.86%,信息比率4.91,优于单独NIR和NIR_MOD因子 [page::16][page::17]


  • 因子收益特征和季节性:CNIR因子月度多空收益大致均衡,唯2月表现较弱,存在“二月魔咒”现象,整体胜率高达76%以上;因子在中小盘股中效果最佳,沪深300、中证500表现稍次 [page::18]

  • 因子低相关性和独立Alpha能力:CNIR与常见Barra风格因子及交易行为因子相关性较低,剔除风格因子后年化多头收益依然超过23%,且在扣除交易行为因子后仍保持正收益,显示其独立有效的Alpha来源 [page::19]



  • 持仓及行业配置表现:CNIR因子多头组合中证800持仓数据显示2020年至2021年初偏好大科技,2021年中开始超配大金融,表现出对不同市场周期的适应性;主力资金净流入与公募基金持仓变动呈正相关,体现一定联动性 [page::20]



  • 换手率及调仓频率:CNIR因子持仓换手率整体较低(约70%每20交易日调仓),调仓频率提升可实现更低换手率和更高收益,显示因子适合多种组合管理节奏 [page::21]

  • 主动买卖划分无明显增益:基于逐笔数据划分的主动买卖金额构造的资金流因子相比整体买卖金额构造的因子并未带来额外选股能力,因而本文未采用主动买卖标记的资金流数据 [page::15][page::16]

  • 资金流Alpha的微观结构:资金流Alpha拆解显示信息优势随挂单金额增加而提升,流动性贡献随金额降低而增大,CA融合两者间的博弈形成抛物线形态的因子有效性曲线,反映主力资金与市场流动性的动态博弈关系 [page::12][page::15]


深度阅读

对《大小单重定标与资金流因子改进——市场微观结构研究系列(16)》的详尽分析



---

1. 元数据与概览



报告标题: 大小单重定标与资金流因子改进——市场微观结构研究系列(16)

发布机构: 开源证券研究所

发布日期: 2022年9月4日

研究团队与作者:
首席分析师魏建榕,及分析师张翔、高鹏、傅开波、苏俊豪、胡亮勇、王志豪、盛少成、苏良。

主题:
本报告聚焦于“资金流因子”在中国股市中的改进与微观结构理解,特别是通过逐笔交易数据对大小单进行重定标;并基于资金流的修正方法提升资金流因子的Alpha表现。核心关注点在于深市的大、小单划分标准的优化,以及资金流因子(如NIRMOD、CNIR)的构造及其在不同细分市场上的选股表现。

核心论点与结论:
  • 传统基于绝对金额的资金流划分标准(如20万元大单标准)存在缺陷,通过44个金额阈值的细分发现更低的阈值(约2万元)能更好捕捉资金流Alpha信息。

- MOD修正法剥离了资金流与涨跌幅的价格反转相关性,显著提升资金流因子选股能力。
  • 资金流的Alpha主要来源于主力资金(大单),小单主要提供流动性支持且选股能力弱。

- 融合大单、超大单和中单的广义主力资金构造CNIR因子,综合Alpha表现最优。
  • CNIR因子在小盘股选股上的表现更佳,且与常见的Barra风格因子和交易行为因子关联度低,显示独立Alpha源。

- 风险提示强调因子基于历史数据,未来市场可能发生变化。

---

2. 逐节深度解读



2.1 资金流因子的两个关键点:识别与修正



2.1.1 大、小单的重定标:绝对金额法与相对金额法


  • 关键论点:

- 传统资金流分类多采用绝对金额阈值划分(超大单>100万元,大单20-100万元,中单4-20万元,小单<4万元),但此划分缺乏合理性与简洁性。
- 逐笔成交数据显示,大部分成交金额远低于4万元,且存在机构通过拆单方式隐匿真实大单。挂单金额分布呈畸形的“金字塔”形态(图1),表明传统阈值低估了真正主力资金的阈值。
- 相对金额方法存在逻辑矛盾(同一交易者在高价低价股票的订单被不同对待),因此本报告仍采用绝对金额改进法,基于阈值参数λ在0.5万元至100万元间进行调整。
  • 论据与数据支撑:

- 图1显示2013年至2021年买卖挂单金额各分位变化趋势,中位数约1万元,80%分位挂单金额远低于4万元。
- 图3阐释不同阈值下累计成交金额的均衡分布,44个候选阈值设定详见图示,更灵活捕捉资金行为。
- 数据覆盖度图(图4)显示沪深300数据覆盖度最高,说明在大盘股中逐笔数据样本更充足。
  • 方法流程示意:

- 逐笔数据重构挂单金额,分类每笔订单为大单或小单(图2)。
- 以阈值λ划分,统计分组资金流量。

2.1.2 资金流与涨跌幅的相关性处理:MOD修正法


  • 关键论点:

- 资金流指标(净流入NI,净流入率NIR等)与涨跌幅存在价格反转因素掺杂,使得资金流因子表现部分被价格走势影响。
- 设计IMB指标(买入/卖出金额比的对数)并利用截面回归剥离与行情涨跌幅的相关性,获得纯净的资金流Alpha。
- 修正资金流因子(NIR
MOD等)表现明显优于未修正因子,信息比率(IR)提升显著。
  • 论据与数据支撑:

- 图5展示多个资金流因子的Rank IC、IR、多空收益等,NI相关指标稳定但表现不足。
- 图6、7描述大单与涨跌幅呈正相关,小单与涨跌幅呈负相关,反映资金流动力学特性。
- 图8指出IMB与涨跌幅秩相关系数与阈值及回溯窗口回报存在显著变化,低阈值短周期相关性最高。
- 修正方法(MOD修正法)用残差项反算修正买卖金额份额,剔除反转影响。
- 修正后资金流因子在图9展示出IR提升至3.5以上,多空收益和回撤均改善。
  • 预测与推断:

- MOD法提高因子的纯净度,剥离价格反转干扰,提高资金流的选股信号质量。
- NIRMOD是本文重点选用的资金流因子。

2.1.3 资金流因子参数敏感性测试


  • 核心结论:

- 最优的大单划分阈值明显低于传统20万元,更优约为2万元。
- 阈值降低后,NIR
MOD因子多空收益由26.13%提升至32.16%,回撤幅度降低(6.02%)。
- 不同标准化方式影响不大,均支持低阈值划分。
  • 论据支撑:

- 图12体现不同阈值下的IR、收益和Rank IC,峰值多见于低阈值2万元附近。
- 图13、14对比20万元与2万元阈值的分组收益及多空净值曲线,低阈值明显优越。
- 图15、16对应其他资金流定义NI和NIPCT因子敏感性,均支持低映射阈值。

2.2 资金流的微观结构剖析



2.2.1 资金流Alpha来源主体解析


  • 关键论点:

- 资金流Alpha主要由大单(主力资金)提供,小单作为对手方主要提供流动性,Alpha较弱。
- 大单NIRMOD因子年化收益超过25%,比小单高约4%。
- 主力资金的行为信息更有效,因而资金流因子应专注于大单资金。
  • 论据支撑:

- 图17展示不同金额阈值下大单与小单因子收益对比,大单表现更强。
- 图18、19显示净流入因子呈“两极分化”,小单处可能带负Alpha,成交金额因子反映流动性和负向收益。

2.2.2 大、小单资金流的相关性及博弈


  • 关键论点:

- 大单净流入与3万元以下小单净流出存在负相关,表明小单为大单提供交易对手支持。
- 市场中不存在明显的资金流断层,大额委托单旁边往往有数量相近的委托单,源于机构拆单等行为。
- 资金流具备连续性,尤其在小票市场体现更强。
  • 论据支撑:

- 图20为大单与小单净流入相关性热力图,显示负相关区域集中在3万元以下小单与高额大单之间。
- 结合巡查数据,资金流的连续拆单现象存在,是主力资金策略的一部分。

2.2.3 区分不同市场与股票规模的主力资金划分差异


  • 关键论点:

- 在沪深300、中证500等大盘股票市场,主力资金阈值分布较高但不明确;中证1000及全市场小盘股主力阈值明显偏低且效果更稳定。
- 机构持仓集中于大盘股,拆单行为更明显使得大单划分不集中;小盘股流动性较差,主力拆单颗粒度更细。
- 因此,不同市场的资金流划分应区别对待,遵循差异化阈值设定。
  • 论据支撑:

- 图21展示不同指数成分股测试的多空IR、收益和Rank IC,显示上述趋势。
- 公募基金持仓数据显示中证800公募持仓集中度达78.27%,大盘集中度显著。

2.3 主动买卖划分分析


  • 发现:

- 利用逐笔数据的Type、Side字段进行主动买卖委托划分,并修正得到主动买卖资金流因子。
- 主动买卖资金流因子选股效果不如整体买卖金额因子。
- 这可能因主动买卖划分方法偏弱或代表信息不足。
  • 证据:

- 图23显示主动买卖资金流因子IR与多空收益显著低于NI
MOD及NIRMOD等指标。

---

3. 图表深度解读



3.1 挂单金额金字塔趋势(图1)


  • 说明: 展示2013-2021年买卖挂单金额分布的分位值及其变化趋势。横坐标展示卖单、买单笔数分布,纵坐标挂单金额大小。
  • 解读: 买卖挂单金额分布形态类似畸形金字塔,底部极宽,顶端狭长。中位挂单金额约1万元,远低于传统4万元小单阈值,表明传统划分过于粗糙。超大单(>100万元)极为稀少。


3.2 不同阈值累计成交金额分布(图3)


  • 说明: 横轴为大单阈值(万元),纵轴为累计买入和卖出成交金额占比。
  • 解读: 累计成交金额随阈值递减而均匀分布,表明资金流数据在不同阈值下分布均衡。合理比例的阈值可选使资金流数据划分更恰当。


3.3 资金流因子选股能力对比(图5&9&10)


  • 说明: 图5显示常见资金流因子(NI、NIR等)选股表现,图9为修正后因子(MOD后)的提升体现;图10以超额收益形式表现原修正前后NIR因子的单调性改进。
  • 解读:

- 原始因子信息比率(IR)约2.5左右,经过MOD修正后IR提升至4.5以上,收益大幅增加同时最大回撤减少。
- 多空对冲净值随后提升,且收益曲线更加强劲平稳,体现纯净资金流因子的有效捕捉能力。
- 超额收益的单调性提升说明因子层级划分更有效,投资者分组决策更科学。

3.4 不同阈值下NIRMOD因子参数敏感性(图12)


  • 说明: 测试阈值从0.5万元至90万元,分别对应多空IR、多空收益及Rank IC三个指标。
  • 解读:

- 多空IR显示阈值越低,因子有效性越强,峰值出现在约2万元。
- 多空收益和Rank IC指标趋势一致,均支持降低主力资金阈值。
- 意味着更细的拆分能更好揭示主力资金交易行为。

3.5 大单、小单资金流Alpha对比(图17)


  • 说明: 不同阈值划分下大、小单NIRMOD因子年化收益对比。
  • 解读:

- 大单资金流因子的选股能力大幅领先小单,收益率优势明显约4%。
- 小单Alpha因子有效性快速衰减,强调资金流因子Alpha源来自主力资金。

3.6 CNIR因子表现(图24-29)


  • 说明:

- 图24显示CNIR因子月度Rank IC及累计趋势;
- 图25为全市场五分组净值曲线及收益稳定性;
- 图26、27对比叠加改进后CNIR因子、多空及多头净值。
- 图29展示不同指数成分股CNIR多空净值,说明在小票中表现更好。
  • 解读:

- CNIR因子Rank IC保持稳定,因子效果稳健且收益持续增长;
- 各组收益差异小,复现能力较强;
- 多头净值表现出高超额收益,回撤控制较好,显著优于传统NIR因子。
- 在中证1000和全市场覆盖时,CNIR表现最优,适合小市值股票池。

3.7 因子相关性分析(图30-32)


  • 说明: 图30展示CNIR与Barra风格因子关联性,图31与交易行为因子相关性。图32剔除多因子影响后CNIR多头收益分组情况。
  • 解读:

- CNIR与主流风格因子相关度均低(规模因子相关<0.2,部分负相关),独立性强;
- 与理想反转因子和其他交易行为因子相关负,互补性好;
- 扣除其他因子影响后,CNIR仍保持高信息比率及优异胜率,表明因子蕴含独立且有效的Alpha来源。

3.8 持仓及换手率分析(图33-36)


  • 说明:

- 图33:中证800多头持仓中,2021年以来大金融、大科技板块超配特征明显;
- 图34、35:主力资金净流入与基金持仓变动正相关;
- 图36:CNIR因子持仓换手率趋势,显示整体换手率较低。
  • 解读:

- 主力资金配置具有阶段性风格轮动,2021年科技板块超配明显,2022年大金融显露避险需求;
- 主力资金与公募基金持仓变化关系明显,反映资金流因子一定程度捕获机构资金态度;
- 低换手率显示因子适合中低频策略,稳定且交易成本较低。

---

4. 估值分析



本报告非个股或公司层面研究,未涉及单一标的估值。报告聚焦因子构造及测试,估值分析部分缺失,符合量化因子研究报告的研究特点。

---

5. 风险因素评估


  • 风险提示:

- 研究基于历史逐笔数据及统计结果,未对未来市场环境的剧烈变化做充分考量。
- 市场微观结构变化(如监管政策调整、市场参与者结构变化)可能影响资金流因子表现。
- 资金拆单策略及市场流动性变化可能影响因子稳定性和适用范围。
- 主动买卖划分方法存在局限,模型可能漏掉部分隐性交易行为。
- 投资者需关注因子回撤和潜在翻转风险。

---

6. 批判性视角与细微差别


  • 报告分析严谨,数据广泛,但依赖深交所逐笔数据,因沪市逐笔委托缺失存在样本局限。

- MOD修正方法剔除反转因素合理,但截面回归模型拟合度及残差解释未表现,存在微弱隐含假设风险。
  • 阈值降低至2万元虽显提升效果,是否完全适用于所有行业及市场环境尚待进一步验证。

- 主动买卖划分未带来增益,可能源于数据缺陷或定义局限,进一步细节分析缺失。
  • 资金流因子在小盘股表现优越,反映微观结构复杂度,报告中对拆单行为机制探讨较简略,有进一步精细化空间。

- 报告未具体提及交易成本对高换手部分的影响,但换手率分析表明因子适合中低频投资策略。

---

7. 结论性综合



本报告以细致的逐笔交易数据为基础,致力于优化资金流因子的定义和构造,尤其聚焦于大、小单的合理重定标。传统基于绝对金额划分的主力资金阈值被严肃质疑,报告基于44个精细阈值测试揭示了约2万元的较低阈值对提升资金流Alpha捕捉效果更为有效。通过MOD修正法剥离资金流与涨跌幅的反转因素影响,资金流因子的选股能力显著增强,IR指标大幅提升,为量化选股提供更精炼的Alpha信号。

资金流因子Alpha主要来源于大额主力资金,而小额订单提供市场流动性支持,形成资金流的二元结构。大单资金流与涨跌幅正相关,且在参数灵敏度测试及不同市场分区测试中均表现稳健。基于融合超大单、大单和中单构造的CNIR因子,展示了全市场范围内稳健且显著的选股能力,尤其在小盘股市场表现优异,表明主力资金行为在微观结构中可被有效捕捉。

CNIR与主流风格因子及交易行为因子相关度低,剔除风格及交易行为因子后依然展现极佳的多头信息比率和胜率,验证了其独立Alpha特性。因子低换手率和持仓行为说明其适合中低频量化实践。板块配置分析揭示主力资金风格轮动大致符合市场热点与避险理念。

最后,报告明确提醒风险,因市场微观结构变化可能影响因子表现,未来适用性需密切关注。报告基于扎实数据和创新方法,为理解股票市场主力资金动向提供了系统框架,对量化投资实务有重要借鉴意义。

---

主要图表摘要图片



图1:挂单金额金字塔与分位值变化趋势

图3:不同阈值的累计成交金额分布较为均衡

图6:大单 IMB 与涨跌幅呈正相关

图9:修正后资金流因子的选股能力显著提升

图12:NIR</em>MOD 因子的参数敏感性测试:最优阈值为2 万元

图17:大单 NIR<em>MOD 比小单 NIR</em>MOD 因子选股能力更强

图20:大单的交易对手方集中在3 万元以下的小单

图21:不同选股域内测试:沪深300、中证 500 的最优阈值取值更高

图24:CNIR 因子月度 Rank IC 相对稳定

图25:全市场五分组表现:多头收益显著

图30:CNIR 因子与Barra 风格因子相关性偏低

图31:CNIR 因子与交易行为因子解释能力重叠度低

图32:剥离风格因子、交易行为因子收益后,CNIR 因子多头仍然有效

图33:中证 800 多头组合板块配置情况:2021 年 6 月以来超配大金融板块

图34:主力净流入与公募基金持仓变动正相关

图35:主力净流入与公募基金持仓变动相关性较高

图36:CNIR 因子换手率整体偏低

---

参考文献与报告源页码



以上内容依据开源证券《大小单重定标与资金流因子改进—市场微观结构研究系列(16)》报告全文内容提炼整理,引用页码涵盖[page::0]至[page::21]等所有相关页面。

报告