`

“聪明”的资金流向数据 —“逐鹿”Alpha专题报告(三)

创建于 更新于

摘要

本报告基于Level-2资金流向数据,构建小单、中单、大单及超大单资金流向因子,运用单因子IC检验及Lakonishok等提出的NPR模型,验证资金流向因子与未来股票收益的关系。研究发现,小单资金流向因子与未来收益存在显著负相关,意味着个人投资者高频交易的股票未来表现较弱;而大单开盘资金流向占比因子则与未来收益呈显著正相关。NPR模型结果进一步表明,小单NPR因子的显著性最高,大单及超大单的相关性较低。五日累积因子相较单日因子在开盘资金流向及交易差额方面表现更优,资金流向能有效反映不同投资者类型的交易偏好及其对应的收益预期,为Alpha投资策略提供了新的因子来源和量化工具 [page::0][page::2][page::5][page::10][page::12]

速读内容

  • 资金流向数据分类及计算方式 [page::2][page::3]:


- 成交金额划分为小单(<4万)、中单(4-20万)、大单(20-100万)及超大单(>100万)。
- 按成交顺序区分主动单和被动单,数据涵盖买卖方向和挂单位置。
- 日内基础因子共计40个,包括金额、笔数、量的买卖差值等。
  • 资金流向基础数据时间序列表现 [page::3][page::4]:




- A股资金流向以中单为主,小单和大单相近,超大单卖出占比高于买入。
- 金额差数据显示小单和中单持续净流入,大单和超大单持续净流出。
  • 小单资金流向因子表现突出 [page::5]:

| 因子 | IC | pvalue | tvalue | IC>0占比 | ICIR |
|---------------------------|---------|--------|---------|-----------|--------|
| 小单买入总量 | -0.0572 | 0.0000 | -10.0632| 0.3302 | 0.3302 |
- IC时间序列表现稳定,长期胜率67%,多空组收益达到138%。


  • 中单及大单资金流向因子检验 [page::6][page::7]:

- 中单卖出总量(主动) IC -0.0566,胜率67%,多空组收益达113%。


- 大单卖出总量(主动) IC -0.0476,胜率64%,多空组收益达96%。


  • 超大单资金流向因子表现相对较弱 [page::7][page::8]:

- 超大单卖出单数IC约-0.0353,整体胜率64%,多空组收益50%。


  • 时间段资金流向因子检验及异动效应 [page::8][page::9]:

- 大单开盘资金流向占比(量)IC达到0.031,胜率约66%,表现显著优于其他时间段因子。


  • 五日累积资金流向因子的表现优于单日因子 [page::9][page::10]:




- 五日累积因子在开盘资金流向及交易差额上的IC明显提升,显示资金建仓存在持续效应。
  • NPR模型回归结果揭示资金流向因子的收益驱动力 [page::11][page::12]:


| 类型 | NPR系数(β5) | t值 | 方向及说明 |
|--------|------------|----------|-------------------------------------|
| 小单 | -5.1 | -19.34 | 显著负相关,交易频繁对应未来收益下降 |
| 中单 | 1.27 | 7.7 | 正相关,收益关系较小 |
| 大单 | 1.85 | 8.87 | 正相关,且极端低值时多空收益显著 |
| 超大单 | 0.43 | 3.41 | 相关性最低,显著性较弱 |
- 模型二控制极端哑变量,强化了极端NPR对未来收益的影响解释力。
  • 量化因子构建建议总结 [page::0][page::5][page::11]:

- 小单资金流向因子及其NPR版本特别适合用于预测未来收益的负相关策略。
- 大单开盘资金流向占比因子表现为正相关,可用作捕捉机构资金入场信号。
- 五日累积因子增强了因子稳定性和预测能力,值得用于量化策略的特征构建。

深度阅读

“聪明”的资金流向数据——“逐鹿”Alpha专题报告(三)详尽分析



---

1. 元数据与报告概览


  • 报告标题:“聪明”的资金流向数据

- 专题系列:“逐鹿”Alpha专题报告(三)
  • 发布日期:2021年1月12日

- 分析师:陶勤英(SAC证书编号:S0160517100002,联系方式taoqy@ctsec.com, 021-68592393)
  • 联系人:王超(wangc@ctsec.com, 18221845405)

- 发布机构:财通证券股份有限公司
  • 报告主题:研究资金流向因子对于未来股票收益的显著性及影响,用于揭示投资者行为的“聪明程度”。


核心论点与目标



报告核心集中于利用Level-2交易数据计算资金流向因子,通过因子IC检验和NPR模型两种方法验证因子表现。重点发现包括:
  • 小单和中单资金流向因子与未来收益呈现明显负相关,表明个人投资者资金流入往往预示后期表现较差。

- 资金流向的五日累积因子,尤其是大单开盘资金流向占比,对未来收益呈现正相关性
  • NPR模型回归结果进一步确认小单资金流向的显著性优于其他资金级别。


报告并未给出明确买卖评级或目标价,但其分析对定量策略构建和市场微观结构解读有重要参考价值。[page::0,2,12]

---

2. 逐节深度解读



2.1 资金流向数据介绍(章节1)



报告解释了资金流向数据的来源和构建方式:
  • 采取Wind的Level-2数据,按照交易金额大小将成交划分为:

- 小单:<4万
- 中单:4万-20万
- 大单:20万-100万
- 超大单:>100万
  • 以买卖方向(买单、卖单)及挂单顺序(主动单、被动单)为两大分类,进而分类统计日内成交数据。
  • 资金流向因子共计40个,基于成交笔数、金额、成交量等维度,形成包含主动/被动买卖资金流的多维指标集合。


文中指出,小单资金流向往往反映个人投资者行为,因信息渠道限制,这类资金流向偏向于“非聪明资金”。报告旨在发掘资金流向背后的投资者行为趋势和未来收益信息。[page::2,3]

2.2 资金流向基础因子的IC检验(章节2)



本章节通过信息系数(IC)等统计指标,验证各种资金流向因子对未来收益预测的有效性。样本为2017-2020年中证800数据,重点分析小单、中单、大单及超大单资金流向的表现。
  • 小单因子检验(2.1节)

- 各类小单因子IC均为负值,平均IC约在-0.03至-0.05区间,说明小单买入或卖出金额及成交量均与未来收益负相关。
- 成交量相关性更显著(IC更负)。
- 具体小单买入总量因子胜率达到67%,前1组股票获得93%累积收益,而表现最差的第5组股票收益为-45%,多空组收益高达138%。
- 附图5、6显示了IC时间序列的稳定性与分组收益的显著差异,印证小单买入总量的统计意义。[page::5]
  • 中单因子检验(2.2节)

- 中单因子同样呈负相关,IC均为负,且成交量因子IC显著。
- 以中单卖出总量(仅主动)为例,表现稳定,胜率67%,多空组收益113%。图7、8展示对应的IC时间序列与收益分组情况。
- 值得注意,中单金额差(仅主动)为正相关,提示拆分因子后有差异性表现。[page::6]
  • 大单因子检验(2.3节)

- 大单买入和卖出金额因子IC同样为负,但强度较小单和中单减弱。成交量因子相关性略高。
- 大单金额差因子为正相关,表明有资金净流入与正向收益关系。
- 以大单卖出总量(仅主动)为例,胜率64%,多空组收益96%。图9、10提供时间序列和收益曲线。[page::6,7]
  • 超大单因子检验(2.4节)

- 超大单因子IC均负相关,但幅度和显著性普遍较弱。
- 超大单卖出单数因子胜率64%,多空组收益50%。图11、12佐证该因子实证特征。
- 超大单资金流动在统计效应上不及低等级资金,提示超大资金流动信息含噪较多或被市场消化。
[page::7,8]
  • 资金流向时间段因子及开盘资金流向占比因子(2.5节)

- 资金流向在不同时间段的表现差异明显。
- 大单开盘资金流向占比因子(金额、量)IC正相关且显著,是少数表现正相关的资金流向因子之一。
- 尾盘资金流入因子表现负相关。
- 图13、14以大单开盘资金流向占比为例,胜率66%,多空组收益达102%。反映机构投资者偏好于开盘时段调整头寸,资金流向具有预测未来走势的能力。[page::8,9]

2.3 衍生因子检验(2.6节)


  • 基础单日因子和五日累积因子对比显示:

- 单日资金流向因子的IC略胜于五日累积因子。
- 交易差额因子中,五日累积因子的IC显著提升,表明资金流向的累计效应存在滞后影响。
- 时间段因子中,开盘资金流向五日累积因子表现大幅优于单日,尾盘因子则相反。
- 该差异体现“开盘前机构资金布局”和“尾盘调仓策略”的不同市场行为特征。
- 图15至17详细展示了不同资金分类、交易属性在单日与五日累积的IC差异。[page::9,10]

2.4 NPR模型检验(章节3)



报告借鉴Lakonishok和Lee(2015)提出内部人交易影响的NPR(净买入比率)模型,拓展至资金流向分档:
  • NPR定义为未来T天(取5日)买入金额与卖出金额净值占总交易的比率。

- 构建了小单、中单、大单、超大单四个NPR因子。

回归模型考察未来5日收益与公司市值(SIZE)、账面市值比(B/M)、近期收益(PR5、PR21)、及NPR因子的关联:
  • 模型一包含基础控制变量和NPR因子。

- 模型二增加两个哑变量控制极端NPR(顶部5%和底部5%)。

回归结果(图18)总结:
  • 小单NPR系数显著为负,t值最高达-19,表明小单流向与未来收益负相关且稳定,通过了显著性检验。

- 中单及以上资金的NPR系数均为正,显著性较小单弱,超大单相关性最弱。
  • 模型二中,小单极端负流向(DSL)对应显著负收益,突出小单极端资金行为作为反向指标的作用。

- 大单极端NPR表现对多空收益有正向贡献,体现机构资金在极端阶段对市场的影响力。

此模型进一步印证IC检验结论,体现不同资金规模投资者影响市场收益的异质性。[page::11,12]

---

3. 图表深度解读



图1 (第2页):资金流向分类示意图



描述资金流向分类方法,结合成交金额大小和委托挂单顺序区分买卖主动被动单,形成多维度资金流向特征的构建基础。[page::2]

图2 & 图3 (第3页):买入&卖出金额中位数


  • 三个不同资金级别的买卖金额中位数时间序列,从2017年到2020年波动明显。

- 中单资金流入为主,小单和大单频率相近,超大单卖出额占比较买入更大。
  • 该差异暗示资金参与的优先级和交易策略分布。

- 结合文本分析,小单更多反映个人投资者行为,超大单主要为机构大资金调动。 [page::3]

图4 (第4页):金额差时间序列


  • 展示四种资金等级的净买入金额差(买-卖)。

- 小单与中单净流入持续为正,大单与超大单净流入长时间为负,说明买入偏好较多由中小单支撑,卖出由大单及超大单主导。
  • 显示资金流向的结构性分层,有助识别资金成交主体与市场影响类型。 [page::4]


图5-6 (第5页):小单资金流向IC时间序列及分组收益


  • IC平均约-0.057,波动稳定,显示资金流向对未来五日收益的稳定负相关。

- 分组收益率图显示因子极端(最高 vs最低组)表现差距明显,多空组合收益高达138%。
  • 该图强烈验证小单资金流对股价的逆向预示作用。 [page::5]


图7-8 (第6页):中单资金流向IC时间序列及分组收益


  • IC同样为负,虽幅度略短于小单,稳定性良好。

- 多空收益高达113%,说明中单资金流也具有显著的预测能力。
  • 图形风格与小单类似,支持中小单资金流入预示未来收益走弱的结论。 [page::6]


图9-10 (第7页):大单资金流向IC时间序列及分组收益


  • IC负相关,幅度较小,比小单、中单低,但仍具有一定统计意义。

- 多空收益达96%。
  • 对应表格中大单净买入金额差、成交量差有正相关性,提示大资金买卖方向对收益的积极影响。 [page::7]


图11-12 (第8页):超大单资金流向IC时间序列及分组收益


  • IC值相对较小且边际显著性弱。

- 多空组收益50%,相比小单和中单显著下降,指向超大单对价格预测能力的减弱。
  • 该表现可能是机构资金行为复杂或市场信息消化更充分导致。 [page::8]


图13-14 (第9页):大单开盘资金流向占比IC及收益


  • IC正相关,平均0.031,整体胜率66%。

- 多空组合收益达102%。体现开盘阶段大单资金流入为行情积极信号。
  • 反映机构资金特征,强调时间段资金流特征在投资策略中重要性。 [page::9]


图15-17 (第9-10页):单日与五日累积资金流向因子IC对比柱状图


  • 图15:基础因子中单日因子略优于五日累积。交易差额五日累积提升显著。

- 图16:资金差额因子中五日累计显著好于单日。
  • 图17:时间段因子中开盘五日累积强于单日,尾盘因子相反。

- 可视化说明了资金流效应在不同交易量段和时间窗口的差异,支持策略时序调整。 [page::9,10]

图18 (第12页):NPR模型Fama-Macbeth回归结果表


  • 详细列出回归系数及t值,发现小单NPR负相关且显著,高t值体现强统计效力。

- 中单、大单、超大单NPR系数为正,但显著性相对较低。
  • 极端低NPR的DSL哑变量影响显著,验证市场极端资金行为影响。

- 为多因子模型验证资金流向因子提供了实证依据,具有理论和实际操作价值。[page::12]

---

4. 估值分析



本报告未涉及传统意义上的公司估值分析(如DCF、P/E、EV/EBITDA等财务估值指标),而是基于交易微观结构和因子统计检验。这是典型的量化策略和因子研究报告,其核心关注点是资金行为因子与股票后续表现的关联性。

---

5. 风险因素评估



报告在开篇及尾声明确风险提示:
  • 所有模型基于历史数据,结果不保证未来有效。

- 资金流向因子的统计相关性可能因市场结构变化、政策调整、交易规则变动等因素失效。
  • 量化因子策略固有的过拟合风险存在,尤其当市场环境极端或非结构性波动时,因子表现不稳定。


风险提示未详述缓解措施,但对投资者而言,显然需要结合多因子、多维度信号进行综合判断,避免单因子过度依赖。[page::0,12]

---

6. 审慎视角与细微差别


  • 报告中,小单资金流向与未来收益负相关的发现较为突出,暗示个人投资者“非聪明”特征。但这也可能反映市场结构下个人投资者偏好于追涨杀跌,非消息面真实反应,推断应谨慎。

- 大单和超大单因子表现低于小单,且超大单NPR系数显著下降,提示资金规模越大,其资金流向的预判功效越不明显,这可能源于机构资金的多样策略和掩盖交易。
  • 时间段分析中的开盘资金流向正相关值得注意,这可能因机构调仓习惯强烈,但也需关注尾盘行为的反向信号与市场噪声影响。

- 报告未详细披露交易成本、中频数据细节和策略实际实现难度,对实战部署有一定局限。
  • NPR模型引入哑变量以捕获极端情况,显示出考虑资金流分布尾部行为的重要性,这为后续研究提供方向。

- 目前样本局限于中证800和全A的历史数据,市场结构变化可能影响结果的稳健性。

整体研究逻辑严谨,统计检验体系完备,但投资者在实际应用时应结合风险管理及多样化策略设计。 [page::0-12]

---

7. 结论性综合



本文以细致的资金流向刻画为出发点,研究不同资金规模的买卖行为对未来股票收益的预测效果。重点结论包括:
  • 资金流向因子定义科学:通过Level-2细分小单、中单、大单、超大单及主动被动买卖,形成多维度40个基础因子和其衍生版本,覆盖交易金额、笔数和成交量。

- 小单资金流向因子表现最显著:呈现持续且高度显著的负相关,分组收益差异明显,体现个人投资行为对未来收益的逆向参考价值。
  • 中单和大单表现次之,超大单相关性最弱:机构资金流动信息含噪较多,股票价格对超大单资金流动的敏感度较低。

- 时间段资金流向揭示机构调仓节奏:开盘资金流向占比正相关,尾盘资金流向反向,提示不同资金玩家的交易时点偏好。
  • 五日累积资金流向增强信号质量:总体而言,五日累积因子在交易差额和开盘资金流向上较单日更有效,说明资金连续跟进的重要性。

- NPR模型深化资金流向预测能力分析:不同资金等级对应不同方向的相关性,小单NPR与未来收益负相关且显著,中大单及超大单则反向但不那么显著。
  • 实证分析方法严谨:通过IC检验、分组收益分析、Fama-Macbeth回归等多重统计方法验证,确保结论稳健。


图表所示资金流向时间序列、IC历史走势与分组收益曲线系统呈现了数据背后的资金行为逻辑及其预测力,图18表格则用细化的回归系数定量确认了模型的有效性。

本报告对于量化投资策略设计、风险管理及微观市场结构研究具备重要借鉴意义,特别是为识别所谓“聪明资金”提供了科学工具。报告建议更多关注小单资金流向负相关性,结合大单开盘资金流向占比的正相关信息,以期构建更为全面的资金流向因子体系。[page::0-12]

---

附图示范



图1:资金流向分类


图4:金额差时间序列


图5:小单资金流向IC时间序列


图6:小单资金流向分组收益率


图15:五日累积因子对比


图18:NPR模型Fama-Macbeth回归结果
(见文本表格,第12页)

---

综上所述,该报告系统且全面地解构了资金流向因子的构成、统计特征及预测能力,为深入理解资金行为与市场动态提供了丰富实证证据。[page::0-13]

报告