`

【光大金工】资金流向数据中的 Alpha 因子梳理与回测之二

创建于 更新于

摘要

本报告围绕资金流向数据构建Alpha因子,基于Wind数据库的资金流数据,比较不同金额区间、主动性及时段的资金流表现,构建了总量单、主动单和特殊时段交易三大类共10个因子。回测显示大单资金流具备明显正向Alpha,基于净流入绝对值的标准化方法效果最佳。综合收益显著的推荐因子包括大单净流入、极端单净流入及动量调整净流入系列因子,以及高收益日主动大单净流入和开盘大单净流入因子。上述因子在沪深300、中证500及流动性1500股票池均表现良好,周度RankIC高达4.32%。此外,因子间相关性较低,表明信息较为独立,具备组合优化空间 [page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9]。

速读内容

  • 资金流向数据细分包括金额区间(小单、中单、大单、超大单)、主动与被动成交、早盘与尾盘时段三维度,从中大单数据表现出正向Alpha,超大单与小单因子贡献负向收益,[page::0][page::1][page::2]


  • 对比净流入数据的三种标准化方法(大单净流入除以全天成交额、大单成交额及净流入绝对值),发现绝对值标准化效果最佳,因子表现尤为突出,年化多空收益率达15.30%,夏普比率2.15 [page::3]


  • 构建了10个资金流向Alpha因子,分为总量单(如大单净流入、动量调整大单净流入)、主动单(高收益日主动大单净流入等)、特殊时段交易(开盘大单净流入等)三类 [page::4]


| 序号 | 因子名称 | 因子分类 | 计算公式 |
|------|-------------------------|-----------|--------------------------------------------------|
| 1 | 大单净流入因子 | 总量单 | 20日求和(大单流入-流出)/20日绝对值求和(大单流入-流出) |
| 2 | 极端单净流入因子 | 总量单 | 超大单净流入因子 + 小单净流入因子 |
| 3 | 动量调整大单净流入因子 | 总量单 | 大单净流入因子与收益率回归取残差 |
| 6 | 主动小单净流入因子 | 主动单 | 20日求和(主动小单流入-流出)/20日绝对值求和(主动小单流入-流出) |
| 7 | 高收益日主动大单净流入因子 | 主动单 | 过去20交易日中收益率最高的5个交易日主动大单净流入因子求和 |
| 9 | 开盘大单净流入 | 特殊时段交易 | 20日求均值(大单开盘流入金额/全天主动单交易金额) |
| 10 | 高收益日开盘主动净流入因子 | 特殊时段交易 | 过去20交易日中收益率最高的5个交易日开盘主动净流入因子求和 |
  • 总量单类因子在回测中表现优异,流动性1500池内动量调整大单净流入因子周度RankIC达到4.32%,大单净流入因子年化多空收益率15.30%,夏普值超2,且多头净值持续上升 [page::5][page::6]



  • 主动单因子原始效果一般,但高收益日主动大单净流入因子经过收益率时间域切分后表现显著提升,流动性1500池内RankIC为3.33%,显示投资者在高收益日的主动意愿对预测股价有参考价值 [page::6][page::7]


  • 特殊时段交易因子中,开盘大单净流入因子表现最佳,流动性1500池内RankIC为2.35%,而尾盘相关因子因选股效果较弱未被重点推荐 [page::7][page::8]


  • 因子相关性分析表明资金流类因子之间相关性较低,尤其大单净流入、动量调整小单净流入和动量调整大单净流入等因子拥有部分相关性但仍具有较强独立信息,有助于构建多因子组合提升组合多样性和稳定性 [page::8]
  • 综合推荐7个核心Alpha因子,覆盖总量单、主动单和特殊时段交易,可为量化选股策略提供有效Alpha来源,同时需要注意历史业绩不代表未来,存在不可重复验证风险 [page::0][page::4][page::9]

深度阅读

光大金工报告《资金流向数据中的 Alpha 因子梳理与回测之二》详尽解读与分析



---

1. 元数据与报告概览


  • 报告标题:《资金流向数据中的 Alpha 因子梳理与回测之二》

- 作者及机构:祁嫣然、曲虹宇,光大证券金融工程研究团队
  • 发布日期:2023年3月16日

- 研究主题:基于资金流向数据构建Alpha因子,进行因子梳理、测试和回测,旨在为投资者提供有效的量化选股因子参考。

报告核心论点:
本报告属于系列第二篇,系统梳理和测试基于资金流向数据构造的量化选股因子,覆盖市场公开及团队独家开发因子。资金流向数据细分为大单小单、主动被动交易、早盘尾盘时段多个维度。研究发现大单具有明显的正Alpha属性,多个资金流向因子表现出较强的选股能力。基于回测效果,报告推荐包括大单净流入、极端单净流入、动量调整大单和小单净流入、高收益日主动大单净流入等7个核心因子供投资者使用。

报告强调,因子信息来源于历史数据,未来表现存在不确定性,且所有信息不构成投资建议,订阅者应自负风险。[page::0,1,9]

---

2. 逐节深度解读



2.1 因子梳理与回测系列概览



本节介绍系列目的与整体思路,极其注重因子的计算与回测表现,包括因子收益、RankIC、覆盖度、换手率和回撤等指标。资金流向数据采用Wind数据库AShareMoneyFlow表的逐笔成交合成数据,拆分为大单(20万以上)、中单、小单、超大单(100万以上)四类金额分组,及主动单和被动单,以及按交易时间划分早盘与尾盘等关键维度。

由于超大单数据样本覆盖面小,大单、中单、小单数据覆盖较全。中单无显著Alpha表现,超大单和小单呈负Alpha,大单净流入因子为主要正向信号来源。北向资金因投资整体配置策略,流动性因子影响较有限。

此处数据分类体系及逻辑假设投资者类型与交易单额相关:小单多为散户,大单以上多机构交易;主动单反映投资者主动意愿,早盘偏机构活跃。[page::1]

---

2.2 资金流向数据覆盖度及因子回测基础分析



图1展示超大单覆盖度不佳,为少数股票具备该数据,而大单、中单、小单均接近全覆盖。

图2与图3分别是超大单、大单、中单、小单净流入因子构建的多空净值与多头相对指数表现。回测区间2014-2023年显示,大单净流入因子收益显著,超大单、小单因子呈下降趋势。表1业绩指标量化了上述结论:
  • 大单净流入因子多空年化收益率15.3%,夏普比2.15,RankIC 3.75%,说明稳定的正向选股能力。

- 超大单及小单净流入因子经负向调整后表现更佳,反映两者原始信号负相关多头收益。
  • 中单未表现出显著Alpha价值。


因此,报告后续以大单作为正Alpha信息源,超大单和小单作负Alpha对待,中单舍弃[page::2]。

---

2.3 数据标准化比较



报告探讨因子构造时净流入标准化方法,主要为使不同股票间资金净流入具可比性。以大单净流入为例,标准化分母分别尝试全天成交金额、大单成交金额以及净流入绝对值。

图4与图5展示三种标准化方法的多空净值及多头相对表现,结果显示基于净流入绝对值的标准化因子表现最佳。对应的表2量化数据:
  • 使用净流入绝对值标准化的多空年化收益高达15.3%,夏普比2.15,RankIC 3.75%。

- 其他两种方法收益均低于一半。
因此后续所有因子均统一用此方法标准化。[page::3]

---

2.4 因子构建细节



表3详列10个资金流向因子,分为三大类别:
  • 总量单类:

1. 大单净流入因子:20日大单净流入金额与绝对流入金额求和比。
2. 极端单净流入因子:超大单+小单净流入因子组合。
3. 动量调整大单净流入因子:大单净流入因子与收益率回归的残差。
4. 动量调整小单净流入因子:小单净流入因子与收益率回归残差。
(极端单与动量调整小单因子为负向因子,回测中做方向调整)
  • 主动单类:

5. 主动大单净流入因子。
6. 主动小单净流入因子。
7. 高收益日主动大单净流入因子:过去20个交易日中,收益率排名前5日的主动大单净流入之和。
8. 低收益日主动小单净流入因子。
  • 特殊时段交易类:

9. 开盘大单净流入:20日均值,计算开盘大单流入占全天主动单交易金额的比率。
10. 高收益日开盘主动净流入。

全部因子采用周频调仓,三类因子均经过MAD去极值、Zscore标准化及行业、市值中性化处理,测试覆盖沪深300、中证500、流动性1500股票池,回测时间为2014年1月至2023年1月。[page::3,4,5]

---

2.5 因子回测表现详解



2.5.1 总量单因子



四个总量单因子均表现显著,动量调整大单净流入因子表现领先,流动性1500池RankIC 4.32%。极端单净流入因子和动量调整小单因子也表现良好,周度RankIC分别为3.97%和3.45%。

图6至图13具体呈现各因子在三个股票池上的多头相对基准净值和多空收益净值走势,均呈稳定上升趋势,回撤较小,验证了因子稳定的Alpha挖掘能力。

表4业绩指标显示(部分数据整理精简说明):
  • 大单净流入因子在流动性1500池年化多头相对基准收益为10.32%,夏普比0.97,最大回撤14.03%,RankIC 3.75%。

- 极端单净流入因子与动量调整小单净流入在多个池表现均优异,年化收益上双位数,夏普比例在1以上。
报告从量化指标全面支持总量单因子的有效性与投资价值。[page::5,6]

2.5.2 主动单因子



主动单因子反映更强烈的投资者交易意愿。原始主动大单、小单因子表现有限,部分在流动性1500池RankIC仅约1.6%-2%。时间序列收益率分域后,高收益日主动大单净流入因子表现显著提升,流动性1500池RankIC达3.33%。

图14至21分别展示主动大单、小单因子与高收益日相关因子多头与多空净值表现,均呈现中长期上涨趋势。表5中数据说明,
  • 高收益日主动大单净流入因子在流动性1500池年化收益约4.23%,夏普比1.53,最大回撤15.9%,周度RankIC 2.04%。

- 整体表现低于总量单因子但高出原始主动因子。

此分析表明,主动单信号潜在价值需结合收益表现进行时间序列过滤,方能挖掘有效Alpha。[page::6,7]

2.5.3 特殊时段交易因子



机构投资者偏好早盘交易行为,报告测试开盘及收盘大单净流入,发现尾盘相关因子选股效果低迷,仅展示早盘相关因子。

两个因子:开盘大单净流入因子和高收益日开盘主动净流入因子均表现较好,流动性1500池RankIC分别为2.35%和2.04%。

图22至25展示相应多头净值和多空收益,稳定上升趋势验证因子有效。

表6指标表明,开盘大单净流入因子年化多头相对基准收益约6.44%,夏普比1.29,最大回撤14.06%。高收益日开盘主动净流入因子年化收益5.51%,夏普比1.53,最大回撤15.9%。[page::7,8]

---

2.6 因子相关性分析



报告使用Pearson相关系数对流动性1500池因子日度PNL进行相关性检测(图26),结果表明:
  • 资金流相关因子之间相关性普遍不高,因子信息较为独立。

- 大单净流入与动量调整小单净流入因子相关系数最高达0.65。
  • 动量调整大单净流入与极端单净流入相关0.63。

- 其他因子相关多数低于0.5,说明组合可通过多因子融合取得更优风险调整收益。

此证明各个因子虽均基于资金流向数据,但捕获的资金行为信号存在差异化,有利于构建多元化因子模型。[page::8]

---

3. 图表深度解读


  • 图1(资金流向数据覆盖度对比):显示超大单覆盖度远低于其他单类,这限制其在因子构建中的应用,强调大单、中单、小单覆盖面广。数据可靠性与适用性从覆盖度角度结论清晰。[page::2]
  • 图2/3(净流入因子多空净值 & 多头相对中证全指):大单净流入因子多空值及相对表现持续向上,确认大单因子为优质alpha信号。小单与超大单因子趋弱,提示其负向调整必要。[page::2]
  • 图4/5(大单净流入标准化对比):明显体现采用净流入绝对值标准化在多空净值和横向比较中优势显著,理论及实证支持选择绝对值归一化。[page::3]
  • 表3(因子构造明细)详列因子名称、分类与计算公式,十分清晰地指导因子开发者实现因子设计与复现。[page::4]
  • 图6~13(总量单因子表现):各因子多头净值总体稳步上升,且多空净值表现强势,显示因子具备持续alpha。尤其动量调整大单净流入因子表现领先[page::5]
  • 图14~21(主动单因子表现):主动大单、小单因子表现较弱,但高收益日主动大单因子明显改善表现,体现组合的灵活设计与收益时序筛选价值。[page::6,7]
  • 图22~25(特殊时段交易因子表现):开盘大单及高收益日开盘主动因子皆展现稳定多头收益,确认早盘交易时段含有丰富alpha信号。[page::8]
  • 图26(因子关联矩阵):因子间相关不高,尤其关键因子独立性良好,说明因子组合潜力大。[page::8]


---

4. 估值分析



本报告主要为因子梳理和回测研究,不涉及公司估值估算,因此无DCF或市盈率相关内容。[page::全篇]

---

5. 风险因素评估



报告强调:
  • 所有结论均基于历史数据,未来不保证可重复验证。

- 资金流向因子受数据源、市场结构变化及交易行为演变影响风险存在。
  • 因子表现可能因市场环境或风格切换而波动,未见明确风险缓解策略,仅提示历史数据局限性及投资风险自担。


整体风险提示谨慎而明确。[page::0,9]

---

6. 审慎视角与细微差别


  • 虽然报告对因子进行了充分测试,但未深入说明因子在不同行业、不同市场状态(熊市、牛市、震荡)中的表现异同。

- 因子构造中一些调整如“动量调整”或“收益率分域”等方法虽被验证有效,但对应的具体数学处理细节和可能引入的额外风险未充分展开。
  • 大单因子作为主体信号,超大单、小单作为负向指标的处理逻辑虽合理,但该逻辑是否随市场微观结构变化而调整,未做深入探讨。

- 相关性分析显示因子独立性良好,但组合优化策略、实际应用中的交易成本、持仓冲击未涉及。
  • 数据覆盖度和标准化方法的选择非常关键,但报告未展示对极端行情的鲁棒性测试,考虑场外流动性风险可能更加完善。


总的来看,报告在因子回测深度和广度上表现优异,但对于实际交易落地风险细节略显不足,适合理论研究及策略初步开发参考。[page::全篇]

---

7. 结论性综合



本报告作为光大证券金融工程团队量化研究系列第二篇,以Wind资金流向逐笔成交数据为基础,系统构建和回测了10个资金流向相关Alpha因子,涵盖总量单、主动单和特殊时段三个层面。
  • 核心发现:

- 大单交易中资金净流入显示较强正向Alpha,大单净流入因子在主要股票池里回测表现稳健,多空年化收益15.3%,夏普比率超过2。
- 超大单和小单因子贡献负向Alpha信息。
- 不同的资金流向维度与时间段(如早盘)均能产生有效Alpha,尤其动量调整因子与高收益日主动因子表现提升明显。
- 标准化处理选用净流入绝对值分母最优,保证了因子间比较的公平与有效。
- 因子间相关性普遍较低,说明可构建多因子综合选股框架。
  • 重要图表洞见:

- 图1数据覆盖度揭示因子构造基础数据限制。
- 图2-3与表1验证了大单净流入因子卓越的Alpha性能。
- 图4-5表明标准化方法选择对因子表现至关重要。
- 多组图6-13、14-21、22-25清晰呈现因子历史表现和稳定性。
- 图26的相关矩阵提醒因子组合优化空间。
  • 综合推荐因子:

- 总量单类:大单净流入、极端单净流入、动量调整大单净流入、动量调整小单净流入。
- 主动单类:高收益日主动大单净流入。
- 特殊时段交易类:开盘大单净流入、高收益日开盘主动净流入。

报告不提供具体投资评级,但其科学系统的Alpha因子评估和推荐为量化投资者构建资金流向相关有效选股策略提供了坚实的理论和实证基础。[page::全篇]

---

总体评价



该报告条理清晰,方法严谨,数据详实,展示了资金流向数据在量化选股中的潜力与研究深度。其对于金融工程和量化投资研究者具较高参考价值,推荐用于量化因子开发与验证。须留意历史数据限制和判别调整因子逻辑透明度。

---

附图示例(部分)


  • 图1资金流覆盖度(超大单覆盖低)

- 图2大单净流入因子多空净值及相对收益
  • 图4标准化方式对比多空净值

- 图6大单净流入因子多头相对基准

(更多请见全文图表)

---

参考文献


  • 光大证券金融工程研究团队,《资金流向数据中的 Alpha 因子梳理与回测之二》,2023年3月。

- Wind数据库,AShareMoneyFlow数据表。[page::全篇]

---

以上即为报告《资金流向数据中的 Alpha 因子梳理与回测之二》的完整详尽分析解读。

报告