`

图谱系列十九 高频动量溢出因子构建

创建于 更新于

摘要

本报告基于行业关联网络构建高频动量溢出因子,从行业分类多样化、日内不跨日特征、跨日高频采样特征三个角度改进原始因子。改进版因子在周换仓下多空收益年化39.33%,夏普3.83,最大回撤10.91%,卡玛比率3.6,Rank IC 3.95%,显著优于原始因子表现。报告进一步将思路迁移至专利连续关联网络,构造多特征专利溢出因子,年化多空收益18.2%,夏普3.86,最大回撤3.8%。通过因子组合,形成溢出复合因子,兼顾离散及连续关联网络,收益和风险指标均表现优异,因子具有较强特异性和低相关性,为股票多因子选股提供了新思路与有效工具[page::0][page::13][page::17].

速读内容


高频动量溢出因子构建背景与目标 [page::0]

  • 关联网络近年来研究热点,报告聚焦行业关联网络应用到高频因子构建。

- 三个重点:离散行业分类网络、多种日内不跨日特征构造、跨日高频拼接特征。
  • 多行业划分整合溢出因子表现优异,合成因子多空夏普比率超3.8。


原始行业动量溢出因子历史表现及问题 [page::2]


  • 使用申万一级行业和过去1个月股票涨幅构造动量溢出因子,年化收益19%,夏普1.8。

- 第10组收益严重锐减,影响单调性和预测能力。
  • 排除第10组后,Rank IC明显提升,说明第10组为负向贡献。



三大改进方法介绍 [page::3]

  1. 行业分类多样化,利用不同行业分类低相关性提升信息量。

2. 基于不跨日日内行情数据构造日间特征,用多种高频指标丰富因子。
  1. 跨日K线拼接,高频采样构造短期连续市场行情特征,捕捉短期定价信息。


日间特征改进因子构建与表现 [page::7]


  • 采用多种日内1分钟特征(成交活跃度、波动率、流动性、情绪等)构造因子。

- 采用剔除第10组收益极端值手段整合多因子,消除单调性问题。
  • 因子多空收益年化28.9%,夏普3.19,最大回撤8.55%,卡玛比率3.37,Rank IC 3.6%。


跨日高频采样特征因子表现 [page::9]


  • 使用过去20日1小时K线拼接,计算1小时频率的多项特征构造因子。

- 多空收益年化30.2%,夏普2.77,最大回撤22.3%,Rank IC 3.28%,表现稳定。

多行业分类下动量溢出因子改进 [page::12]

  • 使用多种行业分类体系(申万、证监会、同花顺等),配合收益率相关特征构造因子。

- 多行业划分因子年化收益32.7%,夏普3.26,最大回撤8.4%,卡玛比率3.9,Rank IC 3.28%。


合成行业溢出因子表现及相关性 [page::13]


| 因子名称 | 多空收益年化 | 夏普比率 | 最大回撤 | 卡玛比率 | Rank IC |
|------------------|------------|-------|-------|-------|---------|
| 原始行业溢出因子 | 19.0% | 1.80 | 14.3% | 1.33 | 3.11% |
| 日间溢出因子 | 28.9% | 3.19 | 8.6% | 3.37 | 3.60% |
| 日内溢出因子 | 30.2% | 2.77 | 22.3% | 1.35 | 3.28% |
| 多行业划分因子 | 32.7% | 3.26 | 8.4% | 3.90 | 3.28% |
| 行业溢出合成因子 | 39.3% | 3.83 | 10.9% | 3.60 | 3.95% |
  • 整合不同改进因子,覆盖多种关联网络和特征范畴,显著提升选股效果与稳定性。

- 因子同底层库因子相关性较低,具有较强特异性定价信息。

专利连续关联网络溢出因子构建及表现 [page::16]


  • 基于专利连续关联度构造溢出因子,筛选关联度大于0.5参与计算。

- 多特征专利溢出因子年化收益18.2%,夏普3.86,最大回撤3.8%,卡玛比率4.83,Rank IC 1.4%,信息增量大且与行业因子相关性低。

溢出复合因子构建与综合表现 [page::17]



| 因子名称 | 多空收益年化 | 夏普比率 | 最大回撤 | 卡玛比率 | Rank IC |
|-----------------|------------|-------|-------|-------|---------|
| 溢出复合因子 | 32.9% | 4.58 | 5.3% | 6.16 | 3.10% |
  • 结合行业关联与专利关联连续网络信息,复合溢出因子表现更稳定,最大回撤显著下降,适合稳健投资。


投资实务表现(多市场选股统计) [page::15]

  • 小盘股(国证2000)收益表现最佳,夏普比率3.97,年化多头超额收益17%。

- 沪深300表现相对稳健,年化超额收益4.7%,夏普0.81。
  • 组合多头收益分组体现明确分层,选股能力较强。


结论与风险提示 [page::17-18]

  • 采用多维关联网络与多频特征集提炼,成功构建高效动量溢出因子。

- 改进因子在收益率、夏普比率、风险控制上表现全面优于传统行业动量溢出因子。
  • 因子与主流低频、高频因子相关性低,具备差异化投资价值。

- 报告基于历史数据,模型在市场政策或环境突变时存在失效风险,投资需谨慎。

深度阅读

金融研究报告深度分析 —— 《图谱系列十九 高频动量溢出因子构建》



---

1. 元数据与概览


  • 报告标题:《图谱系列十九 高频动量溢出因子构建》

- 作者:兴证金工团队
  • 发布机构:兴业证券股份有限公司

- 发布时间:2025年5月8日
  • 研究主题:高频动量溢出因子的构建与改进,聚焦关联网络在行业动量溢出因子中的应用,强调高频数据特征及多行业分类的影响。


核心论点及主要信息



报告基于关联网络的理论框架,利用多种高频采样和行业分类维度构造和改进行业动量溢出因子。报告主要内容包括三个方面:
  1. 关联网络的刻画与应用:通过多行业分类构造因子及行业间低相关性溢出因子的整合提升预测能力;

2. 高频数据特征的创新使用:采用不跨日构造日间特征与跨日高频K线拼接构造短期特征,显著优化传统因子性能;
  1. 因子构造的综合改进效果:改进后的合成溢出因子在多空收益率、夏普比率和Rank IC等多维指标上均优于传统行业动量溢出因子。


评级及目标价未明确披露,重点放在策略构建和因子性能展示。作者传递的信息是:结合高频数据与多样化关联网络能显著改进传统行业动量溢出因子表现[page::0,1]。

---

2. 逐节深度解读



2.1 引言与背景



报告回顾了团队此前在关联网络和动量溢出领域的研究积累,强调图谱研究在资产配置、选基和多因子选股的广泛应用。此报告重点切入高频量价层面,创新采用多行业分类、日内数据及跨日拼接高频特征构造更优因子,展示改进溢出因子更强的预测信号[page::0,1]。

2.2 行业动量溢出因子的历史表现



利用申万一级行业分类,定义行业动量溢出因子为股票所属行业除自身外其他股票过去1个月平均收益,经过中性化和周换仓回测,因子多空收益年化19%、夏普1.8,最大回撤14.3%,Rank IC 3.11%。但因子特别存在第10分组(顶端收益组)表现弱势的问题,导致单调性不足,限制了因子作为单一选股因子的实用性和行业网络在溢出效应中的应用潜力[page::1,2]。
  • 图1展现了第9组/第1组和第10组/第1组的累计收益对比,直观显示第10组收益弱于第9组。

- 图3、图4通过半年度分组收益热力图说明第10组收益持续下降趋势。
  • 剔除第10组后,Rank IC稳定显著提升,显示第10组贡献负面,建议剔除优化[page::2,3]。


2.3 因子改进思路



作者提出3大途径优化行业动量溢出因子:
  1. 多样化行业分类:利用申万、Wind、长江、GICS等不同标准行业分类,挖掘低相关分类间的新增溢出信息;

2. 不跨日构造日间高频特征:对日内1分钟K线数据提取多维特征(如已实现波动率、成交量占比等),并基于行业关联网络进行特征整合,从而获得更即时且丰富的因子信息;
  1. 跨日K线拼接的高频特征:通过拼接近10个交易日的1小时K线数据,计算连续时序的滚动特征,捕捉多日连续行情溢出效应;


此部分明确将传统的月度收益率溢出构造拓展为更短频率、多维度的高频特征溢出,逻辑合理,且强化了对短期定价信息的捕捉能力[page::3,4]。

2.4 基于不跨日日间特征构造因子的深度分析


  • 通过对收益拆分(隔夜、开盘半小时、开盘半小时后)测试,发现开盘半小时收益率因子表现优异,特定分组收益单调性显著提升;

- 表2统计多种拆分收益率的年化收益与夏普比率,开盘半小时的G9/G1实现24.5%年化收益,夏普2.73,大幅优于原始因子;
  • 报告进一步总结提取多种日频降维特征(表3),涵盖成交量、波动率、偏度、相关系数等多种市场行为指标,构造均值与均值除标准差两种指标形式,形成多维溢出因子,挖掘不同特征的预测价值,充分利用高频信息[page::4,5]。

  • 表4展现了部分关键特征因子的回测表现,收益率高达26.1%(morningret均值),夏普达2.87;

- 相关系数热力图显示这些特征因子虽包含共性,但仍有许多因子对之间低于50%的相关,体现了多样的低相关定价信息,有利于综合因子构建;
  • 通过相关性聚类,因子被归纳为三组高相关组与若干低相关因子,构造综合日间溢出因子,剔除第10组后收益和预测力进一步提升,达到夏普3.19,年化收益28.9%[page::5,6,7]。


2.5 基于跨日K线拼接高频采样特征的改进



章节剧透基于多日1小时K线拼接,滚动计算因子特征,如收益风险比、成交量比率、收益-成交量相关性等,突出捕捉多日连续行情溢出信息;
回测显示因子表现优异,夏普均在2.2以上,年化收益超过20%,依旧存在第10组收益锐减,应用了与日间因子类似的剔除策略。
因子间及与日间溢出因子的相关性偏低(最高0.6),显示两类高频数据构建的因子在信息上互补,有助于丰富定价信号体系[page::8,9,10]。

2.6 多行业分类维度改进


  • 利用申万、证监会、同花顺、长江、GICS等多种行业分类构建因子,并剔除申万一级分类形成多样化因子;

- 数据显示不同行业分类对应的最优构造参数、窗口均有差异,收益最高组多集中在第9组,依旧存在第10组收益锐减的问题,表明这是一种稳定现象;
  • 表8、9细致列举了各行业分类对应的参数与回测效果,年化收益差异显著,最高超30%,显示行业划分的异质性提供多维定价依据;

- 相关性分析揭示多行业因子之间存在显著低相关性,特别是深层次行业分类因子组合,联合构造形成多行业划分溢出因子,优化整体预测与收益表现,达到年化收益32.7%,夏普3.26,最大回撤8.37%[page::10,11,12,13]。

2.7 行业溢出合成因子


  • 将日间溢出因子、日内溢出因子和多行业划分因子联合加权(比重4:1:5),形成组合因子;

- 融合因子相关性为0.5-0.6,体现部分信息互补性;
  • 组合因子性能显著提升,周换仓年化多空收益39.33%,夏普3.83,最大回撤10.91%,Rank IC达3.95%,相较原始因子有明显跃升;

- 月换仓表现也全面优于基础因子[page::13,14]。

2.8 专利关联网络及连续型关联思路迁移


  • 报告将离散行业关联网络下的改进思路迁移至专利关联网络(连续关联网络),基于专利数据构建股票间连续关联度(0-1之间),选用强关联度(>0.5)计算特征均值,构造溢出因子;

- 因子表现亮眼,年化收益18.2%,夏普3.86,最大回撤3.8%,卡玛比率4.83,优于传统行业因子在风险控制能力;
  • 专利溢出因子与基于行业的溢出因子相关性均低于0.4,体现选股独立性和信息增量;

- 与底层因子库中因子相关性极低(绝对值最高0.08),显示因子信息特异性强[page::15,16]。

2.9 溢出复合因子构造与表现


  • 将专利溢出改进因子与行业溢出改进因子加权(6:4)形成溢出复合因子,兼顾离散与连续关联信息;

- 周换仓下多空收益年化32.9%,夏普4.58,最大回撤5.3%,卡玛比率6.16,表现全面优秀;
  • 因子分组单调性优异,具有良好的稳健性,是当前报告中最优组合因子[page::16,17]。


---

3. 图表深度解读



图1(页面2)


  • 描述:展示原始行业动量溢出因子第9组/第1组和第10组/第1组的累计收益曲线;

- 解读:第9组相对第1组收益稳定增长,表现良好;第10组尽管排名靠前,但收益增长明显不足甚至趋于平缓,反映第10组表现的异常。
  • 结论:第10组收益不佳导致整体分组单调性差,限制因子实际应用[page::2]。


图3 & 图4(页面2)


  • 描述:溢出因子17至20年和21至24年每半年不同分组的相对收益堆积图;

- 解读:多半数时间第10组收益明显下滑,尾部收益锐减特征持续,表现稳定。
  • 结论:因子的稳定性问题主要集中在第10组,需要针对第10组进行剔除或调整[page::2]。


图5 & 图6(页面3)


  • 描述:含第10组与剔除第10组的因子Rank IC累计对比及增量;

- 解读:剔除第10组后Rank IC显著提升,增强因子截面预测有效性;
  • 结论:剔除尾部异常数据组提升因子稳定性和预测能力,是有效改进手段[page::3]。


表2(页面4)


  • 描述:拆解收益率构造的因子年化收益、夏普、波动率与最大回撤;

- 解读:开盘半小时收益率构造的因子,尤其剔除第10组后,表现最优,夏普和收益均高,且风险相对合理。
  • 结论:细分收益拆解为高频日内特征可提高因子表现,日间波动特征尤为重要[page::4]。


表4(页面6)


  • 描述:多维日内特征构造的因子表现汇总,窗口期、收益最优分组及方向;

- 解读:多个特征(如已实现波动率rv、收益偏度retskew等)提供20%以上年化收益,高夏普,反映高频多维特征对选股信号提炼价值强。
  • 结论:多个低相关特征因子组合有利于构造更稳健预测能力因子[page::6]。


因子相关性热力图(页面6)


  • 描述:不同特征溢出因子间的相关性矩阵;

- 解读:大多数因子相关性较低,多对低于50%,表明因子包含较丰富互补的定价信息。
  • 结论:构建因子组合可有效利用不同信息来源,提升预测效果[page::6]。


图9-11(日间溢出因子,页面7-8)


  • 描述:日间因子分组表现、Rank IC及多空收益净值;

- 解读:分组收益体现明显单调性,Rank IC稳定上升,多空收益持续增长且回撤控制良好。
  • 结论:日间构造方法提升因子结构性和有效性[page::7,8]。


表7(日内采样构造溢出因子,页面9)


  • 描述:基于跨日K线拼接的高频采样特征回测结果;

- 解读:绝大多数因子Rank IC>2%,年化收益>20%,窗口多采用短期,反映跨日高频特征能很好捕捉连续行情信息。
  • 结论:跨日拼接特征为动量溢出因子带来附加信息,助力更细粒度多空选股[page::9]。


图13-15(日内溢出因子,页面9-10)


  • 描述:日内采样溢出因子各分组收益、Rank IC以及表现曲线;

- 解读:因子单调性较好,年化收益30.2%,但最大回撤高达22.3%,体现信息频率高带来的潜在风险。
  • 结论:需风险管理优化高频因子使用[page::9,10]。


表8-9 / 图16(多行业划分,页面10-13)


  • 描述:多行业分类对应的因子最优参数、分组以及相关性分析;

- 解读:不同行业分类提供多维低相关信号,整合提升整体因子性能,到年化收益32.7%,夏普3.26。
  • 结论:行业分类多样化构造富含互补信息,利于构建稳健组合[page::10-13]。


图17-19(多行业划分因子表现,页面13)


  • 描述:多行业划分因子分组、Rank IC累计及多空净值表现;

- 解读:持续积累有效预测信号,回撤控制显著优于原始因子;
  • 结论:多行业组合显著改进动量溢出因子性能[page::13]。


表10(因子相关性统计,页面13)


  • 描述:日间、日内、多行业因子相关矩阵;

- 解读:因子互相关中度,显示共性及互补;
  • 结论:和合成因子有助于提取更丰富定价信息[page::13]。


图20-22(溢出效应改进因子,页面14)


  • 描述:最终合成因子分组排名、Rank IC及收益曲线;

- 解读:优异的单调性与持续稳定的预测能力,收益曲线稳健上扬。
  • 结论:因子改进迭代成功[page::14]。


表11(因子不同选股池表现,页面14-15)


  • 描述:不同股票池(全市场、国证2000、中证500、沪深300)回测表现;

- 解读:小盘股选股效果更好,国证2000组合夏普最高3.97,收益显著超越基准;
  • 结论:溢出因子在不同市值段均有有效应用,尤以小盘股更佳[page::14-15]。


表12-13 / 图27-29(专利溢出因子表现,页面15-16)


  • 描述:专利关联溢出因子表现、与行业因子及低频因子库的相关性;

- 解读:独立性高,收益稳定,夏普3.86,极低相关支持信息增量;
  • 结论:专利关联网络为行业因子提供了重要补充[page::15-16]。


图30-32 / 表14(溢出复合因子表现,页面17)


  • 描述:复合因子分组、Rank IC、多空收益与多因子性能对比;

- 解读:周换仓收益32.9%,夏普4.58,最大回撤5.3%,全面领先原始与单一因子;
  • 结论:复合策略达到理论和实证优化高度,是综合应用的首选[page::17]。


---

4. 估值分析



本报告核心聚焦因子构建与性能回测,不涉及传统企业估值模型(如DCF、市盈率等),估值分析未出现。因子价值主要以策略表现指标(多空收益、夏普比率、最大回撤、Rank IC、卡玛比率)衡量,属于量化投资范畴。

---

5. 风险因素评估


  • 政策与市场环境变化:模型依赖历史数据的统计规律,未来若政策或市场结构突变,因子可能失效;

- 小盘股和微盘股风险:高频因子在小盘市场表现佳,但受流动性冲击较大,回撤风险较高;
  • 第10组异常收益问题:同样存在部分因子分组尾部表现异常,需持续监控和调整因子构成;

- 因子失稳风险:高频数据特征固有的噪声和频繁更新带来潜在波动加剧风险;

报告并未详述缓解方案,但通过剔除第10组、组合多类型因子及多行业分类实现一定风险分散,其策略稳健性有所提升[page::0,2,17]。

---

6. 批判性视角与细微差别


  • 因子剔除尾部第10组收益为主要改进,却未深入探讨第10组收益锐减内在原因,或许疾病模型未能完全捕捉极端价值或流动性挤兑风险。

- 高频数据噪声与计算复杂度较大,报告虽强调采用均值与标准差调整等手段,但未详细披露具体计量方法及交易成本影响,投资实践中存在不确定性。
  • 报告重点偏向于收益和夏普,风险指标如最大回撤虽提及,但较少分析风险暴露成因和极端风险管理。

- 专利关联网络定量化构建过程较为抽象,实际应用中数据更新频率和准确性有待观察。
  • 报告整体讲述严谨,但部分表格与图表排版中存有乱码及格式杂乱,影响阅读体验,需要注意数据准确传达。


尽管如此,报告对高频因子构造逻辑清晰,实践路径合理,有较好的创新和拓展价值[page::1-17]。

---

7. 结论性综合



兴业证券兴证金工团队围绕行业动量溢出因子的创新构造,利用关联网络理论结合高频数据采样,提出了三大改进策略:多行业分类整合、多维日内特征(不跨日)构造、以及跨日高频K线拼接构造。通过剔除传统行业溢出因子表现不稳的第10分组,并综合多样化特征,显著提升了因子的收益率和预测能力。
  • 原始行业溢出因子年化收益19.0%,夏普1.8,最大回撤14.3%,Rank IC 3.11%,表现良好但单调性欠佳。

- 改进因子如日间溢出因子、日内采样因子、多行业划分因子,均显著超越基础因子,年化收益提升到28.9%-32.7%,夏普一律提升至2.7以上,最大回撤普遍下降至9%-8%水平。
  • 终极合成因子(行业溢出合成因子)年化收益39.3%,夏普3.83,最大回撤10.9%,Rank IC 3.95%,表现卓越。

- 专利关联网络衍生因子作为连续关联网络补充,提供18.2%年化收益及较低风险,可独立贡献增量信息。
  • 溢出复合因子整合行业与专利两个维度,兼顾离散与连续关联,年化收益32.9%,夏普4.58,最大回撤5.3%,是最优策略,风险调整后表现最佳。

- 因子在不同股票池中均呈现稳定收益,尤以小盘市场效果最佳,小盘股段的夏普高达3.97,收益优于大盘。
  • 多重低相关因子组合和跨行业、多维高频特征赋予因子高度稳定性和预测能力,解决了因子单调性差及预测能力不足的瓶颈问题。

- 结合高频数据的动因深刻揭示市场短期流动性与跨行业溢出定价机制,具备较强实战量化投资应用价值。

图表中大量滚动收益曲线、Rank IC变化曲线、因子相关性热力图和多行业分类解构,均支持上述观点,并显示因子改进的连续性强和波动风险控制良好[page::0-17]。

---

总结

本报告展现了在多维高频采样与行业关联网络下构建动量溢出因子的系统框架与实证成效。通过创新数据处理与强关联网络的综合利用,改进因子取得显著性能提升,为量化选股和资产配置提供了全新视角和实践路径,具备高度参考价值及持续优化的潜力[page::0-18]。

---

参考图表示例



-

-

-

-

(以上图表均为报告中数据展示依据,辅助理解因子表现和改进成效)

---

溯源标识示例
涉及数据、结论均来源于报告页码,现均在相应段落末尾以[page::x]标识标注。

报告