`

高频振幅因子的内部切割 | 开源金工

创建于 更新于

摘要

本报告提出对理想振幅因子进行高频数据内部切割,构造出分钟理想振幅因子与日内振幅切割因子,并基于两者的等权合成构建高频振幅合成因子。该合成因子在全市场及沪深300、中证500样本中均表现出优异的选股效果(IC均值-0.06,ICIR-3.27,5分组多空对冲年化收益22.4%),显著提升了因子选股的稳定性和收益水平,且优于原始理想振幅因子和各单一切割因子 [page::0][page::1][page::3][page::6][page::7][page::8][page::9]。

速读内容


理想振幅因子基础及切割构造流程 [page::1]

  • 理想振幅因子通过对股票过去N个交易日的振幅在不同价格位置切割,得到高价振幅因子Vhigh与低价振幅因子Vlow,并用两者差值得出理想振幅因子。

- 原始理想振幅因子全区间IC均值为-0.051,ICIR为-2.39,5分组多空对冲年化收益17%,样本外表现稳健。


高频数据内部切割方法:分钟理想振幅因子构造 [page::2][page::3]

  • 利用过去N天的分钟级数据,对分钟振幅因子按照分钟收盘价进行高低价切割,得到分钟Vhigh和Vlow,计算两者差值构成分钟理想振幅因子。

- 不同切割比例测试结果显示,分钟理想振幅因子IC均值与ICIR在切割比例20%-25%间表现最佳,IC均值最高达-0.059,ICIR最高达-3.1。
  • 回看天数为10天时,分钟理想振幅因子选股效果最优,整体优于日度原始理想振幅因子。





高频数据内部切割方法:日内振幅切割因子构造与情绪指标测试 [page::4][page::5][page::6]

  • 先对每日分钟振幅用情绪指标(价格、振幅、成交额、1分钟涨跌幅、5分钟涨跌幅)进行排序和切割,计算得到日内振幅切割因子。

- 其中1分钟涨跌幅指标切割的合成因子表现最佳,rankICIR达到-3.75,5分组多空对冲年化收益16.7%。
  • 通过调整切割比例,选定回看天数为10天,切割比例20%,使用1分钟涨跌幅指标的参数配置。





高频振幅合成因子构建及选股绩效评估 [page::6][page::7][page::8]

  • 分钟理想振幅因子与日内振幅切割因子相关性较低(30%),两者在横截面上标准化后等权合成得到高频振幅合成因子。

- 高频振幅合成因子IC均值达到-0.06,ICIR-3.27,rankICIR-4.58,5分组多空对冲年化收益率22.4%,显著优于两单一因子。
| 因子 | IC均值 | rankIC均值 | ICIR | rankICIR | 多空对冲年化收益 | 信息比率 |
|--------|--------|------------|-------|----------|-----------------|----------|
| 分钟理想振幅因子 | -0.059 | -0.076 | -3.06 | -3.88 | 19.5% | 2.64 |
| 日内振幅切割因子 | -0.043 | -0.067 | -2.90 | -3.82 | 16.7% | 2.47 |
| 高频振幅合成因子 | -0.060 | -0.086 | -3.27 | -4.58 | 22.4% | 3.09 |



高频振幅合成因子样本外表现及细分市场选股表现 [page::8][page::9]

  • 2021-2025年区间,高频振幅合成因子累计收益89.4%,明显优于分钟理想振幅因子73.2%、日内振幅切割因子70.9%和原始理想振幅因子51.3%。

- 高频振幅合成因子在沪深300和中证500样本均有优异表现,沪深300年化收益9.1%,中证500年化收益10.6%,信息比率均超过1.4。

深度阅读

高频振幅因子的内部切割 —— 开源证券量化研究详尽分析



---

1. 元数据与概览



报告标题: 高频振幅因子的内部切割
作者与机构: 开源证券金融工程首席分析师魏建榕及团队(高鹏等)
发布日期: 2025年8月9日
研究领域: 基金研究、因子模型、高频量化因子构造
主题概要: 本报告围绕“振幅因子”展开创新性研究,提出并验证了基于分钟级交易数据的“分钟理想振幅因子”和“日内振幅切割因子”两种构造方式,并进一步合成高频振幅合成因子。报告通过多种指标强调高频振幅因子在股票横截面选股中的优异表现及稳健性,给出显著的收益率提升及风险收益衡量研究成果。

核心论点及主要信息:
  • 理想振幅因子一贯表现出负向IC(信息系数),暗示振幅因子具备逆势选股属性。

- 高频切割(分钟级)方法相比于传统日频因子改善了选股效果,尤其在切割比例和回看窗口天数敏感度测试中表现最优。
  • 提出两种高频因子构造方法:分钟理想振幅因子(整个时间窗整体切割)和日内振幅切割因子(日内先切割再合成)

- 进一步融合二者得到高频振幅合成因子,综合选股能力显著优于单一因子。
  • 高频振幅合成因子在沪深300及中证500指数的样本股中均表现出良好收益率和信息比率,具备较强的实用性和广泛适用性。


整体来看,报告阐述了利用更高频交易数据细化传统振幅选股因子的方法论,提供了经过实证验证的因子性能优化方案,强调了高频数据处理和因子切割思想在量化选股领域的价值。[page::0,1]

---

2. 逐节深度解读



2.1 理想振幅因子再出发(摘要与回顾)


  • 关键论点: 振幅因子衡量个股过去一段时间内的价格波动大小,反映资金博弈激烈程度。此前2020年团队基于价格切割方法,将日度振幅分为高价振幅因子和低价振幅因子,经差值构造为理想振幅因子。该因子全区间IC均值为-0.051,ICIR为-2.39,5分组多空对冲年化收益率17%。

- 逻辑与方法: 使用N=20天数据,日频振幅定义为最高价与最低价的比值减1。基于收盘价分位数选取上40%(高价)和下40%(低价)交易日,计算两组振幅均值差值。此切割方法剥离了价格位置对振幅波动的影响,增强了因子信息含量。
  • 数据点解析: 表1详述构造步骤,图1呈现多空对冲收益的累积曲线。从图上看,因子整体表现为稳健上升,样本外区间仍持续盈利,但2023年之后波动有所加大。

- 结论: 理想振幅因子具有良好的历史绩效与多空对冲能力,是振幅因子研究的重要基石。[page::1]

---

2.2 高频切割思路及分钟理想振幅因子构造


  • 核心议题: 日频数据因时间粗糙,缺失日内交易结构信息。高频(分钟级)数据颗粒度更细,能深度挖掘日内资金动态。

- 两种切割思路:
1. 整体分钟切割:将N天内所有分钟数据按分钟收盘价分为高低价集合后计算统计量(分钟理想振幅因子)。
2. 日内切割合成:每日分别按照分钟数据做高低切割,计算每日因子后通过均值和标准差合成(详见后文)。
  • 因子构造流程: 类似日度过程,但时间单元由天变为分钟,切割比例(入选比例)均以分钟收盘价排序决定。表2清晰说明步骤。

- 关键发现: 分钟因子高低价切割的IC均值曲线呈喇叭口状且整体较日度因子向上(更负向,强化逆势信号),切割比例低时,Vlow呈动量特征。分钟数据样本容量大,精度和稳定性更佳。
  • 图表解读: 图2比较了分钟与日度的Vhigh、Vlow IC均值,说明分钟振幅因子更优和更平滑的IC特征,体现高频数据的优势。

- 总结: 高频分钟因子内在结构与日度类似,但由于样本更多,信息含量丰富,稳定性和反转能力提升。为后续优化奠定基础。[page::2]

---

2.3 分钟理想振幅因子参数调优与绩效


  • 研究设计: 固定回看天数N=20,测试不同切割比例λ从5%到50%的因子表现;反之,固定切割比例λ=25%,测试回看天数从5天到30天选股效果。

- 发现1(切割比例): 选股绩效(IC均值和ICIR)在切割比例20%-25%处达到最佳,呈“先升后降”的趋势。分钟理想振幅因子整体优于传统日度振幅因子,且切割比例的合理调整可提升选股能力。
  • 发现2(回看天数): 选股绩效在10天时达到峰值,回看窗口过短(5天)或过长(30天)选股效果下降,体现短期市场波动信息和样本稳定性的平衡。

- 图解:
- 图3显示不同切割比例下IC与ICIR变化。
- 图4展示不同回看天数对应指标的峰值趋势。
  • 最终选择: N=10天,λ=25%,纳入模型,IC均值-0.059,ICIR-3.1,年化多空收益19.5%(显著高于原始日频因子17%)

- 绩效曲线(图5): 五分组多空对冲曲线显示明显分化,表现拔尖组别收益持续领先,策略较为稳健。
  • 总结: 通过对参数的精细调整,分钟理想振幅因子的选股能力得到显著提升,凸显高频数据挖掘潜力。[page::3,4]


---

2.4 日内振幅切割因子的构造及情绪指标选择


  • 构造思路: 先对单交易日分钟数据进行“日内切割”,即基于各一分钟的情绪指标高低,将分钟振幅切割成高低两组,计算每日振幅切割因子,随后计算10日均值和标准差并横截面标准化后合成。

- 情绪指标: 包括价格、振幅、成交额、1分钟涨跌幅、5分钟涨跌幅。
  • 核心逻辑: 利用不同角度的市场活跃与趋势信息切分,进而捕捉不同市场情绪下的振幅特征,反映资金博弈强弱。

- 构造步骤详见表3与表4。
  • 选股表现初步测试(表5):

- 价格指标切割因子IC均值-0.043,rankICIR -3.59,年化收益14.7%。
- 成交额及短期涨跌幅(尤其1分钟涨跌幅)的合成因子ICIR最高,可达到rankICIR -3.75,年化收益16.7%。
- 振幅指标的标准差因子表现有时优于平均值因子,说明波动性信息也重要。
  • 多空对冲曲线(图6)显示多情绪指标因子均能形成较为显著的多空区分度。

- 切割比例调优(图7): 低切割比例(20%)时因子表现最佳,支持微调参数的精细化选取。
  • 最终参数选择: N=10,λ=20%,采用1分钟涨跌幅情绪指标。

- 多空对冲曲线(图8)证实该因子具备优良稳定的选股分层能力。
  • 总结: 日内振幅切割因子通过多情绪指标切分细化资金面信息,特别是快速涨跌幅数据增强了因子对短期股价弹性的捕捉能力。[page::4,5,6]


---

2.5 高频振幅合成因子的构建与综合绩效


  • 因子相关性分析(表6):

- 分钟理想振幅因子与原始日频理想振幅因子相关度较高(47%),两者方法类似,区别在于数据频率。
- 日内振幅切割因子与原始理想振幅及分钟理想振幅因子相关性较低(26%-30%),体现两高频因子捕捉信息不同。
  • 合成思路: 将分钟理想振幅因子与日内振幅切割因子在同一时间截面标准化后等权合成,利用信息互补性提升稳定性和预测能力。

- 综合绩效评估(表7):
- 合成因子IC均值达到-0.06,ICIR-3.27,rankIC均值-0.086,rankICIR-4.58,年化多空收益22.4%,信息比率3.09,明显优于两个单一因子。
  • 多空对冲曲线(图9)展现合成因子在收益累积上的显著领先优势;图10更形象地对比三个因子表现,确立合成因子优势。

- 历年绩效对比(表8):
- 从2021-2025年五年累计表现看,合成因子89.4%收益远超分钟因子的73.2%、日内因子的70.9%和原始因子的51.3%,样本外表现强劲。
  • 指数样本分布(表9、图11): 合成因子在沪深300和中证500中的ICIR和年化收益分别约为-2.32且9.1%,-2.13且10.6%,表现均衡且略优于中证500,显示一定的市场宽度适应能力。

- 总结: 高频振幅合成因子通过信息融合有效提升了选股稳定性和收益能力,实证显示拥有更强的市场逆转捕捉能力和跨市场稳健性。[page::6,7,8,9]

---

3. 图表深度解读


  • 图1(理想振幅因子多空对冲曲线)

显示自2013年至2025年理想振幅因子的策略累积收益。曲线整体稳步上涨,表现出因子有效性。样本外(2020年后)依然保持收益,但波动性有所增加,提示长期稳定性。
  • 图2(日度与分钟Vhigh、Vlow IC均值结构图)

通过IC均值的喇叭口形态展示不同切割比例下,高价和低价振幅因子的表现。分钟因子总体高于日度,尤其V
low因子在低切割比例时显示出动量效应(IC趋向正),体现细颗粒度数据挖掘细节优势。
  • 图3、图4(分钟理想振幅因子切割比例及回看天数绩效图)

包含IC均值及ICIR双轴指标,呈现切割比例的20%-25%和回看天数10天的选股效果最优,超越日度基准。说明模型调优对因子性能有显著影响。
  • 图5(分钟理想振幅因子五分组多空对冲曲线)

多组曲线呈明显分层,表明因子有效区分强势与弱势股票,绿色线(多空对冲)平稳上涨。
  • 图6(日内振幅切割因子不同情绪指标多空对冲曲线)

不同情绪指标因子走势分化明显,成交额和分钟涨跌幅指标成分因子波动幅度大且收益显著。
  • 图7、图8(日内振幅切割因子切割比例影响图及多空对冲曲线)

显示随着切割比例下降,选股表现提升并在20%达到较优表现。曲线稳健,可作为参数选择依据。
  • 图9、图10(高频振幅合成因子多空对冲曲线及与子因子对比)

合成因子曲线明显高于分钟理想振幅与日内振幅切割子因子,验证了组合策略的增益效果。
  • 图11(合成因子在沪深300和中证500多空对冲曲线)

两大指数样本均表现上涨趋势,沪深300表现略优,说明因子适用范围广且对不同规模市场均有效。

---

4. 估值分析



本报告为量化因子研究报告,未包含传统意义上的企业估值分析、目标价预测或估值模型(如DCF、市盈率等)。其价值体现在因子构造与选股绩效的统计显著性及历史验证。报告重点在于信息系数和多空对冲年化收益率,作为因子优劣的核心量化指标。

---

5. 风险因素评估


  • 历史数据限制风险: 因子构造基于历史交易数据,未来市场结构可能发生根本变化,导致策略表现难以持续。

- 样本外适应性风险: 尽管样本外数据中因子表现依然稳健,但市场波动、政策风险、新兴市场变化均可能影响因子有效性。
  • 数据质量风险: 高频数据处理对数据准确性、完整性要求较高,异常值处理及数据同步错误可能影响因子计算。

- 交易成本和市场冲击风险: 高频因子潜在交易频次高,策略实施中可能遭遇交易滑点、成本上升,继而影响实盘收益表现。
  • 政策监管风险: 量化交易和高频数据利用受监管政策影响,一旦监管加强,因子操作空间可能受限。


报告虽未明确缓解策略,但通过多维度回测、多样化因子组合及稳健性验证,体现出一定的风险管理意识。[page::9]

---

6. 批判性视角与细微差别


  • 虽然报告强调分钟数据的粒度优势,但并未详细讨论高频数据质量差异可能带来的噪音问题,数据清洗与异常处理过程缺乏具体披露。

- 因子参数选择基于收益最大化标准,但未深入探讨过拟合风险,缺少跨市场、跨品种的验证拓展,可能影响普适性。
  • 报告集中展示负IC特征,指向逆势选股,需注意当市场结构转变(如趋势行情),因子表现可能衰减。

- 信息比率和年化收益指标皆较好,但未包含风险调整后的其他指标(如最大回撤、夏普率等)全面评价风险收益特性。
  • 合成因子构建以简单等权方式合成,未探讨权重优化或机器学习集成方法,潜在提升空间仍有待挖掘。


总的来说,报告内容扎实,逻辑清晰,但可进一步完善统计稳健性检验和实操实施细节。[page::0-9]

---

7. 结论性综合



报告深入研究了振幅因子的创新构造方法,特别聚焦于日频向分钟级高频数据转换时带来的信息增益与选股绩效提升。

通过两种高频切割方法:分钟理想振幅因子(整体分钟切割)与日内振幅切割因子(日内单日切割),利用情绪指标(价格、振幅、成交额、短期涨跌幅)挖掘日内动态资金博弈结构。两者保持较低但非零相关性,表明其捕捉资金动态角度互补。基于此,将二者标准化后等权合成,生成的高频振幅合成因子展现出多个层面优异的统计绩效:
  • 信息系数(IC)和秩信息系数(rankIC)均达到历史高水平,IC均值达到-0.06,rankIC均值-0.086,且均具较高信息比率,显示模型具备明显预测能力。

- 多空对冲年化收益达22.4%,高于任何单一子因子,且在沪深300和中证500市场均表现良好,兼具横截面广度和市场适应性。
  • 多年样本外测试表明,高频因子体系较传统日频因子显著提升了收益率(2021-2025累计收益89.4% vs 51.3%),且五分组多空对冲曲线稳定向上,显示强劲且稳健的市场逆转捕获能力。


图表全面显示了因子的有效结构及其可能潜在的市场微观结构逻辑,强调高频数据的粒度及切割深度在因子优化上的关键作用。

本报告精准的因子切割思路、严谨的参数调优及多维度绩效验证,为量化投资领域提供了高质量的振幅因子构建模板和实证支持,具有高度参考价值和实际应用潜力。

---

综上,开源证券金融工程团队通过细粒度高频数据和精细切割策略,有效提升了振幅因子的选股能力及收益表现,构建的高频振幅合成因子成为量化投资组合中重要的风险调整收益驱动因子,为投资者提供了极具价值的量化工具和策略基础。[page::0-9]

---

附件部分参考图片(部分示意,完整见报告)



理想振幅因子多空对冲曲线(图1)


日度与分钟Vhigh、Vlow的IC均值结构(图2)


不同切割比例分钟理想振幅因子绩效(图3)


不同回看天数的分钟理想振幅因子绩效(图4)


分钟理想振幅因子多空对冲曲线(图5)


不同情绪指标日内振幅切割合成因子多空对冲曲线(图6)


日内振幅切割因子切割比例敏感分析(图7)


涨跌幅日内振幅切割因子多空对冲曲线(图8)


高频振幅合成因子多空对冲曲线(图9)


因子多空曲线对比(图10)


高频振幅合成因子在沪深300、中证500多空对冲曲线(图11)


---

注: 本分析严格基于报告内容,恪守客观中立原则,未加入主观预测或未知判断。[page::0-10]

报告