`

高频因子 (九):高频波动中的时间序列信息

创建于 更新于

摘要

本报告系统研究了高频波动因子,创新性地从频率与数据类型两方面拓展传统波动因子,构建并验证了多种高频波动因子。研究发现,1分钟频率的高频成交量波动因子具备稳定的选股能力,年化多空收益达20.84%,夏普比2.87。引入差分操作提取时间序列信息后,构建的差分标准差因子和差分绝对值均值因子表现进一步提升,最高年化多空收益达到34.13%。研究指出,波峰计数因子是捕捉局部峰值的更有效工具,表现最优,年化多空收益39.08%,夏普比3.41,且缩短调仓频率可进一步提升收益。各因子在风格中性后虽评价有所下降,但波峰计数因子仍保持显著选股能力,体现了高频波动因子在捕捉趋势交易行为中的潜力和应用价值 [page::1][page::4][page::5][page::8][page::11][page::14][page::20]

速读内容

  • 高频成交量波动因子构建及表现 [page::4][page::5]



- 采用1分钟频率内240根K线的成交量数据,计算日内标准差后再计算日间标准差,最后除以均值去量纲。
- 全市场年化多空收益20.84%,超额收益6.27%,多空夏普比2.87,信息比1.62。
- 中证800收益能力相对较弱,但依然稳定表现。
- 高频成交笔数、振幅等波动因子也展现一定选股能力,但不及成交量波动因子。
  • 日内与日间波动考虑的重要性及构建方式比较 [page::6][page::7]

- 同时考虑日内和日间波动(方式(4))的构建方法比仅考虑日内波动表现更佳,且后者易丢失有用信息。
- 高频数据频率提升(如1分钟)对提升因子表现显著,但过高频如快照数据会引入噪声。
- 成交量与成交笔数因子受益于高数据频率,振幅因子表现则在5分钟频率最佳。
  • 差分提取时间序列信息提升因子表现 [page::8][page::9][page::10]





- 差分标准差因子通过计算每笔成交量的差分序列标准差并归一化构建,反映时间序列上的波动形态。
- 全市场年化多空收益24.22%,夏普比1.76,但近两年回撤明显。
- 中证800表现相对较弱。
  • 优化为差分绝对值均值因子显著提高收益及稳定性 [page::11][page::12]



- 通过先对差分序列取绝对值再求均值替代标准差计算,避免波动负向收益抵消正向趋势。
- 因子多空收益提升至34.13%,超额收益7.95%,夏普比2.12。
- 但该因子对数据频率高度敏感,15分钟频率时表现几乎丧失。
  • 波峰计数因子识别局部峰值成效最佳,缩短调仓频率提升显著 [page::14][page::15][page::16][page::17]





- 通过阈值筛选成交量局部峰值,保留相邻峰值时间间隔大于1分钟的数据,计数作为因子。
- 全市场年化多空收益39.08%,超额收益7.10%,多空夏普比3.41,优于差分因子。
- 调仓频率从20日缩短至5日,多空收益和超额收益大幅提升至分别56.65%和9.03%,夏普比4.33。
- 参数敏感性较低,设置合理阈值和时间间隔筛选波峰是关键。
  • 风格中性调整后因子表现与风格暴露分析 [page::17][page::18][page::19]



- 高频波动因子与传统波动因子风格相关性低,主要暴露于反转、波动和流动性风格。
- 风格中性后,三个高频波动因子失去超额收益能力,但仍保留一定多空收益。
- 差分绝对值均值因子中成交量类因子仍保持一定多空收益,波峰计数因子多空收益和信息比降幅较小,仍有效。
- 说明高频波动因子在剔除风格因素后仍体现独特的选股信息。
  • 综合总结 [page::20]

- 高频波动因子的核心创新为高频数据应用和差分处理提取时间序列信息,弥补传统波动因子的不足。
- 波峰计数因子作为对局部峰值的简单直接度量手段,表现最佳且稳定性最高。
- 调仓频率优化有效提升因子收益,尤其波峰计数因子表现优异。
- 研究成果为量化投资中高频因子构建提供了理论基础和实证支持。

深度阅读

高频因子(九):高频波动中的时间序列信息 —— 详尽分析报告解构



---

1. 元数据与概览


  • 报告标题:高频因子(九):高频波动中的时间序列信息

- 作者与联系方式:覃川桃、郑起,长江证券研究所,执业证书编号分别为S0490513030001和S0490520060001。
  • 发布时间:2020年10月12日

- 发布机构:长江证券研究所
  • 研究主题:金融工程中的高频交易因子,特别聚焦于波动因子的高频化和时间序列信息的提取。

- 核心论点
- 传统的波动因子以日度收益率为基础,仅从截面波动角度度量波动;
- 本文重点提出高频(分钟级)波动因子的构建方式,特别是利用成交量等高频数据提取时间序列信息;
- 差分操作和波峰计数法能有效提取时间序列中的局部峰值信息,关联趋势交易者和知情交易者的行为,从而获得因子具有稳定且显著的正向收益能力;
- 在因子构建中,数据频率、因子构建的细节(如用均值替代标准差)及调仓频率对因子表现有显著影响,优化方法可提升收益和风险指标表现。
  • 主要结论

- 高频成交量波动因子取得年化多空收益20.84%,超额收益6.27%;
- 差分绝对值均值因子的表现更优,年化多空收益达34.13%,超额收益7.95%;
- 波峰计数因子表现最佳,年化多空收益39.08%,超额收益7.10%,调仓频率缩短后多空收益进一步提升至56.65%;
- 因子风格中性化后整体表现下降,但波峰计数因子仍保持较好选股能力;
  • 风险提示

- 因子模型存在失效风险,主要以历史数据回测为基础,不保证未来业绩延续。[page::1]

---

2. 逐节深度解读



2.1 从高频波动因子谈起及波动因子的高频拓展


  • 关键论点

- 传统波动因子使用日度收益率,忽视了日内波动。
- 本文将数据频率提高至分钟级,使用成交量等多类型高频数据构建波动因子。
  • 因子构建方式

- 以1分钟K线的成交量为例,先计算过去20个交易日内每分钟成交量的日内标准差,再计算这20天的标准差与均值之比,实现去量纲。
- 该因子能够捕捉日内和日间波动信息,提高选股能力。
  • 数据与表现

- 图1(全市场)和图2(中证800)显示因子从2010至今的回测净值增长趋势,尤其在2015年波动显著。
- 表1展示分年风险指标,显示因子在全市场的年化多空收益为20.84%,超额收益6.27%,夏普比2.87,表现稳健;
- 中证800表现稍弱,但仍然取得积极收益。
  • 分析

- 高频波动因子相比传统波动因子收益更稳定,在2019、2020年传统波动因子表现弱势时该因子依然稳健。
- 不同构建方式、数据类型、频率对因子表现影响显著,高频成交量因子表现尤为突出。[page::4, 5, 6]

2.2 日内波动与日间波动的处理


  • 核心信息

- 本文比较四种构建高频波动因子方式,分别对日内和日间波动的计算方法不同,重点在于如何去量纲与分步/统一计算。
- 结果显示,先计算日内波动,再计算日间波动的波动,再去量纲(方式4)效果最佳。
- 这种方式能更好地同时捕捉日内与日间的波动信息。
  • 数据支撑

- 表3详细列出三类数据(成交量、成交笔数、振幅)使用不同方式的IC、ICIR、超额收益率等指标,均显示方式4优于其他方式。
  • 意义

- 说明高频化不仅是频率提高,更重要的是对时间序列结构的合理考虑,尤其是分步提取不同层次波动,有助因子性能提升。[page::6, 7]

2.3 通过差分提取时间序列信息


  • 起点说明

- 图3、图4展示了浦发银行某日分时成交量的原始与排序后数据,二者标准差相同但时间序列结构不同。
- 传统的标准差指标忽视了数据在时间轴上的顺序信息,可能丢失有用信号。
  • 差分标准差因子构建

- 利用价格差分的思想,将成交量按时间差分后标准差计算,提取时间序列峰值信息。
- 公式说明日内差分标准差除以量级均值,实现去量纲。
  • 表现数据

- 图5、图6分别展示全市场和中证800中该因子回测净值。
- 表5显示因子年化多空收益24.22%,信息比0.51,正向收益明显,但近两年出现回撤。
  • 解析

- 该因子表现为正向收益,与传统“低波动获益”逻辑相悖,可能代表趋势交易者或知情交易者行为刻画。
- 因子不再表示纯波动,而是表征趋势相关峰值频率,日内和日间波动处理方式需调整。 [page::8, 9, 10]

2.4 差分绝对值均值因子构建及表现


  • 数学推导

- 差分标准差因子的数学性质解读表明,去除日内标准差,改为先对差分序列取绝对值再取均值效果更好。
  • 新因子构建

- 差分绝对值均值在日内先对差分比例取绝对值,隔日再取均值,提升因子对趋势峰值的灵敏度。
  • 表现分析

- 图7、图8及表6显示因子在全市场年化多空收益34.13%,信息比1.10,超额收益7.95%。
- 相较差分标准差因子,表现提升明显,说明新方法对收益预测更有效。
  • 其他数据类型表现

- 表7显示成交量、成交笔数、振幅等多种数据差分绝对值均值因子均有效,尤其是成交量和每笔成交量因子表现优异。
  • 逻辑

- 差分绝对值均值因子强化了对局部峰值幅度的捕捉,且对价格波动噪声更具有抵抗力。
  • 数据频率敏感性

- 表8数据频率变动测试中,因子对频率依赖高,15分钟数据下因子表现明显弱化。[page::11, 12, 13]

2.5 波峰计数因子的提出与构建


  • 理论动因

- 差分绝对值均值因子基于所有数据点计算,可能被平静期噪声影响。
- 直接计数局部峰值次数更直接反映趋势交易和知情交易。
  • 波峰定义方法

- 两步筛选:①大于均值加1倍标准差的数据点;②保留相邻峰值间隔超过1分钟的峰值。
  • 实证展示

- 图9与图10展示峰值筛选过程,明显剔除连续波峰,保留离散峰值。
  • 因子表现

- 图11、图12和表9显示该因子在全市场年化多空收益39.08%,多空夏普比3.41,超额收益7.10%,表现优于差分绝对值均值因子。
- 该因子分组效应稳定,全年几乎均为正收益,部分年份如2011年、2014年出现小幅回撤。
  • 结论

- 波峰计数因子不仅与差分因子基于同一逻辑,也因识别更准确而收益表现更加稳健。[page::14, 15]

2.6 参数及调仓频率的影响


  • 参数敏感性

- 表10分析了波峰计数因子的两个关键参数:阈值标准差倍数与最小时间间隔。
- 移除最小时间间隔导致因子有效性丧失,说明该参数确保峰值独立性至关重要;
- 阈值设置过低也削弱因子表现,体现合理峰值筛选重要性;
- 总体上,因子对参数不敏感,1倍标准差和1分钟间隔为合理默认。
  • 调仓频率影响

- 表11数据显示,调仓频率缩短对成交量波峰计数因子收益提升明显(从20天缩短到5天多空年化收益由39.08%提升至56.65%),且超过了交易成本影响;
- 差分绝对值均值因子调仓频率缩短效果不显著或基本持平。
  • 原因分析

- 因子信息时效性强,尤其是波峰计数因子,缩短调仓频率能抓住更多高频活跃机会,改善收益表现。[page::16, 17]

2.7 因子风格暴露及风格中性处理效果


  • 风格暴露情况

- 表12揭示多个因子均无明显基本面方向暴露(盈利、价值、成长),但对波动、反转和流动性存在一定暴露;
- 波峰计数因子对反转、波动有一定负向暴露,说明其选股逻辑与传统波动因子显著不同;
- 差分绝对值均值因子普遍对Beta、规模、波动及流动性呈负向暴露。
  • 风格中性后表现

- 表13显示所有因子风格中性后,超额收益下降明显,但多空收益仍保留;
- 波峰计数因子保持相对较强的超额收益和多空夏普比,表现最好;
- 差分绝对值均值因子多空收益依然存在,但超额收益较弱。
  • 进一步分析

- 图13和图14风格中性后的波峰计数因子回测净值曲线依旧表现优良,表14分年指标反映历年保持稳定收益,多数年份多空收益正向,回撤有限。
  • 含义

- 高频波动因子内含丰富信息,不完全叠加传统风格因子,风格中性处理虽削弱部分说明基本面不可忽视,但波峰计数等因子仍具一定独立选股能力。[page::17, 18, 19]

---

3. 图表深度解读


  • 图1与图2:显示1分钟频率成交量波动因子自2010年起至2020年的回测表现。分组区间分为10组,基准(市场指数)走势为灰色。表现突出年份2015年峰值明显,显示因子在极端行情中的对冲能力。

- 表1:量化指标详细展示因子不同年份的超额收益、信息比、夏普比等,突出2015年等年收益爆发,2014年回撤显著,表现稳定且收益总体优于中证800。
  • 表2与表3:对比各种数据类型和构建方法对高频波动因子的影响,揭示具体模型的优化方向。

- 图3与图4:形象演示差分提取时间序列信息的必要性,强调数据时序结构信息不能被忽视。
  • 图5至图8及表5至表7:展示差分标准差和差分绝对值均值因子的表现,明显的多个市场和时间窗口验证使结果稳健可靠。

- 图9至图10:峰值筛选过程可视化,直观体现因子设计的细化与噪声剔除流程。
  • 图11至图12及表9:波峰计数因子回测与风险指标,突出其相较差分因子有更强表现和稳定性。

- 表10与表11:参数敏感性和调仓频率对因子表现的影响,提供实操指导参考。
  • 表12和表13、图13至图14、表14:风格暴露和中性后表现,揭示因子独特性及实用性。


所有图表均与官方数据源(天软科技、长江证券研究所)匹配,呈现简洁且有力的实证支持。[page::4-20]

---

4. 估值分析



本报告不涉及财务估值模型或目标价预测,主攻高频量化因子的构建和实证表现,不包含传统的DCF、市盈率等估值方法论述。

---

5. 风险因素评估


  • 模型失效风险:所有因子表现基于历史数据模拟回测,未来市场环境变化可能导致因子失效。

- 历史表现不保证未来收益:因子收益和风险指标反映过去走势,面临不确定性和极端市况风险。
  • 参数设定风险:尽管因子对部分参数不敏感,过度调整或错误参数选择仍可能显著影响表现。

- 数据质量和频率风险:高频数据质量和频率选择对因子效果影响大,数据噪声可能掩盖因子信号。
  • 交易成本风险:缩短调仓频率提高收益可能伴随交易成本的上升,需权衡收益成本率。

- 策略因子风格暴露剩余风险:因子对某些风格(波动、流动性)有暴露,中性后的收益下降说明仍受风格风险影响。

报告未提出具体缓解策略,但风险提示明确提醒投资者注意历史与未来的不确定性。[page::1, 20]

---

6. 批判性视角与细微差别


  • 基于历史数据的局限:所有因子均源自历史回测,面临结构性变化、市场环境转变等潜在风险。

- 正向收益因子与传统认知冲突:差分标准差因子正向收益结果与常规“低波动获胜效应”存在内在矛盾,需理清其实质为趋势交易信号,而非波动本身。
  • 数据频率敏感性高:多因子对1分钟等高频数据敏感,实际应用面临数据处理和交易成本压力,频率降低即失效。

- 因子风格与多重假设:风格中性后因子收益下降明显,表明部分收益可能依赖于未完全剥离的风险因素。
  • 调仓频率成本权衡:缩短调仓频率提升收益潜力存在实际交易成本与滑点风险,理论收益难完全转化为实盘盈利。

- 过度拟合风险:因子设计的多参数调节可能导致部分模型捕捉噪声信号,建议未来以独立样本和实盘检验为准。

总体而言,报告以严谨的实证观察为支撑,但未来实际有效性和策略可持续性仍需额外验证和动态调整。[page::1, 20]

---

7. 结论性综合



本文系统探讨和实证了一类基于高频数据、尤其是成交量数据的波动因子,以挖掘时间序列信息中蕴藏的趋势交易及知情交易信号。通过逐步优化因子构建方法——从传统日度标准差,到高频日内+日间波动结合,再到基于差分的时间序列信息提取,以及最终的波峰计数识别,因子表现显著提升。
  • 传统高频波动因子能捕捉更细粒度的市场波动,年化多空收益超20%;

- 差分因子提取时间序列中的局部峰值,实现正向股价预测,年化多空收益超24%;
  • 采用均值代替标准差、对差分序列取绝对值均值的因子表现进一步优化,年化多空收益超34%;

- 波峰计数法作为最具解释力和稳定性的时间序列指标,达到年化多空收益39%,且缩短调仓频率后,该因子多空年化收益达56%,展现最优表现和信息时效性;
  • 因子表现对数据频率极为敏感,1分钟高频数据不可替代;

- 风格中性分析验证因子与传统的风险因子有区别,依然保留显著选股能力;
  • 展示出基于高频数据的“主题交易信号”在因子投资中的独特价值和潜力。


报告以丰富详实的图表和指标佐证了上述结论,系统且清晰地推动了高频因子研究的边界,是量化投资中深耕高频时间序列信息的重要理论和实践参考。

最后,报告谨慎提示因子模型的历史基准性质和潜在失效风险,呼吁关注数据质量、参数选择与调仓策略的动态适应。总体来看,波峰计数因子代表着高频量化因子设计中一个稳健且具收益优势的方向值得重点关注和持续研究。[page::20]

---

总结性说明



本报告提供了完备的高频波动因子研究框架,突破了传统波动因子对时间序列内在结构的忽视,结合统计学差分理论和经济学趋势交易逻辑,创造性提出了一套高效且稳定的因子体系。研究成果对量化策略设计者、风险管理者及投资者均具有显著启示价值。

---

如需对报告中特定图表进行详细解析或模型实现建议,欢迎进一步沟通。

报告