基础因子研究(九) 高频因子 (四): 高阶矩高频因子
创建于 更新于
摘要
本报告系统研究并构建基于单维度量价数据的高频高阶矩因子,涵盖收益率和成交量的一阶至四阶矩变量,揭示了两类“反常”交易逻辑驱动因子收益,回测显示高频因子选股能力突出,超额收益和信息比率显著优于传统因子,实现了因子构建与高频数据结合的有效改进 [page::0][page::19][page::6][page::19]
速读内容
高频因子构建方法及分类 [page::3]
- 高频因子主要基于量(成交量、换手率)和价(收益率)两类数据。
- 因子构建按维度划分为单维度单层次、多维度单层次、多维度多层次,本文聚焦单维度单层次高阶矩因子。
- 统计一阶矩至四阶矩,用以描述概率分布特征:均值、标准差、偏度、峰度,揭示交易行为异常。
收益率高阶矩因子表现及解读 [page::4][page::6][page::7][page::9]

- 收益率均值因子展现明显反转特性,和传统反转因子高度正相关。
- 高频相关的收益率均值类因子在全A股及中证800中均显著提升信息比和多空夏普比,且稳健。
- 收益率标准差类因子对应价格波动率,反映市场炒作过度,颜色显示多空收益明显但超额收益为负。
- 偏度和峰度类因子作为风险与收益分散的衡量,展示了稳定的选股信号,多空收益稳定但通常不突出。
成交量高阶矩因子研究与实证结果 [page::13][page::15][page::16][page::18]

- 以对数成交量、换手率和成交量占比构造标准差、偏度、峰度类因子,剥离股本等影响。
- 成交量标准差类因子在波动性和多空收益方面表现良好,换手率标准差无明显选股能力。
- 成交量偏度类因子展现收益显著且具有较强的线性关系,尤其在中证800表现稳定。
- 成交量峰度类因子表现一般,绝对量刻画的因子有一定的信息比及超额收益。
高频高阶矩因子总结及逻辑归纳 [page::19]
| 经济代理变量 | 收益来源说明 | 收益表现 | 高频效果 |
|----------------|------------------------------|---------------------|------------------|
| 收益率均值类因子 | 过度反应导致均值回归 | 超额和多空收益显著 | 高频改善显著 |
| 收益率标准差类因子 | 过度炒作导致价格回落 | 多空收益显著 | 高频无提升 |
| 收益率偏度类因子 | 收益散布风险集中特征 | 超额和多空收益显著 | 高频有改善 |
| 收益率峰度类因子 | 极端行情导致收益风险集中 | 超额收益显著,多空收益有限 | 高频显著改善 |
| 成交量标准差类因子 | 博弈激烈导致交易行为离散 | 超额和多空收益显著 | 高频有改善 |
| 成交量偏度类因子 | 交易异常导致价格反转 | 超额和多空收益显著 | 高频显著改善 |
| 成交量峰度类因子 | 极端变换导致收益不确定 | 超额收益显著,多空有限 | 高频显著改善 |
- 高频因子的“反常”本质分为过度反应和交易异常两大类,分别对应收益率均值、标准差、成交量偏度与偏度、峰度及成交量标准差、峰度等相关因子。
- 不同阶矩及不同频率数据下,代表因子表现最佳,如5分钟高频收益率均值因子信息比达1.11,多空夏普比2.65,表现领先[page::19][page::0][page::6].
深度阅读
基础因子研究(九):高阶矩高频因子深度分析报告
---
一、元数据与报告概览
标题: 基础因子研究(九)—— 高频因子(四):高阶矩高频因子
发布日期: 2019年8月9日
发布机构: 长江证券研究所
作者身份及联系方式: 郑起,证券分析师(执业证书编号:S0490513030001)
主题: 本报告集中探讨了基于高频量价数据的高阶矩统计量因子在A股市场的表现,研究了收益率和成交量两个维度的高阶矩(从一阶到四阶)因子的构造方法与选股能力,系统分析其经济含义、统计特征及实际回测表现。
核心论点和结论概括:
- 高频因子构建主要从量(成交量)和价(收益率)两大维度出发,区分单维度单层次、多维度单层次及多维度多层次三种构建方式,本报告聚焦单维度单层次,即单独使用收益率或成交量数据构建因子。
- 高频因子的收益来源于“反常”现象,主要包括过度反应(高估-回归)逻辑和交易异常(博弈激烈带来不确定性)逻辑两大类。
- 以全A股样本回测显示,高阶矩因子均具备一定的选股能力,其中收益率均值类因子(高频反转因子)表现最佳,成交量及其高阶矩因子表现亦较为稳健。
- 高频因子能够改善传统因子的信息比及多空夏普比,具有一定的实用价值。
- 高频因子的表现具有较强参数敏感性,不同k线频率下表现差别明显;不是越高频越好,存在最佳频率区间。
该报告系统且详尽地建构并验证了基于高频量价数据的多阶矩因子,揭示市场交易行为中隐藏的结构性机会,为量化投资策略的开发及风控提供坚实的理论和实证依据。[page::0,1,3,19]
---
二、逐节深度解读
1. 高频因子分类与理论基础
报告在第三页对高频因子分类做出系统梳理,指出高频因子构建采用单维度单层次(仅用价或量维度的数据)、多维度单层次(综合价量中单一数据)、及多维度多层次(综合价量多个数据指标)三类方法。下文对象即为单维度单层次中的收益率和成交量因子。
随后详细介绍了统计学中一阶至四阶矩的金融含义,定义如下:
- 一阶矩(期望):价格或成交量的平均水平。
- 二阶矩(标准差):波动率或成交波动幅度。
- 三阶矩(偏度):分布形态偏向,揭示收益的“厚尾”“歪斜”情况。
- 四阶矩(峰度):峰态高度,反映极端城市的发生频率和强度。
特别指出分布在经过线性变换后,高阶矩参数如何变化,确保因子计算的有效性。[page::3]
2. 收益率类高阶矩因子
a) 收益率均值类因子
- 收益率均值刻画的是个股的平均盈利水平,属于反转类逻辑范畴——市场对信息存在过度反应,盈利较高的股票往往均值回落。
- 通过Fama-MacBeth回归与相关性分析显示,收益率均值类因子与传统反转因子高度相关(相关系数最高达97%左右),且结合量数据的高频反转因子展现更高的信息比及超额收益。
- 以全A股及中证800指数为样本回测,高频因子显示出明显且稳定的选股能力,信息比达到1.11,多空夏普比达2.65,表明高频反转因子在策略构建中效果显著。
- 高频数据频率对收益影响较大,但收益率均值对参数敏感度较低,说明策略具有一定的稳健性。[page::5,6,19]
b) 收益率标准差类因子
- 标准差即波动率,代表价格变动幅度。虽然高波动股票理论上应获得风险溢价,但市场存在过度炒作,表现为空头组收益显著多头组不明显,主要因高波动股票价格可能被高估后回落。
- 相关性分析表明收益率标准差因子与流动性及反转因子正相关。
- Fama-MacBeth回归结果中残差标准差因子表现不佳,因子收益为负,且t值不显著。
- 回测显示该类因子多空收益显著但超额收益为负,且不同频率数据影响较小。
- 高频数据频率较高对普通标准差因子略有提升,但对残差标准差则无明显改善。[page::7,8,9]
c) 收益率偏度类因子
- 偏度衡量收益分布的非对称程度,反映盈利时长与风险集中度的关系。负偏度的股票大部分时间稳定盈利,偶有极端回撤;正偏度股票常为亏损状态但偶发大收益。
- 相关性显示该类因子与反转因子呈正相关。
- Fama-MacBeth回归结果表明残差偏度因子具有显著的统计功效,t值显著。
- 回测结果表明残差偏度因子具有稳定的超额收益与多空收益,表现平稳且受参数影响较大,不完全是越高频越好。[page::9,10,11]
d) 收益率峰度类因子
- 峰度描述收益分布的尾部厚度和极端波动的密集程度。高峰度股票收益大多集中于均值附近,极端回撤时集中爆发;低峰度股票收益分散且规避了极端风险。
- 峰度类因子与波动率因子有较高正相关。
- Fama-MacBeth回归显示出因子统计显著性,残差峰度类因子表现较佳。
- 回测结果指出残差峰度因子多头组区分度显著,具有一定超额和多空收益,但总体多空收益能力一般。参数的影响呈现明显的频率依赖性,高频数据提升效果较大。
- 绝对收益率峰度因子选股能力有限。[page::11,12,13]
3. 成交量类高阶矩因子
成交量因子以对数成交量为基础,考虑三大指标:成交量本身、换手率及成交量占比,分别从股本影响和相对比较两个角度反映市场交易行为。
a) 成交量标准差因子
- 量的标准差衡量交易活跃度的波动,通常对应于多空博弈激烈程度。
- 相关性分析体现此类因子与波动率及反转因子正相关,换手率标准差特别与流动性因子关系密切。
- Fama-MacBeth显示均有显著t值,但换手率标准差因子因剥离流动性影响后逻辑有所不同。
- 回测表明换手率标准差因子缺乏选股能力,成交量及成交量占比标准差因子则表现较好,存在一定的超额及多空收益。
- 高频数据频率显著影响表现,表现非线性,最佳频率为30至60分钟,不是越高频越好。[page::13,14,15]
b) 成交量偏度因子
- 偏度揭示交易量异常状况,右偏代表大部分时间成交不活跃,但偶有放量活跃期。左偏则相反,多数时间高成交、偶尔缩量。
- 该因子与其他风格因子关联度低,绝对级别的成交量偏度与动量及流动性无明显关系,但对数尺度下稳定性较好。
- 因子IC和ICIR表明部分因子具备一定预测能力,Fama-MacBeth回归中显著。
- 回测显示线性分组效应明显,且效用随频率提高增强。
- 高频频率对因子表现有正向影响。[page::15,16,17]
c) 成交量峰度因子
- 描述成交量极端波动,尖峰代表大多数时间平稳,偶尔有极端爆发或缺失,低峰则表示波动均匀。
- 相关性较低,绝对量峰度因子表现优于对数量峰度因子。
- Fama-MacBeth回归表明绝对量因子t值显著,预测能力较强。
- 回测结果显示成交量占比峰度无选股能力,绝对量峰度有一定超额收益但多空收益有限。
- 高频频率提高提升指标表现,从5分钟至30分钟效果较明显,之后呈下降趋势。
- 绝对量峰度因子整体表现优于正常化指标。[page::17,18]
---
三、图表深度解读
图1:中证全指日度收益率分布(页4)
- 展示了中证全指在日度频率下收益率的频率分布,具体为尖峰且右偏的“类正态”分布,均值0.06%,方差1.78,偏度-0.51,峰度3.30。
- 说明市场收益率在大多数时间较为集中于均值附近,但存在轻微的左偏和厚尾特征,反映极端收益事件的相对集中性。
- 这为后续利用高阶矩刻画收益率中特殊分布特征提供了基础依据。

图2 & 图3:全A股与中证800高频因子回测净值(页6)
- 图中展示了多个高频因子分组的净值增长轨迹,整体较基准呈现明显超额收益,且高频因子在全市场(图2)和中证800(图3)均实现稳健收益累积。
- 高频因子回测净值持续上升,尤其在市场波动剧烈的2014-2016年表现强劲,说明其在捕捉市场超额回报方面的有效性。
- 曲线的分组差异反映出因子排序的线性效应,优组收益明显优于劣组。


图4 & 图5:全A股及中证800残差标准差因子回测净值(页8)
- 图显示残差标准差因子尽管多空区分明显,但全A股中顶部和底部分组表现波动较大,中证800表现更稳健。
- 其中中证800因子的净值增长前期较为平稳,认为大盘股的波动因子表现更为确定。


图6 & 图7:全A股及中证800残差收益率偏度因子回测净值(页10)
- 净值曲线展示出较好的线性分组效应,优组收益明显领先基准,表明偏度因子有效识别盈利概率较高的个股。
- 中证800的走势更为稳健,反映大盘股中该因子的选股效果更佳。


图8 & 图9:全A股及中证800残差收益率峰度因子回测净值(页12)
- 多头收益分组有明显超额表现,优于基准,峰度因子辨识市场极端波动情况的能力突出。
- 中证800走势表现出同样趋势,但波动幅度较小,适合风险管理参考。


图10 & 图11:全A股及中证800成交量占比标准差因子回测净值(页14)
- 净值曲线显示,成交量占比标准差因子回测净值稳步上升,分组间表现差异明显,说明其在捕捉异常成交活跃度方面有一定功效。
- 中证800同样趋势,但整体净值水平偏低,更适用于大盘股监测。


图12 & 图13:全A股及中证800成交量偏度因子回测净值(页16)
- 净值分组清晰,优组复利明显优于劣组,流程体现量级异常情况下的收益捕捉。
- A股表现稍好于中证800,反映小盘股量的异常更为显著。


图14 & 图15:全A股及中证800成交量占比峰度因子回测净值(页18)
- 净值走势稳健,但高位回撤较明显,峰度因子说明极端成交异常对选股决策的影响。
- A股账户的收益率幅度明显优于中证800,更适合多样化组合策略。


---
四、估值分析
报告本身为高频因子研究及回测,未涉及传统的股票估值或目标价定义,故无估值模型针对具体股票或行业的说明。因子表现根据信息比(ICIR)和多空夏普比衡量,换言之,用回测超额收益和波动率评估因子有效性,体现因子对未来收益的解释力及风险调整后的表现。
---
五、风险因素评估
报告未专门设立风险章节,但间接涉及因子表现的稳定性与局限:
- 高频数据的噪声与非理性波动可能导致因子信号偏离真值,出现过拟合风险。
- 部分因子的统计显著性不足(如残差标准差因子),表明可能存在模型假设或市场结构变化影响。
- 高频因子表现对k线周期敏感,非越高频越优,参数选择不当可能降低策略表现。
- 部分因子意味着潜在市场反转或极端行情,风险控制需考虑可能的回撤及流动性约束。
虽然未明述缓释策略,但因子组合与多频率嵌套应用可望在实际运用中分散风险。
---
六、批判性视角与细微差别
- 报告的因子构建均基于高频数据且以线性模型剥离市场因素,部分残差因子收益存在偏差,意味着市场整体结构或因子设计可能未覆盖全部风险,需进一步验证因素稳定性。
- 高阶矩统计量定义对价格或成交的异常刻画具有一定假设,实际市场中极端值产生可能受市场微结构、政策影响等非统计规律驱动,因子稳定性或解释力或受限。
- 部分因子如成交量峰度类因子展现选股能力有限,且模式在不同参数与频率下表现差别较大,反映了高频策略存在一定模型风险和交易成本侵蚀问题。
- 报告基于全A股及中证800,市场层次与微观结构差异可能影响因子泛化能力,需结合个股特征做更精细的因子调适。
- 图表中部分因子的多空夏普比不高,显示信息比虽优但可能存在极端波动带来的风险敞口未充分反映。
强调报告中“高频因子改善显著”结论,必须结合具体策略设计和实际交易成本进行权衡,注意避免过度信赖统计显著性而忽视实际适用性。
---
七、结论性综合
本报告系统而详尽地研究了基于单维度价量数据的高阶矩高频因子,覆盖收益率和成交量两个核心维度的四个统计矩,挖掘了市场交易中的“反常”结构,包括过度反应和多空博弈两大类交易行为。
通过统计分析、相关性研究、Fama-MacBeth回归及历史回测,报告得出以下重要结论:
- 高频因子构建有效揭示市场波动、非对称及极端行为的微观特征,信息比和多空夏普比均有较好表现。
- 其中收益率均值类(高频反转)因子表现最佳,适合做为核心选股信号;收益率偏度和峰度因子为盈利稳定性和极端风险反映提供补充;成交量相关因子侧重识别交易异常行为,辅助风险判断。
- 高频因子组合提高预测能力,部分因子如残差类因子通过剥离市场因素获得更稳健信号,但需注意回撤和参数敏感性。
- 高频率未必带来更好表现,适宜选择合理频率如5至60分钟,以平衡噪声与信号。
- 因子收益来源于“反常”市场行为,分为过度反应(价高回落)和交易异常(多空博弈激烈)两类,体现复杂交易心理与市场结构机制。
图表与数据详尽支持了上述结论,丰富度与实证力度俱佳,是高频量价因子深度研究中的优秀案例,具备较强的理论与实操指导意义。
整体而言,报告维持积极评价态度,建议投资者关注高阶矩高频因子的策略开发和实证验证,结合市场流动性与成本因素,发挥其独特的选股和风险管理价值。[page::0-20]
---
主要图表与统计指标关键解读汇总
| 因子类别 | 代表因子 | 频率 | 关键指标 | 信息比(IC_IR) | 多空夏普比 | 超额收益(%) |
|-------------------|-----------|--------|-----------------------|---------------|------------|-------------|
| 收益率均值类因子 | 高频因子 | 5分钟 | IC -9.07%, t值显著 | 1.11 | 2.65 | 6.56 |
| 收益率标准差类因子| 残差标准差| 30分钟 | 因子收益偏负,t值不显著| -0.08 | 1.28 | -1.24 |
| 收益率偏度类因子 | 残差偏度 | 30分钟 | t值显著,稳定性好 | 0.68 | 1.87 | 3.40 |
| 收益率峰度类因子 | 残差峰度 | 5分钟 | t值显著,频率敏感 | 0.80 | 1.62 | 3.97 |
| 成交量标准差类因子| 成交量占比标准差|60分钟| t值显著,选股能力中等| 0.64 | 1.98 | 3.33 |
| 成交量偏度类因子 | 成交量偏度| 10分钟 | t值显著,频率相关 | 0.50 | 2.12 | 2.94 |
| 成交量峰度类因子 | 成交量占比峰度|5分钟 | 绝对量峰度因子优于对数| 0.47 | 1.29 | 2.33 |
---
综上,高阶矩高频因子研究为理解市场价量异常特征提供了有效工具,提升了量化选股的深度和精准度,同时提醒策略应用中注意因子稳定性、参数选取及市场适用性,建立稳健有效的量化框架。
---
本解析依报告原文内容展开,以上分析均带有明确溯源标识,确保信息链条透明、准确。