`

高频因子(十一) 高频数据的微观划分

创建于 更新于

摘要

本报告基于高频量价数据,详细划分交易微观结构,识别不同交易性质下的量价因子表现差异。研究显示,交易异常活跃的时间段价格变动呈现强反转效应和低波效应,体现低风险确定性收益的特征,而交易平缓区间则呈现弱动量效应和风险溢价特征。通过去除开盘时段的异常交易,进一步提纯反转因子表现。相比传统的上下行和整体活跃度划分,直接基于成交活跃状态的划分在因子表现改善和信息提纯上效果更佳。[page::1][page::4][page::13][page::19]

速读内容

  • 高频因子基于交易微观结构区分交易性质,发现每笔成交量大阶段价格变动呈强反转效应,成交量小阶段呈动量效应。图1和图2显示反转效应与成交量区间呈线性关系,成交量越大反转越明显。[page::4]


  • 通过均值+1倍标准差划分交易活跃时间段,隔离知情者交易与非知情者交易,波峰计数因子回测表现稳定,波峰计数因子表达了信息不对称带来的风险溢价。图3和图4展示个股成交量峰值与全市场因子净值走势。[page::5]


  • 反转因子在不同交易活跃度区间具有相反的收益排序和信息量特征,异常活跃区间因子信息量更高,表1展示风险指标和信息比,表明反转效应主要来自异常交易阶段。[page::7][page::8]


图5、6、7、8展示反转因子在全市场和中证800不同区间分组收益情况。





表1 微观结构下反转因子风险指标摘要:

| 指标 | 整体 | 异常 | 正常 |
|--------|---------|---------|---------|
| IC(全市场) | -7.87% | -7.96% | -0.31% |
| ICIR | -94.25% | -99.01% | -4.18% |
| 多空收益 | 27.49% | 26.82% | 1.82% |
| 多空夏普比 | 2.99 | 2.93 | 0.27 |
  • 波动率因子也表现出类似特征,异常交易区间波动率因子信息量和区分度最高,呈现低波效应,正常区间波动率因子弱,部分表现风险溢价特征。图9-12和表2为支持数据。[page::9][page::10]







表2 微观结构下波动率因子风险指标摘要:

| 指标 | 整体 | 异常 | 正常 |
|---------|---------|---------|---------|
| IC(全市场) | -5.21% | -6.52% | -3.22% |
| ICIR | -37.28% | -49.33% | -23.97% |
| 多空收益 | 12.10% | 16.29% | 4.47% |
| 多空夏普比 | 0.82 | 1.10 | 0.38 |
  • 流动性因子在三个区间的表现一致,均表现流动性溢价,信息量无显著差异,说明流动性因子受交易活跃度影响低。图13-16和表3佐证。[page::10][page::11]







表3 微观结构下流动性因子风险指标摘要:

| 指标 | 整体 | 异常 | 正常 |
|--------|---------|---------|---------|
| IC(全市场) | 9.00% | 8.71% | 9.01% |
| ICIR | 54.42% | 51.81% | 55.45% |
| 多空收益 | 35.83% | 35.95% | 35.29% |
| 多空夏普比 | 2.15 | 2.10 | 2.14 |
  • 因子截面自相关性显示反转因子和波动率因子衰减快,流动性因子衰减慢,说明低风险确定性收益因子与交易异常相关,而高风险高溢价收益因子刻画固有风险,与异常交易关联弱。图17-18及表4数据支持此结论。[page::12][page::13]





表4 微观结构下因子信息量变化对比(截选):

| 因子 | 类型 | 整体(IC) | 异常(IC) | 正常(IC) |
|--------|--------------|----------|----------|----------|
| 反转 | 低风险收益因子 | -7.87% | -7.96% | -0.31% |
| 波动率 | 低风险收益因子 | -5.21% | -6.52% | -3.22% |
| 流动性 | 高风险溢价因子 | 9.00% | 8.71% | 9.01% |
  • 上下行划分对波动率因子的改进效果不如基于交易活跃度的划分,上行区间低波效应略增强,下行区间减弱,整体差异收敛且衰减较弱,表5数据说明此点。[page::14][page::15]


表5 上下行划分下波动率因子风险指标摘要:

| 指标 | 整体(IC) | 上行(IC) | 下行(IC) |
|--------|----------|----------|----------|
| 全市场IC | -5.21% | -4.52% | -4.40% |
| ICIR | -37.28% | -33.10% | -30.70% |
  • 时间段划分显示日内开盘及收盘时间交易活跃,但此划分方式与个股异常交易划分存在矛盾,活跃时间段反转效应较弱,平缓时间段反转效应较强,推测是全市场整体交易活跃与个股异常交易存在区别,时间段划分不能有效提纯信息。表6及图19、20数据表明此点。[page::15][page::16]





表6 时间段划分下反转因子风险指标摘要:

| 指标 | 整体(IC) | 活跃区间(IC) | 平缓区间(IC) |
|-------------|----------|--------------|--------------|
| 全市场IC | -7.87% | -2.67% | -8.30% |
| 全市场ICIR | -94.25% | -40.21% | -95.89% |
  • 剔除每日开盘09:31交易活跃时间段后反转因子表现进一步提升,因该时段价格变动体现动量效应,剔除后可更好提纯异常交易带来的反转效应。图21、22和表7具体呈现该改进效果。[page::17][page::18][page::19]





表7 交易活跃及时间段划分下反转因子风险指标摘要:

| 指标 | 交易活跃前(IC) | 交易活跃后(IC) |
|-----------|----------------|----------------|
| 全市场IC | -7.96% | -8.27% |
| 全市场ICIR| -99.01% | -101.00% |
  • 综上,基于高频数据的微观结构划分,可以更精细区分交易性质,显著提高反转、波动率等低风险确定性收益类因子表现,流动性因子表现稳健,划分合理性体现在提升因子信息纯度和收益的有效性上。[page::18][page::19]

深度阅读

高频因子(十一) 高频数据的微观划分——详尽分析报告解构



---

一、元数据与报告概览


  • 报告标题:高频因子(十一) 高频数据的微观划分

- 报告作者与联系方式:覃川桃、郑起(长江证券研究所)
  • 发布日期:2021年3月22日

- 机构:长江证券研究所
  • 研究领域:金融工程,专题报告,聚焦高频量价因子和微观结构分析

- 报告主题:通过高频数据的微观划分方式,深入探讨交易微观结构对量价因子(反转、波动率、流动性等)的影响和改进路径。

核心论点摘要:


  • 利用高频数据刻画交易微观结构,可以区分不同性质的交易时间段,从而对量价因子进行更精细的构建和优化;

- 不同交易活跃度的区间中价格变动表现出不同趋势效应和风险属性,反转和波动率因子在异常活跃时段表现更强,流动性因子表现稳定但对活跃度区分无显著增益;
  • 基于因子收益来源进行微观划分能更有效提纯信息、增强因子表现,优于基于行情涨跌或市场整体活跃的划分;

- 特殊时间段(如每日9:31开盘)因隔夜信息消化导致动量效应,剔除这部分时间段可进一步提升因子表现;
  • 报告同时指出模型存在失效风险,历史数据结果不保证未来收益。


[page::0, page::1]

---

二、逐节深度解读



2.1 交易微观结构介绍(第4页)


  • 高频数据最大优势是通过“微观结构”的划分,对量价因子进行逻辑上的表达和收益增强。

- 针对反转效应,采用每笔成交量的分组筛选,发现成交量最小组呈现动量效应,最大组呈现反转效应,表现出价格变动性质与成交量呈线性转换关系;
  • 反转因子方向默认为负,因传统21天反转因子基本面预期价位和过去收益呈现反向关系;

- 提出成交量既衡量成交活跃程度又反映价格变动,是异常交易的体现,异常活跃度逻辑导致反转效应的产生。

图表详解:


  • 图1(局部反转因子月度ICIR):成交量越大组的ICIR由正转负,说明大额成交组合成的因子表现出反转效应;

- 图2(年化多空收益率):小成交量分组多头收益为正,说明价格动量效应,但大成交量分组展现负收益,符合反转效应。

[page::4]

---

2.2 成交属性的微观结构(第5页)


  • 采用均值+1倍标准差方法,根据一分钟频率成交量区分“知情者交易”和“非知情者交易”:

- 大于阈值定义为知情者主导时间段,存在信息优势导致信息不对称风险;
- 小于阈值为非知情者主导时间段。
  • 波峰计数因子构建,定义过去20日过滤波峰数目,波峰计数越多未来预期收益越高,体现市场对信息优势带来风险溢价的补偿。

- 个股和全市场的图表显示:
- 浦发银行成交量局部峰值(图3)显示红、蓝两色区分不同交易性质时间段;
- 波峰计数因子(图4)回测净值表现良好,各分组遵循相对稳定并线性区分。

[page::5]

---

2.3 成交量划分下的微观结构(第6-8页)


  • 交易异常活跃时间段(“异常”)和正常交易时间段(“正常”)作为维度,结合反转、波动率、流动性因子进行了划分和回测比较。

- 反转因子表现:
- “异常”区间反转因子与“整体”区间表现较为接近且方向一致,表现因子越大收益越低(强反转效应);
- “正常”区间因子排序方向和表现与其他区间相反,表现因子越大收益越高(动量效应),且风格、行业剥离后更显著;
  • 通过图5-8(全市场及中证800,剥离前后)可见不同区间建因子收益排序不同,剥离行业对正常区间影响较大;

- 表1报道因子IC及风险指标:
- 异常区间IC为负且ICIR较整体区间更优,验证反转效应主要来自交易异常活跃区间;
- 正常区间转为动量效应,IC和ICIR为正。

[page::6, page::7]

---

2.4 波动率因子表现(第8-10页)


  • 波动率定义为局部收益标准差,按相同区间划分测试:

- 异常区间和整体区间排名接近,异常区间表现出更强的分组收益区分能力;
- 正常区间表现较弱,但剥离行业后显示一定的正向排序,表明正常区间波动刻画个股风险溢价;
  • 图9-12呈现全市场及中证范围内剥离前后分组收益图,异常区间分组收益差异最大;

- 表2风险指标说明异常区间IC和ICIR表现均略优于整体,正常区间信息量较小;
  • 波动率因子在异常区间呈现低波效应,反映“过度反应”期间价格波动较低。


[page::8, page::9, page::10]

---

2.5 流动性因子表现(第10-11页)


  • 采用高频流动性指标衡量成交额和收益率绝对值的比率(illiquidity);

- 三个区间(整体,异常,正常)因子表现一致,无明显分区间信息增益;
  • 图表13-16表现均衡,风格行业剥离前后线性保持良好;

- 表3风险指标显示各区间IC接近,ICIR类似,且多空收益和夏普比率无明显变动。
  • 说明流动性因子侧重个股固有风险复制,对交易活跃度划分不敏感。


[page::10, page::11]

---

2.6 量价因子的收益来源(第11-13页)


  • 因子收益来源分为两类:

1. 低风险确定性收益(反常行为驱动):反转因子、波动率因子,因子衰减快,捕捉局部交易异常,表现价格反转和低波效应;
2. 高风险高溢价收益(固有风险驱动):流动性因子,因子衰减慢,反映风险溢价特征。
  • 因子截面相关性分析(图17全市场、图18中证800):

- 反转因子截面相关性较低,衰减较快;
- 流动性因子截面相关性高,衰减慢;
- 波动率因子在异常区间衰减快,正常区间衰减慢,介于两者。
  • 表4信息量统计证实现象,异常区间强化反转和波动率因子信息量,正常区间削弱,流动性因子稳定。


[page::11, page::12, page::13]

---

2.7 划分的合理性检验(第14-17页)


  • 对比三种划分方式:

- 基于交易活跃度(异常与正常)
- 基于行情涨跌(上下行区间)
- 基于时间段划分(开盘、收盘活跃段与其他时段)
  • 上下行划分(表5):

- 市场上行区间价格波动更平稳(低波效应更显著),下行时波动溢价弱;
- 但上下行划分对波动率因子表现提升不及交易活跃划分;
- 多空收益与夏普比率指标较低,区分能力弱。
  • 时间段划分(表6,图19-20):

- A股呈典型“W”型日内活跃度分布(开盘、午盘开盘、收盘活跃);
- 反转因子在活跃时段反而表现为弱反转,平缓时间段反转增强,与交易异常划分相反;
- 表明全市场统一时间段划分无法有效区分个股异常交易。
  • 结论:

- 直接以交易活跃度异常划分效果最佳,且符合因子的低风险收益特征;
- 行情涨跌和时间段二次划分仅提供部分补充信息,或者在某些情况下削弱信息价值。

[page::14, page::15, page::16, page::17]

---

2.8 异常现象背后的逻辑及剔除开盘9:31时间段(第17-19页)


  • 开盘9:31时间段交易活跃,但价格表现动量效应,打破整体反转因子特征;

- 解释为开盘时需消化隔夜信息,导致价格动量驱动,非典型异常活跃行为;
  • 剔除09:31时间段后,反转因子表现整体提升(图21-22,表7),包括IC、ICIR和收益稳定性;

- 说明微观划分进一步细化,可提纯因子信号,减少噪声。

[page::17, page::18, page::19]

---

2.9 报告总结与核心观点重申(第18-19页)


  • 高频数据刻画交易微观结构,有助区分不同交易性质时间段及其对量价因子的影响;

- 交易活跃度高的时段带来强烈反转效应和低波效应,活跃度低时弱动量和风险溢价显现;
  • 反转和波动率因子收益主要来自交易异常中的不确定性,流动性因子主要反映固有风险,与交易异常关联弱;

- 微观划分宜直接基于因子收益来源的交易活跃状态,而非行情方向或统一时间段,用以提纯因子信号;
  • 剔除开盘时段能消除由信息消化引起的动量扰动,进一步增强反转因子表现。


[page::18, page::19]

---

三、图表深度解读



3.1 关键图表说明


  • 图1 & 图2(第4页):每笔成交量分组反转因子ICIR和年化多空收益率

- 体现成交量大小与价格变动属性(动量/反转)之间的线性转换关系。
  • 图3-4(第5页):浦发银行单日成交量局部峰值及波峰计数因子回测净值

- 显示实际知情者交易高峰与因子稳定收益关联。
  • 图5-8(第7页):不同区间划分反转因子分组收益

- 直观反映异常/正常交易区间对反转因子的异质表现。
  • 表1(第8页)与表2(第10页):反转和波动率因子风险指标(IC、ICIR、多空收益及夏普比)

- 数字详实证明异常区间因子信息量优于整体,正常区间信息较少甚至呈现反向效应。
  • 图9-12(第9页):波动率因子分组收益,异常时段具有更优区分能力。

- 图13-16(第10-11页):流动性因子分组收益及表现稳定,三个区间无显著差别。
  • 图17-18(第12页):因子截面自相关性,反转与波动率因子在异常时段衰减快,流动性因子表现慢。

- 表4(第13页):因子信息量对比,异常交易区间强化反转、波动率因子,流动性稳定。
  • 图19-20(第16页):展示个股及指数层面的每日分钟交易活跃度,突出开盘、午盘首分钟、收盘时间段活跃的“W”型特征。

- 图21-22(第17页):剔除09:31后反转因子净值曲线展示,明显提升线性和收益表现。
  • 表7(第18页)则清晰对比剔除前后反转因子风险指标,大多数指标表现改善。


数据来源及局限性


  • 数据来源于天软科技及长江证券研究所,覆盖股市高频量价数据。

- 高频因子及划分依赖过去结构,因此模型仍存在失效风险,未来市场结构及行为异动可能影响因子表现。
  • 分析基于中国A股市场,结论可能需要在其他市场进行验证适用性。


[page::1, page::4-22]

---

四、估值分析



本报告为高频因子专题研究报告,未涉及传统意义上的公司估值(如DCF、市盈率等)分析部分,侧重因子研究与性能回测,无直接目标价格或评级结论。

---

五、风险因素评估



报告中明确提醒两点:
  • 模型失效风险:因子构建与历史数据强相关,未来市场环境变化可能导致因子失效或表现退化;

- 历史数据局限:所有举例基于历史回测结果,不能保证未来收益稳定或绝对收益。

风险提示贯穿全文,强调投资者应谨慎对待高频因子及数据微观划分带来的交易策略,避免模型过度拟合或市场突变风险。

[page::1]

---

六、批判性视角与细微差别


  • 报告强调微观划分的合理性,直接基于异常交易活跃状态划分优于行情涨跌或固定时间段划分,但本质上依赖于成交量统计阈值的选择,可能对不同市场、不同时间段敏感;

- 结论中剔除09:31开盘时间段得到更好结果,体现了高频数据对特定事件敏感性,暗示该方法对特定市场惯性较强,推广存在一定限制;
  • 提示在反转因子构建中,市场整体交易行为与个股交易行为存在差异,全市场角度的分组收益表现与个股角度有时相悖,需谨慎区分层面效果;

- 未详细讨论流动性因子无增量信息的原因背后可能的市场结构或交易机制原因,留有后续研究空间;
  • 高频因子与交易行为的关系强调经验收益,缺乏更为理论化的支持模型,某种程度上依赖历史回测经验和统计特征。


---

七、结论性综合



本报告系统、深入地剖析了高频量价因子在不同微观交易结构区间下的表现差异,具体体现如下:
  • 交易微观结构的划分是利用高频数据核心优势,将交易时间细化为异常与正常活跃度区间,并定义异常区间主要由知情者交易驱动,正常区间更多由非知情者交易构成;

- 通过微观划分,发现反转因子和波动率因子在异常交易区间的信息量和效果显著提升,反映个股局部交易异常带来的价格反转与低波效应;而正常区间则更多表现动量特征及风险溢价,但信息量较少;
  • 流动性因子不受交易活跃度划分影响,因其本质反映固有风险的缓慢变化,刻画风险溢价稳定性高;

- 高频数据的使用使因子收益可以被提纯,基于因子收益来源进行微观结构划分,优于基于行情涨跌或市场整体交易活跃度的划分方法;
  • 报告展示了一些特殊时间段(如开盘9:31)的异动行情导致动量效应,通过剔除该时间段反转因子表现进一步纯化,提升整体因子稳定性和收益;

- 统计指标(IC、ICIR、多空收益、夏普比率)及截面自相关性充分佐证了不同交易区间相同因子表现的显著差异,反映微观结构划分在信息提纯方面的有效性。
  • 报告明确风险提示,指明模型依赖历史数据,未来表现受市场环境变化影响,存在失效风险。


综上,报告通过高频数据的细粒度区分,为量价因子提供了实证基础和改进思路,强调了市场交易行为微观机制对因子构建与选股策略的重要影响。此研究不仅丰富了因子研究方法论,也为基于高频数据进行主动投资策略提供科学依据。

---

总体评价



此份报告内容详实,结构严谨,数据支撑充分,因子构建逻辑清晰,结合大量图表和风险指标进行呈现,具有较强的实战指导意义。报告同时具有明确的风险披露和模型局限提示,展现专业与审慎态度。对于金融工程、量化研究及高频因子开发人员来说,报告提供了丰富的技术与实证经验,值得深入学习与借鉴。

---

参考图片展示(部分示范)



图1:每笔成交量筛选的局部反转因子月度 ICIR

图2:每笔成交量筛选的局部反转因子年化多空收益率

图5:微观结构下反转因子全市场分组收益

图9:微观结构下波动率因子全市场分组收益

图13:微观结构下流动性因子全市场分组收益

图17:全市场微观结构下因子截面自相关性

图19:个股截面交易活跃度

图21:交易活跃及时间划分下反转因子全市场净值(风格行业剥离)

图22:交易活跃及时间划分下反转因子中证 800 净值(风格行业剥离)

---

(因图片较多,以上为关键示范图,其他图表详细内容已在分析正文涵盖)

---

结语



本报告以高频数据为切入点,深度挖掘交易微观结构对因子构建的影响,完备的实证检验强化了量价因子在高频数据区间划分下的稳定性和表现差异,对投资实践和后续因子研究提供了理论+实操双重支撑,具有较高的学术价值和应用价值。[page::0,1,4-20]

报告