`

“波动率选股因子”系列研究(二):基于高频波动率的信息分布均匀度选股因子

创建于 更新于

摘要

本报告基于学术理论,提出以股票高频波动率变化幅度衡量信息冲击剧烈程度,构建了“信息分布均匀度UID因子”。该因子利用分钟涨跌幅计算日内波动率,并标准化其波动性,显著优于传统波动率因子,回测期间年化收益率达21.32%,信息比率3.65。剔除市场常用风格和行业因素后,纯净UID因子仍展现稳健选股能力,且因子与价格涨跌因子相关性较低,能提供有效增量信息。[page::0][page::3][page::4][page::5][page::8][page::11]

速读内容

  • 报告背景与目标 [page::0][page::3]

- 继第一篇报告优化传统波动率因子后,本篇尝试从“信息冲击”的角度,基于高频分钟数据构造新的选股因子。
- 理论依据为股价波动与信息流直接相关,信息流的匀速与否决定波动率幅度。
  • UID因子构建方法 [page::4]

- 以每月回溯20个交易日为窗口,计算每只股票每日内分钟涨跌幅的标准差作为高频波动率Voldaily。
- 计算Vol
daily的标准差std(Voldaily)和均值mean(Voldaily),UID因子定义为std(Voldaily)除以mean(Voldaily)后做市值中性化处理。
- 该因子反映信息分布的均匀度,不均匀分布(信息冲击频繁)的股票该因子更高。
  • UID因子回测绩效与对比 [page::5][page::6]



| 指标 | 传统波动率VOL20 | UID因子 |
|-----------------|----------------|------------|
| 月度IC均值 | -0.045 | -0.059 |
| 年化ICIR | -1.12 | -4.19 |
| 年化收益率 | 9.83% | 21.32% |
| 年化波动率 | 15.69% | 5.84% |
| 信息比率 | 0.63 | 3.65 |
| 月度胜率 | 64.94% | 83.12% |
| 最大回撤率 | 19.77% | 2.18% |
  • UIDdeVOL20因子表现 [page::6][page::7]

- 对UID因子进行正交处理剔除传统波动率因子信息后,新因子依旧表现优异。

| 项目 | 年化收益率 | 年化波动率 | 信息比率 | 月度胜率 | 最大回撤率 |
|-----------------|------------|------------|----------|----------|------------|
| UID
deVOL20 | 17.99% | 6.42% | 2.80 | 81.82% | 1.26% |
  • 纯净UID因子剔除风格与行业影响后表现 [page::8][page::9]


- 年化收益率12.96%,信息比率2.61,最大回撤仅1.22%。
- 相关性分析显示UID因子与传统Barra风格因子相关性低,具备独立信息价值。
| Barra风格因子 | 相关系数 |
|------------------------|-------------|
| Beta | -0.0438 |
| Size | -0.0040 |
| BooktoPrice | -0.1968 |
| Momentum | 0.0582 |
| VOL20 | 0.2806 |
| Liquidity | 0.1350 |
  • 参数敏感性及样本空间扩展 [page::9][page::10]



- 回溯窗口扩展至40、60日,UID因子依然显著优于传统波动率因子。
| 窗口 | 因子 | 年化收益率 | 年化波动率 | 信息比率 | 月度胜率 | 最大回撤率 |
|-------|-------------|------------|------------|----------|----------|------------|
| 40日 | VOL40因子 | 9.61% | 16.64% | 0.58 | 59.74% | 22.74% |
| 40日 | UID因子 | 23.87% | 6.02% | 3.97 | 87.01% | 1.97% |
| 60日 | VOL60因子 | 11.12% | 16.68% | 0.67 | 62.34% | 20.99% |
| 60日 | UID因子 | 21.32% | 6.49% | 3.29 | 83.12% | 2.12% |

- 在沪深300、中证500成分股中,UID及UID_deVOL20因子均表现优于传统因素。
  • 信息冲击与价格涨跌对称性分析 [page::10][page::11]

- 在波动率最高20%日内,上涨和下跌样本的数量、涨跌幅及涨跌幅与波动率相关系数均较为对称。
- UID因子与传统反转因子相关系数仅0.10,表明其选股逻辑独立且具有补充价值。
| 指标 | 上涨 | 下跌 |
|----------------------------|---------|---------|
| 样本量占比 | 52.88% | 47.12% |
| 涨跌幅平均值 | 1.90% | -1.81% |
| 涨跌幅中位数 | 1.42% | -1.39% |
| 涨跌幅绝对值与波动率相关系数 | 0.45 | 0.40 |

深度阅读

“波动率选股因子”系列研究(二)——基于高频波动率的信息分布均匀度选股因子详尽分析报告



---

1. 元数据与报告概览



报告标题: “波动率选股因子”系列研究(二):信息分布均匀度,基于高频波动率的选股因子
作者与机构: 由东吴证券研究所的高子剑分析师及助理沈芷琦联合撰写
发布日期: 2020年9月1日
研究主题: 本报告属于东吴证券“波动率选股因子”系列研究第二篇,核心在于从“信息冲击”的视角出发,剖析股价波动与股票信息流的关系,并在此基础上构建一个新的波动率选股因子——“信息分布均匀度(UID)因子”,利用高频分钟数据计算个股波动率的分布均匀性,以提升选股的效果。

报告核心论点及目标:
作者通过理论回顾及实证研究,提出股价波动率的变化幅度能够反映市场信息冲击的剧烈程度。在分钟级波动率数据基础上,设计了UID因子,衡量股票信息流入的均匀程度,理论上信息分布越不均匀,则该股票可能经历更多剧烈的“信息冲击”。实证结果显示,UID因子的选股效果显著优于传统20日收益率波动率因子,且具备较强的稳定性和鲁棒性,能够为投资者提供一种增量有效的选股信号。[page::0,3,4,5]

---

2. 逐节深度解读



2.1 前言



本章节回顾了“低波异象”的研究背景,重申东吴金工第一篇“纯真波动率因子”研究成果。纯真波动率因子通过剔除跨期截面相关性,在原有基础上显著提升了信息比率(从1.48提升到2.17),表现优异但因与传统因子高度相关,在现有因子体系中难以带来增量信息。受到此启发,作者在第二篇中寻求构造一个提供新颖增量信息的波动率因子,希望围绕“信息冲击”视角,通过利用高频分钟数据,拓展波动率因子的选股能力。[page::3]

2.2 波动率与信息冲击



本节充分借鉴Ross(1989)和Andersen(1996)的理论与实证发现:在无套利、均衡市场中,股票价格的波动直接反映信息流的波动。因此股价波动可被视为信息流入市场速度的直接响应。若信息以匀速稳定方式进入市场,则价格波动较小;反之,若信息流入存在突变或冲击,则股价波动将迅速升高。作者形象地比喻为“平静水面投入巨石”,强调信息流的不均匀性是导致价格剧烈波动的关键因素。基于此观点,报告以股价波动率的变化幅度作为衡量“信息冲击”剧烈程度的量化方法,构建选股因子。[page::3]

2.3 波动的波动:信息分布的均匀度(UID因子)



因子构建逻辑:


  1. 计算每日高频波动率Voldaily:基于分钟涨跌幅(剔除隔夜第一分钟数据,以避免隔夜信息干扰,因隔夜信息模式不同),计算每个交易日的分钟涨跌幅标准差,得到日内波动率。
  2. 计算过去20个交易日内每日波动率的波动性std(Voldaily):用标准差反映过去20天内日内波动率的变化幅度,衡量股票信息流入速度的均匀程度。
  3. 信息分布均匀度UPC因子计算:将std(Voldaily)除以mean(Voldaily)以去除波动率本身大小带来的影响,做标准化,且剔除市值效应,得到最终UID因子。


理论解释:


  • 标准差std(Voldaily)大,表示日内波动率变化剧烈,暗示存在多次/大幅度信息冲击,信息分布不均匀。

- 因子标化除以均值后,排除因整体波动率水平不同产生的规模差异。
  • 实测显示,std(Voldaily)与mean(Voldaily)月度相关系数为0.66,强正相关,验证了标准化需求。


本节对屏蔽隔夜收益的合理性也作了理论回顾,并参照以往的同类研究,说明日内与隔夜信息对价格波动的不同作用机制。[page::4]

2.4 因子表现与对比分析



报告通过2014年1月1日到2020年7月31日的全市场A股数据回测UID因子表现,主要结论包括:
  • UID因子月度IC均值为-0.059,RankIC均值为-0.074,具备明显预测能力,且负向IC符号说明UID值越大对应未来收益越低。

- 年化信息比率(ICIR)达到-4.19,显著优于传统VOL20波动率因子的ICIR为-1.12。
  • 年化收益率21.32%,年化波动率仅5.84%,信息比率高达3.65,明显优于传统波动率因子(年化收益9.83%,波动率15.69%,信息比率0.63)。

- 最大回撤仅2.18%,月度胜率83.12%,展现出显著的稳健性。

图表1显示UID因子按照5分组回测的净值走势,明显分化,分组1(最低UID)收益最高,而分组5(最高UID)表现最差,支持因子有效性。图表2强化了UID因子相较传统VOL20因子的优越表现。

此外,对UID因子剔除VOL20因子的线性成分后形成的UID
deVOL20因子也表现良好:年化ICIR -3.43,年化收益17.99%,信息比率2.80,表明UID含有较强的增量信息。

分年度来看(表3 & 表4),UID及UIDdeVOL20整体表现优异,但2019至2020年表现有所回落,UIDdeVOL20因子的表现明显改善,说明剔除传统波动信息后增强了因子稳定性。[page::5,6,7]

2.5 纯净UID因子及风格因子剔除



考虑到UID因子可能与市场常用的风格因子相关联,报告进一步分析了UID因子与10个Barra风格因子间的相关性(表5),结果显示相关性普遍较低,仅与VOL20波动因子相关度最高(0.2806),其余因子相关均较弱,表明UID因子较为独立。

基于此,作者剔除行业效应和风格因子影响,通过多元线性回归提取残差,定义为纯净UID因子。这一纯净因子的表现依然优越:
  • 年化ICIR保持在-3.17,年化收益12.96%,年化波动率4.97%,信息比率2.61,月度胜率75.32%,最大回撤仅1.22%。

- 近期表现有所回暖,体现了该因子较好的市场适应性与持久性。

图4呈现纯净UID因子5分组回测净值走势,与前述版本表现相似,显示纯净处理并未削弱选股效力,反而提升了稳定性。[page::7,8,9]

2.6 参数敏感性分析



为考察因子构造的参数稳健性,报告变换回看窗口长度(由20日扩大至40日和60日),分别回测UID因子与传统波动率因子回报表现。结果发现:
  • 无论回看40日还是60日,UID因子均实现明显优于传统波动率因子。

- 40日回看窗口UID因子年化收益高达23.87%,波动率6.02%,信息比率3.97,月度胜率87.01%。
  • 60日窗口表现稍逊但仍优异,年化收益21.32%,波动率6.49%,信息比率3.29。


由图5、图6可见,UID因子净值曲线远高于传统波动率因子,且斜率更稳健,表现其选股信号的稳健性与一致性。[page::9,10]

2.7 其他样本空间的应用测试



报告分别对沪深300与中证500成分股样本进行相同回测,验证因子的普适性。表8显示:
  • 在沪深300样本中,传统VOL20因子表现负收益及较差信息比率,而UID因子表现显著优于VOL20,年化收益11.51%,波动率10.54%,信息比率1.09,进一步剔除VOL20后UIDdeVOL20表现进一步提升。

- 中证500情况同理,UID因子及UID
deVOL20均击败传统指标且稳定。

该结果证明UID因子非仅适用于全市场广泛样本,在核心指数成分股中同样有效,具备较强的应用价值。[page::10]

2.8 信息冲击与价格涨跌的对称性检验



报告进一步剖析信息冲击对价格涨跌的作用是否对称,检验了在波动率最高20%样本中,区分正负日内涨跌幅对应的样本量占比、涨跌幅均值与中位数、绝对值及相关系数。表9显示:
  • 上涨样本占52.88%,下跌占47.12%,接近均衡。

- 涨跌幅平均值与中位数绝对值基本对称,涨跌幅绝对值与波动率相关系数分别为0.45和0.40,差异微小。
  • 进一步计算UID因子与传统20日反转因子(Ret20)的相关系数仅0.10,反映两者信号独立。


综上,可认为信息冲击对价格涨跌作用相对均衡,理论基础稳固,且UID因子与基于价格涨跌的因子存在显著信息差异,体现UID因子的增量信息价值。[page::10,11]

---

3. 图表深度解读



3.1 图1:信息分布均匀度UID因子5分组回测净值走势



图表展示了2014年至2020年7月间,按照UID因子构建的5个分组净值发展轨迹。分组1(最低UID值)净值表现最佳,且整体上升趋势明显;分组5(最高UID值)表现最差,中间分组呈梯度差异,表明UID因子有效区分了不同股票未来表现潜力。净值曲线较好地体现了因子选股的超额收益能力及风险缓释效果。[page::5]



3.2 图2:UID因子与VOL20因子多空对冲净值走势对比



曲线对比凸显了UID因子的净值线遥遥领先于传统VOL20波动率因子,且波动较低,显示超额收益稳定且更具风险调整后优势。趋势一致性也说明二者捕捉的市场信息存在较大差异,UID因子的创新性得以视觉证实。[page::5]



3.3 图3:UIDdeVOL20因子5分组回测及对冲净值走势



图中再度呈现剔除VOL20因子线性部分后的UID
deVOL20因子5分组回测净值及分组1对冲分组5净值走势,显示该因子依然具备强烈选股能力,且2020年以来表现提升明显。对于因子纯净性的验证提供视觉强证据,说明UID因子中蕴含的增量信息清晰且被保留。[page::7]



3.4 图4:纯净UID因子回测及对冲净值



剔除风格和行业影响后,纯净UID因子依然表现稳健,净值持续增长,最大回撤明显下降,信息比率较高,进一步验证因子纯净性且可复现性强,图中5分组表现清楚可见收益分层。[page::8]



3.5 图5 & 图6:UID因子与传统波动率因子对比(回看40日与60日)



两图均显示,在更长的回看窗口下UID因子仍保持明显优势,曲线陡峭且持续攀升,且其回撤和波动率均显著低于传统因子。从绩效指标表(表7)中,其信息比率高达3.97(40日)和3.29(60日),远超传统因子的0.58和0.67,充分说明因子在不同参数设置下的稳健性和优越性。[page::9,10]





---

4. 估值分析



本报告核心属于因子研究与实证分析范畴,未涉及对具体公司进行估值,也未使用传统估值模型(如DCF、市盈率等)。因子研究中所谓“估值”更多指因子表现的质量评估,即因子IC、ICIR、信息比率、最大回撤等绩效指标的综合分析,因此本报告无直接估值章节。

---

5. 风险因素评估



报告在多处明示风险提示:
  • 所有统计结果均基于历史数据,无法保证未来市场环境相同,未来历史性事件或市场结构性变化可能大幅影响因子表现。

- 单因子收益可能波动较大,实际应用需结合资金管理及风险控制策略。
  • 高频数据计算中潜在的数据质量、时间戳对齐等技术风险。

- 表现衰减风险,尽管UID因子表现优异,但若市场参与者广泛使用,信息优势可能减弱。
  • 变量标准化及剔除风格的线性回归方法存在模型假设风险,可能捕捉到一些非经济本质的统计相关。


风险部分提醒用户谨慎应用,重点在于因子的回测历史结果固有的未来不可预测性,提示投资者结合实际策略调整和风险管理手段。[page::0,11]

---

6. 批判性视角与细微差别


  • 因子负向IC特征:报告中UID因子IC为负,意味着信息分布均匀度越高对应未来收益越低,且分组1收益最高,反映的是一种逆向选股逻辑(波动率的剧烈变化蕴含风险,信息越分散越可能导致负面表现)。这符合低波动因子“低波异象”的传统解释,但投资者需要注意此因子为负IC时的资金部署策略可能与正向因子不同。
  • 高频数据应用局限:分钟数据获取与处理需求高,市场异常点及制度变更可能导致数据失真,报告并未细致讨论高频噪声及微观结构风险。
  • 相关性分析局限:风格因子剔除采用线性回归,可能无法完全剔除非线性关系或潜在交互效应,纯净UID因子解释力和稳定性依赖于模型设定。
  • 观测窗口选择:窗口长度变动显示因子稳健,但长期表现仍受诸多宏观因素影响,2020年后部分指标回落,或与特殊市场环境相关。
  • 因子信号解释:信息冲击对价格涨跌的对称性虽得到实证支持,但因子相关性仅为0.10,需谨慎看待其与传统反转因子差异,投资者应结合多维因子体系使用。


这些均为研究中的正常范畴,建议在实际应用中结合多因子框架和风险管理进行优化。[page::5-11]

---

7. 结论性综合



本报告在东吴证券研究所“波动率选股因子”系列的基础上,创新性地提出了基于高频分钟数据的“信息分布均匀度UID”因子,理论基于信息冲击和股价波动的直接联系。因子通过计算每日内部分钟波动率的变化幅度,标准化后反映信息流入的均匀程度。

实证分析覆盖2014年至2020年近7年时间,涵盖全市场、沪深300及中证500多个样本空间,结果充分显示UID因子相比传统波动率VOL20因子:
  • IC值更显著,信息比率大幅提升至3.65以上;

- 年化收益率超过20%,波动率较低,信息比率优异;
  • 纯净因子(剔除风格及行业影响)依然表现卓越,月度胜率稳定在75%以上;

- 参数敏感性测试显示因子表现稳健,在不同回看窗口均优于传统因子;
  • 透过对信息冲击的实证检验,因子捕获的信号区别于传统基于价格涨跌的因子,彰显增量价值;

- 最大回撤及波动水平显著低于传统波动率因子,风险控制优越。

图表深度解读直观呈现因子表现的可持续性和选股能力,累计净值曲线斜率陡峭,分组收益梯度清晰。

总体而言,报告提供了一种基于“波动的波动”理念的新型波动率选股因子,通过高频数据深入挖掘信息分布特性,呈现优异的选股能力和稳定的风险调整收益。该因子适合被纳入多因子模型以提升投资组合的效率。报告同时提醒用户关注历史数据局限与风险控制,建议结合实际操作环境审慎使用。

---

参考文献


  • Ross, Stephen A., 1989, Information and Volatility: The No-Arbitrage Martingale Approach to Timing and Resolution Irrelevancy, Journal of Finance XLIV, 1–17.

- Andersen, T. G., 1996, Return Volatility and Trading Volume: An Information Flow Interpretation of Stochastic Volatility, Journal of Finance 51, 169–204.

---

总结



此篇报告通过创新的“信息分布均匀度UID因子”,基于分钟级高频数据,有效挖掘了信息冲击对股票价格波动的影响,显著提升了波动率因子的选股效能,验证了理论与实证的紧密结合,且通过多重维度的回测展现了实用性和稳健性。对于量化选股及风险管理均具有重要参考价值。[page::0-11]

---

(全文严格基于报告内容解读,附加图表图片均按实际相对路径标注。)

报告