`

【国君金工】基于贝叶斯收缩的因子改良框架

创建于 更新于

摘要

本报告基于贝叶斯收缩思想提出因子改良框架,通过结合先验信息与统计信息,显著提升了量价相关性因子的多头预测能力。以量价相关性因子为例,采用行业内个股波动性作为先验信息,将其与差分量价相关性统计数据加权融合,改良后因子在全A及沪深300市场均表现出更优的分组单调性及超额收益,月频和周频超额年化收益分别提升至8.11%和15.18%。此外,改良框架对其他量价因子进一步纯化后,也展现了稳定的增量信息效果,为多因子选股提供了有力工具支持[page::0][page::2][page::4][page::6][page::8]。

速读内容

  • 多因子选股框架中因子构建模块重要性突出,单因子需兼顾IC、ICIR及分组单调性,且顶端组收益尤为关键,但量价类因子常出现多头组单调性差问题,影响alpha贡献[page::0][page::1]。

  • 常见改良方法包括原始变量差分、缩短计算窗口、多项式拟合与贝叶斯收缩,后者通过结合带有设定偏差的先验信息与含估计误差的统计信息平衡,提升估计精度和稳定性[page::2]。

- 以量价相关性(Pearson相关系数)构建的因子为例,原因子多头组分组收益表现不佳、存在收益反向特征,且周频因子在2015年4月至9月间增量信息不稳定。缩短计算窗口(例如5日一阶差分)虽提升短期分组单调性和顶端收益,但增加交易成本,存在权衡风险[page::2][page::3]。
  • 报告提出贝叶斯收缩改良方案:基于假设“知情交易者具备行业层面的信息优势,且偏好收益最大化”,推导出个股相对于行业的波动性(贝塔)与其资金流入(出)比例正相关,作为先验信息。将该先验与统计量价相关系数加权融合,形成改良因子[page::4][page::5]。

  • 贝叶斯收缩后的因子显著提升分组单调性及顶端收益,月频及周频超额年化收益分别达到8.11%和15.18%,且在全A与沪深300均保持稳定表现,归因于先验信息抑制了噪音资金的影响[page::6]。

  • 相关基础量价因子间截面相关性低,改良因子只与反转因子略相关。进一步在纯因子组合中加入零基础量价因子暴露约束,纯化后的改良因子在不同市场及不同频率下展示出稳定增量信息[page::7]。


| 因子名称 | 反转 | 波动率 | 异质波动率 | 换手率 | 非流动性 | 改良因子(p) |
|----------|-------|--------|-------------|---------|------------|---------------|
| 反转 | 1.00 | 0.19 | 0.30 | 0.11 | 0.02 | 0.36 |
| 波动率 | 0.19 | 1.00 | 0.79 | 0.61 | -0.13 | -0.18 |
| 异质波动率 | 0.30 | 0.79 | 1.00 | 0.51 | -0.11 | 0.14 |
| 换手率 | 0.11 | 0.61 | 0.51 | 1.00 | -0.38 | -0.06 |
| 非流动性 | 0.02 | -0.13 | -0.11 | -0.38 | 1.00 | -0.02 |
| 改良因子(p) | 0.36 | -0.18 | 0.14 | -0.06 | -0.02 | 1.00 |
  • 量价因子改良框架为多因子选股流程提供重要模块改进思路,帮助提升因子多头预测能力和实用性,后续可针对收缩系数动态调整及其他因子改良进行扩展研究[page::8].

深度阅读

【国君金工】基于贝叶斯收缩的因子改良框架——详细分析报告



---

1. 元数据与概览


  • 报告标题: 《基于贝叶斯收缩的因子改良框架》

- 作者: 陈奥林、刘昺轶(Allin君行)
  • 发布机构: 国泰君安证券研究所

- 发布日期: 2021年7月21日
  • 主题: 围绕多因子选股中因子构建与改良,尤其聚焦于利用贝叶斯收缩的方法改良量价相关性因子,提升因子收益及分组单调性问题。

- 核心论点和目标:
报告指出,传统多因子选股框架中,因子分组的单调性是线性合成的关键要求,然而许多因子实际表现出较好的预测能力(IC及ICIR)但分组单调性不佳,尤其是量价类因子。作者基于贝叶斯收缩思想,构建一个因子改良框架,将先验假设(行业板块层面的波动率杠杆属性)与原始统计信息相结合,对因子排序进行加权收缩,显著提升了量价相关性因子的收益水平及单调性。同时还做了深入的统计检验及纯因子组合风险暴露剔除验证,证实这一方法具有广泛实用价值。[page::0,1,2,4,5,6,8]

---

2. 逐节深度解读



2.1 引言与背景


  • 论述了因子构建在多因子选股中的关键地位,以量价相关性因子为例,揭示因子分组单调性差的现状及其对实际alpha有效性的影响。

- 多因子选股框架高度模块化,主要分为“因子构建”、“因子合成”和“组合优化”三大模块(图1),手工因子依赖逻辑清晰且分组单调性强,机器学习因子可通过非线性合成改善单调性,但对应的透明度、可解释性较低(图2)[page::0,1]。

2.2 常见因子改良方法


  • 报告列举了多种因子改良途径,分别是:

1. 原始变量的时间序列平稳化(差分转为平稳序列),保证估计无偏;
2. 缩短计算窗口,利用近因数据权重更大,捕捉短周期alpha,但增加交易成本;
3. 多项式拟合,调整因子分布形态以契合线性关系;
4. 贝叶斯收缩,结合统计信息(样本估计)和先验信息(基于经济假设的变量),在平衡估计误差和设定偏差中获得更稳健的因子表现。
  • 报告详细说明贝叶斯收缩在协方差矩阵估计中的应用,如Jagannathan and Ma (2000)的分拆市值加权协方差矩阵,作为方法论基础[page::2]。


2.3 基于量价相关性因子的改良实践


  • 量价相关性因子构建基于Pearson相关系数$\rho = corr(Pt, Vt)$,反映价格与成交量间的背离状态(量增价跌等)。实证发现较小/较大相关系数对应下一期超额收益的高低,但典型技术因子通病是多头分组不单调,顶尖分组收益不稳定(图3-6)[page::2,3]。

- 原因探讨:
1. 噪音交易者导致个股呈现虚假背离形态;
2. 长计算窗口(20日)难以捕捉个股短期事件驱动的alpha。
  • 试验缩短计算窗口至过去5日一阶差分量价相关性,显著提升多头组收益与分组单调性,但也带来了较高交易成本(交易费率按千二计,周频调仓情况下费率增加8%),权衡效果良莠[page::3]。


2.4 贝叶斯收缩改良框架


  • 核心是用行业或板块层面基于贝叶斯假设的“先验信息”来修正因子排序:

- 假设知情交易者对行业板块整体有信息优势,难以细分到个股,故在对行业资金流入(出)判断时,更倾向买卖行业内相对波动(贝塔)较大的个股;
- 构造先验指标:个股与行业内其他个股价格一阶差分的协方差均值的负数,体现个股的行业相对波动(杠杆)属性。该先验单独分组收益在顶端组表现消极,说明它本身选股能力不强(图15)[page::4,5]。
  • 结合统计信息即原始量价相关性因子,采用加权收缩:

$$\rhoi^{shrink} = \alpha \rhoi^{target} + (1-\alpha) \rho_i^{sample}$$
其中先验$\rho^{target}$和样本$\rho^{sample}$同权重,$\alpha=0.5$,体现两者同等重要[page::5]。
  • 收缩后的因子表现显著提升:无论月频还是周频,分组单调性均明显增强,头部组收益大幅增长(图17、18);同时对数累积因子收益曲线显示改良因子在全A及沪深300市场均优于原始因子(图19、20)[page::6]。


2.5 因子纯化与关联性分析


  • 作者进一步考察了量价相关因子与其他基础量价因子(反转、波动率、异质波动率、换手率、非流动性)之间的截面相关性(表格数据),发现收缩后的因子仅与反转因子有较弱相关性,其它因子相关度较低,表明改良因子提供了独立且增量的alpha信息[page::7]。

- 在纯因子组合中添加对基础量价因子暴露为0的约束,实现了进一步纯化,得到的“纯因子plus”组合无论全A还是沪深300,月周频收益均比原始纯因子收益有明显改善(图22、23)[page::7]。

2.6 报告结论摘要(订阅号集成)


  • 报告总结了贝叶斯收缩框架逻辑:

- 原因子多头逻辑基于量价背离个股可能有知情资金锁仓或买入;
- 统计误差来自噪音资金;
- 先验信息通过假设知情资金流比例与行业内相对波动正相关。
  • 通过贝叶斯收缩加权,有效修正排序,显著提升了收益和单调性,原始顶组年化超额收益3.65%(月频)提升至8.11%,2.42%(周频)提升至15.18%[page::8]。


---

3. 图表深度解读



图1 多因子选股流程(page 1)


  • 展示多因子选股的标准流程分为“手工因子/专家知识”进入线性加权合成以及“机器挖掘/暴力搜索”进入非线性合成,均汇聚至Alpha得分,最后进入组合优化阶段。

- 图中特别说明白箱模型输入优质因子、黑箱模型信息利用充足且对因子要求低。
  • 说明报告选中贝叶斯收缩聚焦因子构建环节,优化因子排序的精度与稳定性。


图2 单因子检验流程(page 1)


  • 展示中性化因子的检验包括计算信息系数(IC)及其稳定性(ICIR)、分组测试分组收益(多头收益及单调性)、最后因子组合的增量信息。

- 强调IC与分组单调性的双重考量,说明单因子选股实际应用中单调性更重要。

图3-4 对数平均分组收益(月频、周频,page 3)


  • 原始量价相关性因子的十组(q0-q9)表现,顶端组性能一般,末端组显著负收益,单调性较差。

- 说明因子在量价背离多头排序上的识别力不足。

图5-6 对数累积因子收益(月频、周频,page 3)


  • 显示纯因子组合与预期最小波动率组合的收益表现,明显观察到2015年4月至9月期间,周频收益出现反转,说明时间序列持久性差。

- 进一步佐证因子稳定性不足。

图13-14 缩短窗口后分组收益(月、周频,page 4)


  • 量价相关系数改用5日差分计算后,多头分组(q0-q4)收益大幅上升,单调性明显改善。

- 但注意增加了调仓率带来的交易成本,折中效果明显。

图15 先验信息分组收益(page 5)


  • 显示以个股相对行业波动构造的先验信息分组,表现出顶端组负收益,表明单独先验信息本身无明显预测能力。


图16 贝叶斯收缩框架示意图(page 6)


  • 直观展示先验信息和统计信息的组合过程,包括知情资金流向对行业/板块调仓的逻辑及对个股量价背离信号的修正作用。


图17-18 改良因子分组收益比较(月频、周频,page 6)


  • 改良后的因子分组平均收益条形图明显高于原始,顶端收益翻倍提升,单调性强。


图19-20 改良因子对数累积收益曲线(月频、周频,page 6)


  • 表明改良因子在长期累积收益上对全A及沪深300均有显著优势,收益曲线平滑且更陡峭,证明贝叶斯收缩带来的稳健性能增强。


图21 因子截面相关性表(page 7)


  • 详细因子间相关系数揭示收缩后量价相关性因子独立性高,对同类量价因子相关较低,提升了组合多样性。


图22-23 纯因子组合与纯因子plus组合累积收益(月频、周频,page 7)


  • 添加基础量价因子暴露为零的约束后,因子组合表现稳定且有增量改进,说明纯因子提效效果明显。


---

4. 估值分析


  • 本报告为量化因子改良技术研究,不涉及传统财务估值模型,故无DCF或P/E估值内容。

- 报告所“估值”更偏向因子“投资价值”的量化评价,包括分组收益、IC、ICIR和纯因子组合收益等多个维度指标评价因子有效性。
  • 贝叶斯收缩中的“收缩强度”α可视为超参数,报告当前默认0.5,后期计划基于知情概率调整动态α,属于估值敏感性分析预留。


---

5. 风险因素评估


  • 报告明确指出贝叶斯收缩中的先验假设存在设定偏差风险,原因是假设知情资金只能整体看行业或板块,缺乏个股分辨能力,该假设简化实际投资行为。如假设失真,贝叶斯收缩效用减少。

- 另一个风险是缩短计算窗口带来的交易成本提升,特别是在手续费、滑点高的市场环境下,短期反应能力强但净收益降低。
  • 交易频次提高可能导致策略执行风险增大。

- 报告尚未提供具体的风险缓释策略,但提出后续将研究动态收缩强度调节,兼顾稳定性与灵活性。

---

6. 批判性视角与细微差别


  • 报告对贝叶斯收缩的先验假设依赖较强,这可能导致在某些市场条件下表现不佳。投资者应关注收缩系数的灵活调整,避免“一刀切”。

- 量价因子改良的收益提升较大,但对应交易成本上升未做详细成本收益率分析,尤其算法交易可降低成本,应做进一步实证验证。
  • 统计信息采用固定窗口长度(如5日差分)尽管有效,但市场环境变化情形复杂,动态窗口选择或许更优。

- 未充分讨论其他可能对因子收益贡献较大的宏观或公司特征因素,以及因子交叉验证的独立性检验。
  • 图表和数据迭代涉及比较多时间序列,报告主要侧重于全A及沪深300,其他市场是否有效尚待验证。


---

7. 结论性综合



本研究报告聚焦于多因子选股体系中尤显关键的因子构建模块,通过引入贝叶斯收缩思路,创新地将基于行业相对波动的先验假设与统计量价相关性因子结合,有效解决了传统因子单调性差、分组排序混乱的问题。通过一系列严格的实证检验,包括多频度、多市场的分组收益、累积收益及纯因子收益分析,确认改良后的量价相关性因子多头组的超额收益大幅提升(月频超额年化由3.65%提升至8.11%,周频由2.42%提升至15.18%),且单调性和收益的时间稳定性显著优化。

贝叶斯收缩核心在平衡统计信息的噪声和先验假设的设定偏差,利用行业层面资金流与波动杠杆属性关联的先验信息,引导因子重新排序。这一方法的逻辑清晰、数据支持充分,基于此构建的因子纯化组合确保了因子间低相关性与独立Alpha贡献。短窗口差分计算虽增强信号灵敏度,但伴随交易成本升高,需在实操中权衡优化。

整体而言,报告不仅提出了量价因子改良的新思路,也通过贝叶斯收缩框架为多因子模式下的因子改良提供了范式示范,具有较强的实操及研究价值。未来进一步探索动态收缩强度调节、先验信息多元化及跨市场验证无疑是该领域值得关注的方向。[page::0,1,2,3,4,5,6,7,8]

---

附:主要图片引用


  • 图1 多因子选股流程

- 图2 单因子检验流程
  • 图3-6 原始量价因子分组及累计收益

- 图13-14 缩短时间窗口分组收益
  • 图15 先验信息分组收益

- 图16 贝叶斯收缩框架示意
  • 图17-20 收缩后因子收益及累计收益

- 表格:因子截面相关性数据 (page7)见正文描述
  • 图22-23 纯因子与纯因子plus累计收益


---

综上,本报告为多因子选股领域因子改良提供了一条兼具学理和实证的新路径,具有重要研究和应用价值。贝叶斯收缩思维的引入,有望推动传统量价类因子在实际策略中更广泛、有效地应用。 $ 原因子多头逻辑 $\-->$ 合理假设下的先验信息 --> 加权收缩

在本例中,量价相关性因子的多头逻辑在于呈现量价背离形态的个股可能有知情资金买入或锁仓。然而这一现象也可能由噪音资金的随机行为导致,所以存在估计误差,是为统计信息。

在知情资金具有投研或信息优势,且追求收益最大化的前提下,我们认为同一行业或板块内个股知情资金流入(出)比例应与其相对于行业或板块的波动(贝塔)成正比。它呈现的是个股的一种杠杆属性,从逻辑和结果上并无显著的多头预测能力。

但将其作为先验信息去修正量价相关性因子的行业内排序后,可显著提升后者多头预测能力, 这就是贝叶斯收缩的核心思想。

原始量价相关性因子经市值行业中性化后,十分组第一组超额年化收益为 $3.65\%$ (月频), $2.42\%$ (周频)。经贝叶斯收缩后的量价相关性因子超额年化收益显著提高, 分别为 $8.11\%$ (月频), $15.18\%$ (周频), 且分组单调性得到明显改善。

在后续的研究中,我们将对压缩系数进行更深入的研究, 以及展示其他因子的改良成果。

详细报告请查看20200628发布的国泰君安金融工程专题报告《基于贝叶斯收缩的因子改良框架》



法律声明:



本订阅号不是国泰君安证券研究报告发布平台。本订阅号所载内容均来自于国泰君安证券研究所已正式发布的研究报告,如需了解详细的证券研究信息,请具体参见国泰君安证券研究所发布的完整报告。本订阅号推送的信息仅限完整报告发布当日有效,发布日后推送的信息受限于相关因素的更新而不再准确或者失效的,本订阅号不承担更新推送信息或另行通知义务,后续更新信息以国泰君安证券研究所正式发布的研究报告为准。

根据《证券期货投资者适当性管理办法》,本订阅号所载内容仅面向国泰君安证券客户中的专业投资者。因本资料暂时无法设置访问限制,若您并非国泰君安证券客户中的专业投资者,为控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。如有不便,敬请谅解。

市场有风险,投资需谨慎。在任何情况下,本订阅号中信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。国泰君安证券及本订阅号运营团队不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。

本订阅号所载内容版权仅为国泰君安证券所有。订阅人对本订阅号发布的所有内容(包括文字、影像等)进行复制、转载的,需明确注明出处,且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。
-->

报告