再谈SemiBeta因子:高频测算 多因子Alpha系列报告之(四十七)
创建于 更新于
摘要
本报告借鉴Bollerslev(2021)研究,将传统Beta因子拆解为4个SemiBeta因子,基于A股市场日内高频数据(1分钟和5分钟级)进行实证检验。结果显示,周频换仓中,MN类高频SemiBeta因子表现最佳,年化多空收益率可达近30%,而月频换仓中N和P因子效果较好,且选股范围影响因子有效性。因子之间存在较高正相关,尤其是相同收益方向的组合因子。该高频因子的研究丰富了A股量化因子库,为投资组合构建提供了新思路 [page::0][page::2][page::4][page::6][page::12][page::14]
速读内容
- 研究背景及理论基础 [page::0][page::1][page::2]
- 传统Beta因子难以有效捕捉资产下行风险,SemiBeta因子将传统Beta拆解为市场和个股收益方向不同的四个组成部分:N、P、M+、M-。
- 理论上,SemiBeta模型能更好解释投资者对下行风险的厌恶,因而有潜在溢价。

- 因子构建与参数设置 [page::3][page::12]
- 构建基于沪深300、中证500、中证1000、创业板指市场基准的64个高频(日内1分钟和5分钟数据)SemiBeta因子及16个周频因子。
- 同时设置月频和周频调仓周期,回测区间覆盖2010年至2021年及2007年至2022年不等。
- 采用MAD去极值、Z-Score标准化和行业市值中性化预处理因子。
- 高频SemiBeta因子实证表现:月频和周频策略对比 [page::4][page::12][page::14]
- 月频调仓全市场选股中,N和P因子表现较好。以semibetaPSH000852为例,IC均值为-6.4%,多空年化收益率14.8%。
- 周频调仓全市场中,MN因子效果最好,5avgfBetaMNHF_S000300因子IC均值为-5.3%,多空年化收益率29.4%,多头年化收益率18.5%,换股率约61%。




- 限定股票池选股效果 [page::7][page::9][page::10][page::12][page::14]
- 在沪深300、中证500和中证1000成分股选股时,因子有效性有所下降,尤其是沪深300池表现较弱。
- 中证500和中证1000股票池中,N和P因子表现相对较好,IC绝对值较高,但长线收益表现有限。
- 因子相关性分析 [page::6][page::7]
- 高频SemiBeta因子内相关性高于低频,同方向因子(N与P,MN与MP)相关性较强,高频N与P因子相关性达70.7%。
- 不同收益方向组合因子相关性较低,但周频因子间相关性整体有所提升。
表格:SemiBeta因子相关性示意 [page::7]
- 量化策略特征总结与风险提示 [page::0][page::14][page::15]
- 高频SemiBeta因子结合了市场与个股收益的上下行组合,挖掘更多Alpha机会。
- 策略侧重于短线频繁调仓,换手率较高,需控制交易成本。
- 策略风险包括政策及市场结构变化带来的模型失效风险。
深度阅读
【广发金融工程】再谈SemiBeta因子:高频测算 多因子Alpha系列报告之(四十七)——详尽分析报告
---
1. 元数据与概览(引言与报告概览)
报告标题:
【广发金融工程】再谈SemiBeta因子:高频测算 多因子Alpha系列报告之(四十七)
作者及发布机构:
罗军安、宁宁、张钰东,广发金融工程研究团队,广发证券发展研究中心
发布日期:
2023年4月7日
研究主题:
基于A股市场高频数据,进一步深化分析和实证SemiBeta因子在股市中的表现,评估其Alpha能力,并探讨不同调仓频率(周频、月频)、不同市场基准(沪深300、中证500、中证1000、创业板指)及日内数据频率(1分钟、5分钟)对因子表现的影响。
核心论点及目标:
- 传统Beta因子在A股市场难以稳定贡献Alpha收益,且忽略了投资者对下行风险的偏好。
- 通过借鉴Bollerslev(2021)拆解Beta为4个SemiBeta($\beta^{N}, \beta^{P}, \beta^{M^{-}}, \beta^{M^{+}}$),以更细化角度捕捉市场与个股的收益关联异质性。
- 基于更高频(日内高频)数据构建SemiBeta因子,尝试提升因子捕捉Alpha的能力。
- 实证发现不同换仓频率和市场基准下,SemiBeta因子表现差异明显,尤其MN和P因子表现相对优越。
- 因子表现受选股池范围限制影响,有效性在不同指数成分股池内有所下降。
- 报告给出了相关性分析和风险提示,强调模型在市场结构和环境变化下存在策略失效风险。
综上,报告意在推进Beta因子的多维细化研究,探索SemiBeta因子在中国A股高频交易环境下的实证表现,为量化投资提供实证支持和策略参考。[page::0,1,2,3,4,5,6,7,12,14]
---
2. 章节详细解析
2.1 研究背景与理论基础
- 传统Beta因子的局限:
Beta反映的是资产对市场收益变动的敏感性,然而早期研究(Markowitz 1959,Hogan and Warren 1972,1974)均指出Beta因子的过度简化,致使其不能全面解释股票横截面收益差异。
- SemiBeta分解:
基于Bollerslev(2021)理论,传统Beta因子用协方差与方差的比率定义,可以拆分为四个部分:
$$\beta = \beta^{N} + \beta^{P} - \beta^{M^{+}} - \beta^{M^{-}}$$
其中:
- $\beta^{N}$:市场与资产均为负收益的协方差部分(down-down)
- $\beta^{P}$:市场与资产均为正收益的协方差部分(up-up)
- $\beta^{M^{+}}$:市场正收益但资产负收益(反向部分)
- $\beta^{M^{-}}$:市场负收益但资产正收益(反向部分)
该拆解更好地捕获了投资者对资产下跌风险的厌恶,反映不同市场状态下的Beta敏感度,符合Prospect Theory投资者行为假设(Kahneman and Tversky, 1979)。由于市场下跌风险更被关注,因此不同SemiBeta表现对预期收益有重要影响。报告通过示意图(图1)直观展示4种不同结构资产在SemiBeta拆分下的回报差异,为后续实证提供理论基础与直观理解。
- A股市场实证耐受度:
报告基于沪深300、中证500、800作为市场基准,滚动计算过去20、60、120交易日的传统Beta,不同调仓时点进行检验,发现传统Beta在A股难以稳定贡献Alpha,反映了市场特性和因子效用的转换需要更细致的测算手段。
- 本报告创新点:
相较于此前(多因子Alpha系列之45号报告)使用日频数据构建因子,本报告采用日内高频数据(1分钟及5分钟频率)进行SemiBeta测算,试图挖掘更细粒度的价格信息,从而提升因子表现和实际投资指导价值。[page::0,1,2,3]
---
2.2 SemiBeta因子构建与参数设置
- 因子类别:拆分为四类因子MN、MP、N、P,对应不同SemiBeta维度。
- 参数设定:
- 市场基准包括沪深300、中证500、中证1000及创业板指等,保证覆盖不同市场规模和风格。
- 高频数据频率分别采用1分钟级和5分钟级。
- 换仓频率分为月频和周频,适应不同策略节奏。
- 平滑:部分因子采用滚动10日均值(或周频5日均值)实现降噪处理。
- 样本处理:去极值处理(MAD法)、Z-Score标准化等,确保因子稳定和可比性。
- 股票样本限制:剔除涨跌停、ST股、上市少于180日的股票,保障样本的流动性和代表性。
因子库总计构建64个高频月频因子,16个周频因子,提供多维度全面测试。
此章节体现因子构建的系统性、科学性,且针对A股独特市场环境进行针对性策略设计。[page::3,12]
---
2.3 高频SemiBeta因子实证结果:月频全市场选股
- 所有因子整体呈现负IC,意味着因子值较小的股票未来表现更好。
- 在四个大类因子中,N因子和P因子表现相对较好:
- 以semibetaNSH000852为例,IC均值为-6.1%,多空年化收益达12.6%。
- semibetaPSH000852表现更优,IC均值为-6.4%,多空年化收益达14.8%。
- 多个因子在统计胜率、ICIR等方面体现较强的选股能力。
- 多空年化收益及累计收益趋势图(图2至图9)显示因子收益表现稳定且具备持续挖掘Alpha的能力。
此处展示了高频SemiBeta因子月频调仓下的实证优势,特别是N(市场负收益-股负收益)和P(市场正收益-股正收益)因子,凸显了投资者对下行风险敏感度的投资价值。
[图片示例]
- 图2与图4为semibetaN因子IC值显示,短期波动中负IC持续,累计IC呈下降趋势,验证因子解释能力。
- 图3与图5对应多空收益持续增长,表明因子策略收益稳定。
- 图6至图9同样体现了P因子接近的表现模式。
[page::4,5,6]
---
2.4 高频SemiBeta因子相关性分析
- 低频数据中,相关收益方向因子之间相关性较高(N与P相关为54%,MN与MP相关为47.5%),不同收益方向因子间相关较低(比如N与MP为-0.5%)。
- 高频数据内,相关性普遍提升,收益方向类似因子如N与P达70.7%,MN与MP达58.7%,不同方向因子相关性也显著上升。
- 高频与低频因子之间整体相关度较低,存在一定独立信息,特别低频P因子与高频N、P因子存在较明显相关性。
该结论说明高频因子在信息挖掘上补充了低频因子的不足,且同向因子组合内存在较强关联性,可能需考虑合成因子以控制多重共线性,同时因子仍存在一定独立性可供多元化组合选股。[page::6,7]
---
2.5 高频SemiBeta因子实证结果:月频限定股票池与周频换仓
- 限定选股池(沪深300、中证500、中证1000)后,因子有效性普遍下降。尤其沪深300成分股内,因子IC绝对值下滑,且多头收益表现不佳,显示规模股环境对因子Alpha衰减。
- 中证500指数成分股中,N因子与P因子IC绝对值尚较高,但长期多空收益较低,反映中盘股的半Beta因子效用有限。
- 中证1000指数成分股中,MN因子表现较好,典型因子IC均值达-6.3%,多空年化收益达18.9%,表现优于大盘与中盘股票池,可见小盘股具备更高因子Alpha空间。
- 周频换仓回测显示,MN因子总体表现优异,全市场多空年化收益可达29.4%,IC均值约为-5.3%。但同样限定不同指数成分股池后有效性有所损失。
这一节体现因子在不同市场板块及调仓频率下的表现分化,表明半Beta因子更适合中小市值股票中挖掘Alpha,且换仓频率对因子收益波动及稳定性有较大影响。[page::7,8,9,10,11,12,13]
---
2.6 风险提示
作者明确指出模型与结论基于历史数据的统计量与建模,未来因市场政策、结构、交易行为改变,因子可能面临失效风险。此类风险特别体现在量化策略的规律性与恒久性不确定性上,提示投资者需动态跟踪与风险控制。[page::0,15]
---
3. 图表与图像深度解读
图1:不同SemiBeta结构资产对比
- 内容描述:
Panel A-D展示了4种不同资产的收益分布结构,展示其$\beta^{N}, \beta^{P}, \beta^{M+}, \beta^{M-}$值的不同配比,揭示传统Beta相同但SemiBeta结构明显区分的不同风险特征。
- 数据解读:
- 资产A(Panel A)中$\beta^{N}=\beta^{P}$且$\beta^{M+}=\beta^{M-}$,表现对称风险,预期收益平均。
- 资产B(Panel B)$\beta^{N}<\beta^{P}$,表明在下行市场中表现较稳定(下跌Beta较小),对应预期回报较低,投资者有较强保护意愿。
- 资产C(Panel C)与B相反,下跌风险高于上涨,要求更高预期回报。
- 资产D(Panel D)则有较强对冲特性,预期回报相对中低。
- 文本联系与结论:
图示支持理论假设,表明SemiBeta因子能区分市场风险性质,进而影响预期收益率,反映了因子投资中的细分风险定价意义。[page::2]
---
图2-9:N因子和P因子IC及多空收益信息(图2-5为N因子,图6-9为P因子)
- 内容描述:
- 单期IC柱状图展示因子在时间序列中对未来回报预测的单期关联强度。
- 累计IC曲线呈现因子整体预测能力的累积效果。
- 多空收益柱状图显示单期多空策略收益,累计收益线则反映整体策略的收益路径。
- 数据与趋势分析:
- 两类因子均表现为负IC,即因子值小的股票后续收益较好。
- 单期IC虽有波动,但累计IC随时间往下波动,表现相对稳定。
- 多空策略累计收益曲线呈持续上升趋势,表明因子创造了可观的超额收益。
- 两个因子在收益率波动上表现相似,确认因子稳定性较高。
- 文本联系:
这些图表生动验证了因子回测中IC及收益的定量表现,为量化模型的实证有效性提供充足证据。[page::6]
---
表格系列(表1-25)
- 表1-2: 传统Beta及低频SemiBeta因子绩效,提供基准对比,显示传统Beta缺乏稳定Alpha,SemiBeta因子略有改进。
- 表3-5: 高频SemiBeta月频因子构建及绩效,涵盖64个因子细节,突出N和P因子表现优异。
- 表6-7,9-12,13-16,17-20,22-25: 不同因子和选股池表现,细化展示不同市场区间及频率下的月频和周频回测结果,形成全面细致的绩效矩阵。
- 表8: 因子相关性矩阵,逻辑验证相关性结论,辅助优化因子组合策略。
整体表格极为详实,支持文本论点,提供了实证数据的坚实基础。[page::1,3,4,5,7,8,9,10,11,12,13]
---
4. 估值分析
报告主体聚焦于因子构建和回测表现,并未延伸到个股估值明细或目标价。主要采用的是基于IC(信息系数)、ICIR(信息比率)及多空策略收益(年化收益率)等金融因子绩效评估指标,而非传统DCF或PE估值法。
因子绩效表现作为Alpha质量衡量,其背后隐含的是因子捕捉风险溢价能力的衡量。因子构建基于有监督方向拆分Beta,计算过程涉及协方差分解,参数敏感性主要体现在市场基准、数据频率及平滑滑动窗口设置等方面,报告中通过多频率、多基准对比提供了一定的敏感度侧面展示。
因此,核心估值体现在因子预期收益率结构及多空策略超额收益的收益测算,而非传统股票估值体系。[page::0,1,2,3,4,5]
---
5. 风险因素评估
报告明确提示以下两点主要风险:
- 历史数据规律失效风险
- 基于历史统计建模,策略有效性建立在一定政策和市场环境前提下,环境变化可能导致模型失准。
- 市场结构和行为变化风险
- 量化模型依赖市场结构稳定(流动性、交易规则等),任何行为改变(如算法交易普及、市场监管调整)可能致使因子失效。
风险提示符合量化研究专业惯例,强调因子策略非永恒有效,投资者需警惕模型生命周期风险并配合动态调整。[page::0,15]
---
6. 审慎视角与细微差别
- 报告在因子构建和实证检验中展示了非常详细的数据和分析,但其多次观察到所有因子IC均为负值的现象对于因子解读提出挑战。一般正IC代表正向预测能力,负IC使用时需要考虑是选低因子值股票取反向收益,还是因子定义本身有逆向含义,报告中提及规模和选股池限制后,因子效用出现削弱,这提示因子稳定性与环境适应性仍是严峻问题。
- 高频因子与低频因子相关性提升,可能表明高频信号更多是噪声叠加或短期博弈,应关注高频因子在实盘交易时的交易成本和滑点风险,报告对此未详尽讨论。
- 因子表现的负IC现象,在量化投资中需要复盘对应因子的入场方向和信号解读,报告未明显讲清楚具体的做多空方向策略定义,实际应用中需额外注意策略逻辑匹配。
- 报告中换仓频率(月频与周频)表现差异明显,揭示策略调仓节奏对因子收益有关键影响,投资者需根据自身环境匹配适合频率,否则可能错失收益或加剧交易成本。
- 受限于A股市场特性,样本处理如涨跌停剔除、ST处理等会影响因子覆盖面和收益稳定性,报告对此的影响未作深入定量分析。
总体而言,报告在数据广度和深度方面表现突出,逻辑严谨,结论与实验数据紧密结合,但在策略应用细节(如交易成本影响、收益方向定义澄清、风险管理方案设计)方面尚有拓展空间。[page::0,4,6,12,14]
---
7. 结论性综合
本报告深入探讨了SemiBeta因子在中国A股市场高频维度的表现,通过基于日内1分钟和5分钟数据构建的高频因子,实证了SemiBeta因子相较于传统Beta因子有显著的Alpha捕捉能力,尤其在中小市值股票池表现更为突出。
从整体结果来看:
- 月频调仓下,全市场范围内的N因子和P因子表现优异,IC均值负向显著,相关多空年化收益达12%-15%。
- 周频调仓下,MN因子表现更佳,整体多空收益与ICIR表现优于月频,月频与周频策略侧重点有所差异。
- 市场基准影响显著,沪深300、中证500、中证1000不同指数成分股池的因子表现差异明显,尤其大市值股票池因子效能普遍下降,显示小市值市场信息密度和Alpha机会较多。
- 相关性分析表明高频因子内部相关性强于低频,但两者仍存在独立信息,显示多层次因子信息整合潜力。
- 风险提示专业准确,警示环境与市场结构变化对因子策略的挑战。
图表直观展现了因子随时间的稳定性和收益路径,支持了SemiBeta理论的实证应用深度。报告为中国A股市场提供了创新维度的Beta细化研究框架,有助于投资者构建更符合风险偏好的量化策略。
总结来看,尽管存在因子选择的负IC特征需结合反向策略使用,SemiBeta高频因子在捕获市场风险细分波动中表现出良好潜力,具有实用的投资研究价值和策略可操作性。[page::0,2,4,6,7,10,12,14]
---
参考示例图/数据(Markdown格式)
- 图1:不同SemiBeta结构的资产对比

- 图2:semibetaNSH000852 因子IC值

- 图3:semibetaNSH000852 因子多空收益

- 图6:semibetaPSH000852 因子IC值

- 图7:semibetaPSH000852 因子多空收益

---
【完】