【国信金工】价量类风险因子挖掘初探
创建于 更新于
摘要
本报告基于遗传规划算法,系统挖掘并筛选了115个价量类风险因子,定义了风险因子的量化特征(如IC绝对值均值与IC均值差异、IC胜率接近50%、自相关性高等),并验证了风险因子在样本内外的稳定风险特征。报告进一步提出风险剥离框架,定量剥离部分价量风险因子以改进传统价量alpha因子,显著提升其收益预测稳健性与选股能力,最终在中证500增强组合中实现年化超额收益由15.81%提升至17.04%、最大相对回撤下降,有效强化组合风险控制能力[page::0][page::18][page::12][page::15][page::17]
速读内容
- Alpha、风格与风险因子的区分标准 [page::1][page::2][page::3]

- Alpha因子:IC均值显著非0,且IC标准差较小,具有持续稳定的收益预测能力,月度IC胜率高,如AOG因子IC月度胜率91%。
- 风格因子:IC均值非0但波动大,具有阶段性解释力,如市值对数因子(Lncap)。
- 风险因子:IC均值接近0且IC标准差大,收益无持续固定方向,月度IC胜率接近50%,如杠杆因子(MLEV)。
- 通过四类因子的IC均值绝对值与IC绝对值均值的对比,可以量化判断因子属性。
- 遗传规划(GEP)算法挖掘价量风险因子核心流程[page::5][page::6][page::8]
- 使用有代表性的价量终结符(收盘价、成交量等),和设计的40+函数(均值、标准差、时序统计量等)构建表达式基因组。
- 适应度函数综合IC均值差异、IC胜率距离50%、因子自相关,最大化识别风险因子特征。


- 风险因子筛选与表现[page::9][page::10]
- 挖掘近4万个候选因子,筛选满足IC均值接近0、IC胜率接近50%、自相关高于0.7、IC绝对值均值阈值的风险因子约2000个。
- 进行分组相关性剔除,最终聚合得到115个低相关且代表性的价量风险因子。
- 三个典型风险因子(Risk1-3)在样本内外均表现出高波动、无稳定预测方向、月度IC胜率约50-60%、自相关系数较高,符合风险因子定义。



- 基于价量风险因子剥离改进价量alpha因子框架及效果[page::11][page::12][page::13][page::14]
- 通过多元回归剔除行业、市值及部分风险因子暴露,避免过度剥离alpha因子收益中的风险成分。
- 以一个月反转、一个月波动、一个月换手三大因子为例,剥离部分风险因子后均表现出IC均值提升且ICIR、月度胜率和多头超额收益明显改善。




- 价量风险因子在中证500指数增强组合中的应用[page::15][page::16][page::17]
- 结合市值、行业中性化及价量风险剥离后的复合因子构建选股模型,IC均值由0.131提升至0.133,ICIR由6.13提升至6.62,月度胜率提升至96%。
- 使用线性规划约束优化组合构建,回测2016-2022年,增强组合年化超额收益从15.81%提升到17.04%,最大相对回撤降低,信息比提升,表现稳健。

- 报告结论强调当前alpha因子拥挤及失效率提高,价量风险因子系统挖掘弥补了潜在风险认知不足,有效提升组合风险控制和选股稳健性[page::0][page::17][page::18]
深度阅读
【国信金工】价量类风险因子挖掘初探——详尽分析报告
---
一、元数据与报告概览
- 报告标题:《价量类风险因子挖掘初探》
- 作者:张欣慰、杨怡玲
- 发布机构:国信证券经济研究所量化藏经阁
- 发布日期:2022年6月29日
- 报告主题:价量风险因子的定义、挖掘方法及其在量化Alpha因子稳健性提升和指数增强策略中的应用
核心论点及目的
报告指出随着Alpha因子研究的深入,alpha因子数量饱和且趋于阶段性失效,市场风格极端轮动增加,风险因子控制重要性提升。传统风险模型多基于财务和基本面因子,价量类风险因子缺乏系统化挖掘方法。报告提出采用遗传规划算法,从2010-2015年历史数据中挖掘了115个价量风险因子,并基于这些风险因子改进价量Alpha因子,实现Alpha因子稳健提升。同时将改进后的因子应用到中证500指数增强组合中,显著提升组合绩效,降低回撤,验证了价量风险因子的实际应用价值。[page::0]
---
二、逐章深度解读
2.1 报告引言与Alpha、风格与风险因子的定义
- 报告首先定义了Alpha因子、风格因子和风险因子在多因子选股模型中的区别:
- Alpha因子:具备持续稳定的收益预测能力,IC均值显著非零,ICIR高,预测方向稳定。
- 风格因子:IC均值非0但波动较大,收益具有阶段性显著性。
- 风险因子:IC均值接近0但IC绝对值大,月度IC胜率约50%,时序自相关强,表现为对股价截面收益有解释,但无固定方向预测。
- 无用因子:IC均值和标准差均小,缺乏显著性。
- 核心量化指标:
- Rank IC计算因子与未来收益的秩相关。
- ICIR衡量因子预测稳定性(年化均值/标准差比)。
- 通过IC均值、IC绝对值均值、IC胜率、IC自相关等多维度区分因子类型。
- 示例:AOG因子为典型alpha因子(IC均值0.042,ICIR 4.16,IC胜率91%);Lncap市值因子为风格因子(IC均值-0.051,ICIR-1.01,胜率62%);MLEV杠杆因子为风险因子(IC均值约0,ICIR 0.09,胜率50%),支持上述定义框架(图1-8)[page::1-4]
2.2 价量风险因子挖掘方法
- 面临问题:价量因子虽广泛使用但缺乏系统和方法论指导,设计更多基于“感觉”或“灵感”,亟需系统性方法。
- 遗传规划与遗传表达式规划(GEP)算法:
- 采用随机初始化、选择、交叉、变异和重组的进化过程,优化目标函数,寻找表达式生成因子。
- GEP方法优势兼具遗传算法速度和遗传规划表达力,适合大规模复杂因子挖掘。
- 因子表示:
- 个体用基因组编码,包括终结符(如收盘价、成交量)和函数符号(算术运算、统计函数等)。
- 解析基因组生成因子表达式(图12)。
- 函数符集合包括40余个结构化时序计算函数,辅助提升搜索效率(附录表13)。
- 适应度指标设计:
- 依据风险因子特征设计适应度函数:IC绝对差(mean(abs(IC))-abs(mean(IC))),IC胜率接近50%,自相关度(削弱边际效应)三者乘积。
- 适应度越大,个体越符合风险因子特征。
- 挖掘流程:
- 使用2010-2015年数据训练,2016-2022年样本外验证。
- 采取缓存机制避免重复计算。
- 根据最大适应度和停止条件提早终止迭代(图13)。
- 因子筛选:
- 初步筛选适合风险因子标准的~2000因子;
- 分组剔除相关系数>0.6共线因子;
- 最终得到115个互不高度相关的价量风险因子集合。
2.3 价量风险因子示例与样本外表现
- Risk1因子(如基因组表达式G1):
- 代表股票名义价格风险,行为金融学文献支持低价股溢价现象。
- 样本内外IC均值均接近0,IC胜率约50%,IC绝对值均大于0.1,因子自相关>0.97,体现典型风险因子无预测方向但截面解释力(图14-15,表4)。
- Risk2因子:过去半年股票真实波动率平方的稳健度,反映波动率稳定性。
- 样本内外表现类似,高度波动IC,无固定方向预测,IC绝对值高于0.07,自相关>0.8(图16-17,表5)。
- Risk3因子:过去一年内最低价与最高价相关系数,反映阻力支撑强弱。
- 样本内外IC均值仍接近0,胜率略低于53%,IC绝对值>0.05,自相关约0.9(图18-19,表6)。
- 整体表现:115个因子样本外检验显示大多数保持风险因子特征,IC均值分布围绕0,ICIR大多落于±1.5范围内,月度胜率多集中40%-60%区间(图20-21)[page::9-10]
---
三、基于价量风险因子改进Alpha因子
3.1 风险因子剥离框架
- 直接全部中性化115个价量风险因子,会导致Alpha因子收益下降,因许多alpha因子收益部分来源于风险暴露。
- 设计剥离流程:对Alpha因子(如1个月反转因子)对按fitness排序的价量风险因子逐步剥离,通过多元回归回归行业、市值和含风险因子的暴露,获取剥离后因子残差。
- 观察剥离不同数量风险因子下Alpha因子的IC均值、ICIR、多头超额收益(图22-23):
- IC均值先升后降,剥离过多风险因子损失部分Alpha选股信息;
- ICIR和多头超额收益整体提升,说明风险剥离增强了因子选股稳定性和绩效。
- 因此选择剥离策略是选取使IC均值最大且ICIR、多头超额均值不低于原因子的风险因子集合作为最终剥离集。
- 风险剥离流程示意图见图24。[page::11-12]
3.2-3.4 三大典型价量Alpha因子的样本内外改进表现示例
- 一个月反转因子:
- 原始IC均值-0.055,剥离29个风险因子后提升到-0.071;
- ICIR提升由-1.95到-3.85,IC月度胜率由70%提升到88%;
- 多头月均超额收益由0.09%提升至0.26%(图25-28,表7)。
- 一个月真实波动因子:
- 原始IC均值-0.095,剥离后下降到-0.072(负IC绝对值减小体现稳健增加);
- ICIR明显提升由-2.7到-4.22,IC月度胜率提升81%到91%;
- 多头超额收益由0.22%涨至0.41%(图29-32,表8)。
- 一个月换手因子:
- IC均值-0.096提升到-0.083,ICIR由-3.11提升至-4.19,月度胜率82%升至91%;
- 多头超额收益由0.58%升至0.67%(图33-36,表9)。
- 三大因子均表现出剥离部分价量风险因子后选股能力和稳定性明显提升,收益波动明显降低。[page::12-14]
---
四、价量风险因子在指数增强策略中的应用
4.1 复合Alpha因子构建
- 构建因子库涵盖估值、成长、盈利、分析师预期、景气度、公司治理、PEAD、流动性、波动率、反转等多因子。
- 量价类因子采用剥离价量风险因子后的中性化处理,基本面因子做市值和行业中性化。
- 使用对称正交处理多因子共线性,基于滚动12个月ICIR加权构建复合因子组合权重。
- 剥离价量风险因子后的复合因子较未剥离版本,IC均值由0.131提升至0.133,ICIR由6.13提升至6.62,月度胜率从95%提高到96%,月均多头超额由1.56%提升到1.63%(表11)[page::15]
4.2 指数增强组合构建与回测
- 采用线性规划模型,最大化复合因子权重暴露,限制风格、行业和个股偏离,中性化行业、市值,控制成分股权重偏离,禁止卖空,保证满仓。
- 以中证500指数为基准,2016年-2022年5月回测,剔除新股、ST股、退市前股票,考虑日均成交额限制,月度调仓。
- 新增强组合(剥离价量风险因子后的复合因子)表现更佳:
- 年化超额收益由15.81%升至17.04%;
- 最大相对回撤由4.62%降到3.09%;
- 信息比由3.47升至3.79;
- 多数年份表现均优于原始增强组合(图37-38,表12)。
- 股票停牌及涨跌停时权重保持不变,实际应用考虑市场交易限制。[page::16-17]
---
五、风险因素评估
- 主要风险包括:
- 市场环境变化风险,因市场风格剧烈波动可能导致因子表现极端波动;
- 因子失效风险,尤其新造价量风险因子理论尚在建设阶段,模型稳定性待观察。
- 报告未详细列举缓解策略,但通过样本内外严谨验证及因子剥离风险暴露,已部分降低风险因素影响。
---
六、批判性视角与细微差别
- 该研究创新在于系统化挖掘价量风险因子,填补了传统财务基本面风险因子模型的空白,具有一定的前瞻性。
- 其遗传规划方法较为依赖初始函数库设计与适应度定义,潜在存在搜索空间局限及局部最优问题。
- 剥离风险因子时,尽管剥离部分因子提升了Alpha因子稳健性,但同时存在收益预测能力和信息量的权衡,需要平衡选择。
- 样本外测试窗口较长,但未来市场结构和行为变化依然可能影响因子表现,建议持续动态监控因子有效性。
- 报告对价量风险因子核心概念界定清晰,但部分计算细节(如自相关具体计算方式)与因子筛选参数未过度展开,专业读者可根据前文定义进一步拓展。
---
七、图表深度解读
图1(Alpha、风格与风险因子划分图)
- 横轴为IC的标准差,纵轴为IC均值绝对值,四个象限分别代表Alpha(高均值、低波动)、风格(高均值、高波动)、风险(低均值、高波动)、无用因子(低均值、低波动)。
- 三示例因子AOG(Alpha)、Lncap(风格)、MLEV(风险)展现清晰的划分边界。
图2-3(AOG因子)
- 多头组合(蓝色)稳健跑赢空头(红色),多空比值稳步上升,IC均值0.042,累计IC线单调向上,反映因子收益预测稳定性极好。
图4-5(Lncap因子)
- 多头空头收益间隙存在周期性变化,2014年末与2017-2020年多头表现弱势,IC波动大,累计IC呈波动下注方向非持续。
图6-7(MLEV因子)
- 多头空头表现无明显优势,IC均值接近零,累计IC呈波动但无持续收益,体现风险因子无显著预测方向、但对收益截面有解释。
图12(因子表达式树状图)
- 基因组表达式G1对应树结构“sqrt(ts_mean(CLOSE,60))”,说明遗传表达解码过程直观且具有表达能力。
图13(挖掘流程图)
- 流程清晰描绘了生成种群->计算适应度->淘汰复制->交叉变异->记忆缓存筛选等关键步骤。
图14-15等Risk因子IC表现图
- 多个月度IC分布条图和累计IC曲线展示因子表现高度波动,接近无预测方向特征,符合风险因子定义。
图20-21(115风险因子分布图)
- 大部分风险因子样本外均值围绕0波动,ICIR偏小,胜率分布密集在40%~60%区间,表明稳定展现风险因子本质。
图22-23(风险因子剥离对反转因子性能影响)
- 随着剥离因子数量增加,IC均值先升后降,ICIR显著提升,多头超额收益走势提升,直观印证风险剥离的双刃剑效应。
图24(风险因子剥离流程示意)
- 循环剥离、高性能监控、结果验证的闭环机制,提高方法效率与模型性能。
图25-28(一个月反转因子调整前后IC与收益比较)
- 调整后因子月度IC均值和累计IC提升明显,分组多空收益和多头超额均值墨显著改善,多空收益对比体现调整后的因子选股能力提升。
图29-32(一个月真实波动因子)
- 剥离后尽管IC均值绝对值有所下降,但ICIR和收益波动稳定性的提升说明风险因子剥离有效提升了收益的可持续性。
图33-36(一月换手因子)
- 剥离后ICIR提升,月度胜率提升且多头组合平均超额收益上升,图像表现多空收益走势更加稳健,表明风险因子剥离提升换手因子的风险调整后表现。
图37-38(中证500增强组合表现对比)
- 新增强组合长期稳健跑赢基准指数以及老增强组合,显著提升了年化超额收益及信息比,回撤明显降低,体现实证有效性。
---
八、估值分析
报告主要是因子构建与组合绩效分析,未涉及具体估值模型。但组合权重优化为线性规划,目标为最大化复合因子暴露,约束包括风格偏离、行业权重、股票持仓限额等,确保因子信号被有效转化为组合收益,风险被有效控制。
---
九、结论性综合
本报告系统提出并验证了一套基于遗传表达式规划算法挖掘价量风险因子的创新方法,成功发现115个具有风险因子特征、稳定波动、无预测方向但解释截面收益的价量风险因子。进一步,基于这些风险因子对现有价量Alpha因子进行了风险剥离,有效提升因子选股的稳健性和风险调整绩效,尤其在1个月反转、1个月真实波动和1个月换手率三类代表性Alpha因子中取得显著提升。
最重要的是,将改进后的Alpha因子替换传统价量因子后应用于中证500指数增强组合构建,结果显示增强组合样本外年化超额收益由15.81%提升至17.04%,最大相对回撤由4.62%降至3.09%,信息比提升至3.79,表现全面优于传统方案,验证价量风险因子的实际价值。
图表清晰展现了风险因子定义及划分(图1)、遗传规划挖掘流程及表达示意(图11-13)、代表因子样本内外波动及IC统计(图14-21)、剥离调整前后关键指标提升及增益曲线(图22-36)、以及增强组合长期收益稳定性提升效果(图37-38),配合详实数据统计(表1-12),形成了系统且严谨的研究闭环。
报告强调财务基本面风险因子与价量风险因子认知维度的不同,指出价量风险因子偏于“知道自己不知道”的范畴,缺乏理论上的系统认知和方法论支撑,创新性地采用遗传表达式规划弥补该认知空白,开创了价量风险因子研究新路径,对量化投资因子体系风险控制和稳健化建设具有重要推动意义。[page::0-18]
---
参考文献
- 罗进辉, 向元高, 金思静. 中国资本市场低价股的溢价之谜. 金融研究,2017.
- 陈晓莹. 中国股市低价股效应研究. 南京大学硕士论文, 2018.
---
总体评价
报告在风险因子定义精准、遗传规划技术设计合理、样本内外验证系统和结果应用实证三方面表现突出。虽然遗传规划依赖初始设定与计算资源,且风险剥离过程需要平衡风险控制与收益信息损失,但整体方法论先进且务实。适合量化因子工程师和组合管理者用于扩充因子库的风险维度,提升组合的多维度风险控制能力,尤其适用于寻求价量维度突破的量化团队。
---
以上为该篇《价量类风险因子挖掘初探》国信证券报告的详尽分析,涉及报告所有核心章节、图表与表格内容,理论与实证结合,明晰展示了价量风险因子的概念、挖掘与应用价值。