适应市场状态与股票关联性的因子生成模型——机器学习系列之六
创建于 更新于
摘要
本报告提出Adaptive-GSM-Alpha模型,有效结合风险因子、市场状态划分及股票关联性,通过深度风险模型及多子模型架构适应不同市场状态,实现因子生成与指数增强策略,显著提升选股稳定性与收益风险表现。模型回测显示因子连续性优异,沪深、申万多指数均有超额收益,行业市值中性化与关联信息显著优化模型效果 [page::0][page::3][page::4][page::5][page::14][page::25][page::27]。
速读内容
股票关联关系与风险因子应用 [page::5][page::6]

- 股票关联关系分为定性分类及定量相似度,后者基于风险因子和量价数据构建相似度矩阵,通过图神经网络挖掘股票间协同效应。
- 深度风险模型(DRM)改善传统风险因子解释力,提升收益回归$R^2$,降低因子间截面相关性,提高模型稳定性。
市场状态划分与风格偏向 [page::7][page::8][page::9][page::10][page::11]




- 依据价格趋势斜率与波动率划分6个市场状态:暴涨、平稳上行、宽幅震荡、窄幅震荡、暴跌、持续下行。
- 不同状态下风险因子表现差异明显,市场高波动期偏好低特异性波动与低流动性股票,低波动期风格偏好也有差异化。
- 不同市场状态对应不同投资风格,提示策略需适应状态切换。
Adaptive-GSM-Alpha模型架构与训练 [page::11][page::12][page::13][page::14][page::15]



- 基础模型融合16类风险因子与小时及日线量价序列,利用GSM提取时序特征并引入风险因子计算股票间相似度,通过注意力机制完成股票间特征加权。
- 设计6个子模型分别针对6种市场状态训练微调,利用市场趋势与波动指标动态计算权重,实现模型输出的自适应加权。
- 模型训练采用行业市值中性化标签及截面标准化的20日收益率,采用滚动训练与早停机制保证模型稳定性。
模型表现与消融实验 [page::16][page::17][page::18][page::21][page::22]



- 标签中性化显著提升基础模型表现与稳定性,尤其降低极端回撤。
- 消融实验证明股票关联信息模块对收益率预测有重要贡献,移除后模型表现下降。
- 各子模型在对应市场状态下表现最佳,展示较强的专一性与区别性,且子模型间相关性与对应的状态相似度正相关。
- Adaptive-GSM-Alpha整体因子月频Rank IC提升至12.85%,ICIR 1.91,多头年化收益14.72%,较基础模型均有提高。
指数增强策略实证表现[page::24][page::25][page::26]

| 组合名称 | 年化收益率 | 换手率 | 超额年化收益率 | 超额波动率 | 超额夏普比率 | 超额最大回撤 |
|-------------|------------|---------|----------------|------------|--------------|--------------|
| 沪深300增强 | 11.72% | 0.73 | 15.61% | 5.16% | 3.03 | 4.16% |
| 中证500增强 | 11.33% | 0.86 | 15.66% | 6.00% | 2.61 | 7.00% |
| 中证1000增强| 10.02% | 0.91 | 16.05% | 6.08% | 2.64 | 6.96% |
- 基于Adaptive-GSM-Alpha因子构建的指数增强策略覆盖沪深300、中证500和中证1000,月频调仓、严格风格及行业约束。
- 策略体现超额稳定收益与较低跟踪误差,有效控制风险且回撤水平较优。
深度阅读
适应市场状态与股票关联性的因子生成模型——深度详尽分析报告
---
1. 元数据与整体概览
- 报告标题:《适应市场状态与股票关联性的因子生成模型》(机器学习系列之六)
- 作者及发布机构:东北证券股份有限公司金融工程组,主要分析师为王琦、贾英等
- 发布日期:2024年9月(参考文中最新数据至2024年8月)
- 主题:介绍一种基于机器学习、适应市场状态变化和股票关联性的因子生成模型—Adaptive-GSM-Alpha,旨在提升选股策略的稳健性和收益表现。
- 核心观点与亮点:
1. 市场状态切换对股票预期收益影响显著,传统统一模型难以适应不同状态的差异。
2. 股票间关联性对预期收益有明显影响,但传统因子生成未能充分利用关联信息。
3. 引入深度风险因子强化股票关联刻画,基于趋势与波动性的市场状态划分,提出Adaptive-GSM-Alpha模型,包含基础模型与6个状态对应的子模型,根据市场状态动态加权输出因子。
4. 回测结果显示,该模型的因子表现稳定优异,2018年至2024年月频Rank IC达14.55%,ICIR1.68,五分组多头年化收益高达18.09%,行业市值中性化后指标仍表现出色,且适用于沪深300、中证500、1000等多样股票池。
5. 基于该因子的指数增强策略超额年化收益均在15%以上,跟踪误差控制良好。
- 风险提示:模型基于历史数据,存在失效风险,回测不代表未来表现。
---
2. 章节详细解读
2.1 引言(第3页)
- 关键论点:
- 市场状态(上涨、下跌、震荡等)决定不同交易模式,因子表现随状态变化轮动。
- 传统因子生成模型统一训练,未能有效应对市场状态切换与结构性变化,尤其极端行情时可能导致模型回撤严重。
- 股票预期收益不仅受自身特征影响,还受股票间关联性影响,传统模型忽视关联输入。
- 支撑逻辑:
- 举例说明,不同行情下投资者偏好不同风格因子,且关联股票收益常表现协同性。
- 指出前述两大局限:市场状态变化未获充分适配、关联性欠缺建模。
- 背景方法回顾:
- 报告系机器学习系列之六,前作涉及Signature/Log-signature特征提取、GSM统一时序提取框架等,为本报告技术基础。
- 章节结构预览:
- 第2章介绍关联性与市场状态划分;第3章提出Adaptive-GSM-Alpha模型;第4章总结。
[page::3,4]
---
2.2 股票间关联性与市场状态(第5-11页)
关联关系(第5页)
- 内容归纳:股票关联性分为:
1. 分类关系:基于行业、主题、产业链上下游划分,体现协同效应。
2. 相似度关系:基于历史行情统计或基本面特征,计算相似度矩阵,利用Attention机制或图神经网络(如GCN、GAT)捕捉关联。
- 应用意义:利用相似度调整因子,有助刻画真实股票协同效应。
[page::5]
深度风险模型(第5-7页)
- 风险因子基础:
- 投资组合管理中风险因子用于暴露控制,提升回撤防御。
- 风险因子对收益解释能力强,但原始因子存在解释$R^2$提升空间、截面相关性较高、多重共线性显著、自相关衰退快等局限。
- 深度风险模型(DRM)介绍:
- 使用GRU和GAT联合建模时序特征与股票间风险关联。
- 上下两路结构:下路GRU汇聚时序风险因子,全连接+标准化提取深度风险因子;上路GAT提取时点风险关联并计算特异风险后,用GRU汇聚。
- 多任务学习目标函数促进风险因子对未来多期限收益有解释力并控制因子间多重共线性。
- 实验设置与结果:
- 使用16类基本面和技术面因子作输入,回溯60天窗口训练,样本时间段2007-2024年。
- 测试集未来20日收益回归中深度因子$R^{2}$比原始因子提升0.99个百分点(15.82%→16.81%),自相关略微提高。
- 截面相关性从17.45%降到14.08%,说明减少了因子冗余,提升了风险因子信息表达能力。
- 图表辅助说明:
- 图2和图3对应原始风险因子和深度风险因子的截面相关性热力图,深度风险因子表现出更低相关性。
[page::5,6,7]
市场状态划分(第7-11页)
- 方法:
- 使用Trend和Volatility指标划分:
- Trend:60日窗口标准化价格斜率。
- Volatility: 60日窗口日收益率标准差。
- 阈值划分:Trend划分上涨(>0.05)、震荡(-0.05至0.05)、下跌(≤-0.05);Volatility划分高波动(>0.01)与低波动(≤0.01)。
- 组合成6个市场状态:暴涨、高波动上涨、宽幅震荡、高波动震荡、暴跌、高波动下跌、持续下跌。
- 图形说明:
- 图4-7分别绘出Wind全A指数走势与趋势指标、波动指标对比展现指标有效反映市场动向和风险。
- 因子表现差异:
- 通过不同市场状态期间各风险因子月度Rank IC平均值(图8-13雷达图),说明不同状态中风险因子风格偏好不同:
- 高波动时,偏好低流动性、低特异波动等稳健风格,暴涨偏高杠杆高盈利,暴跌表现弱。
- 低波动时,偏好低估值、低特异波动,窄幅震荡偏小市值高盈利,持续下行偏小市值低Beta等。
[page::7,8,9,10,11]
---
2.3 Adaptive-GSM-Alpha模型设计(第12-26页)
GSM和基础模型回顾(第11-13页)
- GSM算法:
- 统一时序特征提取框架,采用Log-signature的唯一性和可解释性,进行多维时间序列特征提取。
- 特征提取过程确定性支持梯度传播,兼容GPU加速。
- 输入包括5分钟K线序列和60日每日序列,窗口150日分别做基点增强和时间增强。
- 改进点:
- 基础模型在GSM-Alpha基础上进一步引入风险因子(16个多样公司基本面及量价指标)作为输入,与时序数据拼接。风险因子也用于股票间相似度计算。
- 将Stock Mixing部分中的相似度由原先GSM提取的量价特征改为风险因子,相似度矩阵通过注意力机制完成,增强对股票间协同效应的刻画。
- 模型架构详解:
- 图14说明GSM特征提取流程。
- 图15具体说明基础模型包括GSM特征提取、风险因子混合、股票间特征重构(Stock mixing注意力机制)以及最终输出层。
- 效用:
- 风险因子作为连接实时行情和股票基本面的桥梁,拓宽了信息源,且风险因子自身表达稳定且相关性低,提高模型鲁棒性。
[page::11,12,13]
Adaptive-GSM-Alpha完整架构(第14-26页)
- 目的:
- 克服传统单模型难以适应市场状态变化局限,实现模型对市场状态切换的动态适应。
- 设计:
- 6个市场状态对应6个子模型,均基于基础模型预训练后微调,专注对应状态下的表现。
- 微调时固定GSM特征降维层参数,减少过度拟合,聚焦在交易模型层的调整。
- 预测与权重机制:
- 每个子模型对输入特征给出一个收益预测$fi$。
- 当前市场状态由趋势与波动指标计算分位数后与6状态中心点作距离,距离倒数归一化形成权重$wi$。
- 最终输出$y = \hat{r}' + \hat{r} = w^\top f + F0(x)$,即加权子模型收益预测与基础模型输出的加和。
- 这种加权方法允许模型对难以明确归属状态的市场数据(临界区间)进行平滑适应,增强稳健性。
- 训练流程:
- 标签采用行业市值中性化后或简单截面标准化的未来20日收益率。
- 2018年起逐年滚动训练,训练集往前回溯5年,剔除当月为验证集。
- 子模型分别对应状态样本训练集,根据验证集样本量调整验证集构成,保证训练有效。
- 指标损失函数采用Pearson相关系数负值,促进模型学习收益与因子间强相关。
[page::14,15,16,17]
回测与性能对比(第16-26页)
- 基础模型训练效果:
- 表2显示中性化标签训练较普通标签显著提升Rank IC、ICIR及收益,且中性化标签降低回撤风险。
- 引入关联信息(Stock mixing模块)对模型性能提升显著,消融实验(表3、图25-32)显示去除关联模块后多项指标下降,凸显股票关联收益重要性。
- 深度风险因子替换原始因子无显著提升,故继续使用原始因子。
- 子模型性能考察:
- 图35-40展示6子模型在对应市场状态中的Rank IC最高,跨状态表现略弱,体现子模型交易模式的差异与专一性。
- 子模型与因子相关性:
- 表4与图41展示子模型与风险因子的相关性及子模型间相关性,发现子模型风格偏向变量不一但均与低流动性、特异波动显著相关。
- 市场状态差异大则子模型相关性低,如暴涨(高波动上涨)状态子模型1与持续下行状态子模型6相关度仅61%。
- Adaptive-GSM-Alpha综合表现:
- 表5、图42-45证明综合子模型加权因子相较基础模型在ICIR和收益上均有提升,年化多头收益提升超过0.5个百分点。
- 分年度回测(表6-7)和原始因子版本结果(表8-9,图46-49)亦支持该结论。
- 宽基指数测试(第24-25页)
- 表11和图50-57显示Adaptive-GSM-Alpha在沪深300、中证500、1000及国证2000中均具有正向表现,特别是小市值指数(国证2000)Rank IC达13.97%,多空Sharpe高达5.96。
- 指数增强投资组合表现(第25-26页)
- 表12与图58-60显示基于Adaptive-GSM-Alpha的沪深300、500及1000指数增强策略超额年化收益超过15%,跟踪误差约5%-6%,风险调整能力好,有效控制回撤,换手率合理。
[page::16,17,18,19,20,21,22,23,24,25,26]
---
2.4 总结与风险提示(第27-28页)
- 总结摘录:
- 市场状态切换和股票关联性变化是影响股票预期收益的重要因素,传统统一模型忽视这两者导致表现不稳和极端行情回撤高。
- 风险因子和深度风险因子为股票关联性计算提供了良好基础和改进途径。
- 通过趋势与波动组合划分市场状态,实证显示状态间风格偏好显著不同。
- 提出的Adaptive-GSM-Alpha模型依托基础GSM-Alpha,结合风险因子计算股票相似性和多个子模型动态权重加权,显著提升预测精度和收益稳健性。
- 风险提示:强调模型存在失效风险,历史结果不保证未来表现,投资需谨慎。
[page::27,28]
---
3. 关键图表深度解读
3.1深度风险模型示意图(图1,第5页)
- 描述:模型由蓝色的图注意力网络(GAT)层和黄色的门控循环单元(GRU)层交替组成。输入为历史风险因子数据$(x
- 解读:GAT负责提取股票间风险关联,GRU用于捕捉时间维度变化。两路结合并经过全连接和标准化层提升风险因子稳定性并减少多重共线性。
- 逻辑基础:多任务式损失函数优化全期限收益解释能力并控制因子间相关性。
- 意义:该结构改善了传统风险因子$R^{2}$,提升了关联稳定性及信息有效性。

3.2风险因子截面相关性热力图(图2、3,第6-7页)
- 图2显示16个原始风险因子相关性较高,色块多为浅蓝或浅红,相关值分布较宽。
- 图3显示深度风险因子降相关显著,更多深蓝色说明降低冗余,因子相互独立性更强。
- 逻辑说明:降低相关性有效减少因子信息冗余,有利于特征稳定与模型泛化。


3.3市场状态划分相关图表(图4-7,第8-9页)
- 图4&6展示Wind全A走势与趋势、波动指标,指数曲线与趋势指标变化同步,波动指标峰值对应市场大幅波动期(如2015年),体现指标有效性。
- 图5&7将趋势划分颜色区域反映上涨(绿)、震荡(黄)、下跌(红)和低/高波动期,视觉表现极佳,指标分区合理。
- 体现了趋势和波动指标可准确划分市场状态,为后续建模提供坚实支撑。




3.4不同市场状态风险因子风格偏好雷达图(图8-13,第10页)
- 每张图描述一个市场状态下,16大风险因子的月Rank IC平均表现。
- 例如,暴涨状态下(图8)偏好高杠杆、高盈利率和低残差波动因子,暴跌状态(图12)表现整体较弱。
- 说明不同市场状态存在系统性风格差异,支持细分状态子模型的必要性。

等同方式见图9-13。
3.5GSM时间序列特征提取架构图(图14,第12页)
- 输入高维序列经过降维与增强处理后,采用Log-signature提取特征,最后拼接成特征集。
- 体现了GSM对多序列数据的统一转化、包含单序列及交互信息的能力,支持深层且充分的信息挖掘。

3.6 基础模型与Adaptive-GSM-Alpha架构(图15-16,第13-14页)
- 图15:蓝色单个股票序列输入经过GSM特征提取与指标混合后得到向量,经注意力机制利用风险因子计算相似度,融合其他股票信息,形成加权特征。最终通过线性层输出预期收益。
- 图16:基础模型输出除自身同时作为6个子模型的输入,子模型分别针对对应市场状态数据微调。市场状态指标决定子模型权重,子模型加权输出与基础模型结果相加形成最终因子。
- 该结构实现在充分利用关联性的同时,结合市场状态动态调整,增强模型泛化与适应性。


3.7 基础模型与退化模型分组回测(图17-32,第16-19页)
- 图17-24分别展示普通标签和中性化标签下,基础模型的分组净值走势和Rank IC,显示中性化标签训练效果更好,回撤更低,分组效果稳定。
- 图25-32为对应去除关联信息(退化模型)版本,表现明显下降,表明股票间关联挖掘模块有效提升因子表现。
- 该组图大规模回测证明核心模块和标签设计合理。

其他图见以上列表,可提取类似结论。
3.8 子模型表现雷达图(图35-40,第20页)
- 每幅图描绘对应状态下六个子模型的Rank IC均值分布。
- 各市场状态对应子模型IC显著最高,且与自身状态差异大的子模型表现下降,体现出强子模型专一性和能力差异。

3.9 子模型间相关性热力图(图41,第21页)
- 相关性范围0.6~0.8,状态相近子模型相关性高(如submodel1与submodel2),状态差异大相关性低(如submodel1与submodel6)。
- 说明子模型学得的交易模式与市场状态有明显对应关系,避免重复学相同模式,提升覆盖面。

3.10 因子分组回测对比(图42-49,第22-23页)
- Adaptive-GSM-Alpha因子整体表现优于基础模型(图42vs44,图43vs45)
- 原始因子版本表现更优,但中性化因子稳定性更突出。
- Rank IC值和累计IC保持正向,净值曲线稳健增长。


3.11 不同股票池分组回测(图50-57,第24-25页)
- 模型对中证1000和国证2000(中小盘股票)表现尤佳,Rank IC最高达13.97%,体现模型对成长和波动性更敏感股票的适配能力。
- 沪深300表现相对较弱,但仍有正向收益预测。

3.12 指数增强策略回测(图58-60,第26页)
- 基于Adaptive-GSM-Alpha因子分别构建沪深300、500、1000增强组合,期限2018-2024年8月。
- 策略超额年化收益率均达15%以上,超额Sharpe Ratio均高于2.5,最大回撤控制较好,换手率适中。
- 净值走势明显优于对应指数,回撤期稳健。

---
4. 估值分析
本报告核心是因子生成模型及其投资策略表现分析,未涉及传统意义上公司估值(如DCF、市盈率)方法分析。估值内容聚焦于模型定量指标,如Rank IC、ICIR、年化收益、Sharpe Ratio及最大回撤,体现模型的投资回报能力和风险控制。模型主要通过多任务学习、时序特征提取和结构设计进行Alpha因子估计得分,非传统财务估值方法,故无DCF等估值分析。
---
5. 风险因素评估
- 模型失效风险:报告多次强调基于历史数据回测,未来环境变化或极端事件可能使模型失效,短期表现不代表未来。
- 市场结构变化风险:市场状态标准和因子表现可能随宏观环境和市场结构演变而变化,模型对新结构适应不确定。
- 过拟合风险:子模型微调虽采用固定部分参数,但仍存在过拟合可能,尤其对稀缺状态样本。
- 抗风险与缓解策略:通过子模型加权增强模型稳健性,中性化标签减少行业/市值暴露,控制回撤,体现一定风险对冲能力。[page::28]
---
6. 批判性视角与细微差别
- 系统性考虑市场状态和股票关系,具有理论与实证双重支撑。
- 结构设计理性,结合多模型加权与多任务学习提升泛化能力和稳健性。
- 回测覆盖长周期及多指数,具较强实用性。
- 市场状态定义和阈值选择相对经验化,缺乏机制自校正或鲁棒性测试。
- 深度风险模型虽提升因子性能,实证提升有限(0.99%$R^2$),对模型整体影响边际或有限。
- 子模型各自独立微调,或存在冗余计算,未尝试共享层和端到端联合训练提升效率。
- 交易费用和执行滑点设置较低,实际操作中影响不容忽视。
- 报告未详细说明模型训练及超参数调优细节,难以准确复现与进一步评估。
- 多数因子依赖Ricequant等第三方数据,数据源变化可能对模型稳定性构成隐患。
- 报告中多次强调中性化标签显著提升稳定性,表明因子暴露控制重要,但也可能导致对某些系统性机会识别不足。
- 股票关联性作为预测变量,虽经实验证明有效,但关联矩阵时间稳定性及调节策略未详细展开。
- 加权方式基于距离的倒数,虽简单有效,但加权敏感性和异常状态处理缺少深入探讨。
---
7. 结论综合
本报告系统阐述了市场状态变化和股票间关联性的重要性,基于此提出Adaptive-GSM-Alpha模型,融合了深度风险因子和GSM时序特征提取技术,并采用6个市场状态子模型微调和动态加权方式,实现了对不同市场交易模式的自适应性。
报告通过详实的统计分析和多维回测验证了:
- 深度风险模型优化了风险因子相关结构,增强了股票关联关系刻画,支持因子生成与相似度构建。
- 市场状态划分合理,有效揭示不同交易环境下的风险因子风格偏好。
- 基础模型引入风格相关风险因子提升了因子表现和稳定性,子模型显著聚焦特定市场状态,表现最优,且子模型间差异反映状态差异。
- 综合采用市场状态权重加权子模型预测解决临界状态分类困难,避免单一模型过度依赖,稳健性显著提升。
- 模型因子在全市场及多指数成分股中表现均衡,收益显著,风险控制合理。
- 基于模型构建的指数增强策略持续取得15%以上的超额年化收益/较低跟踪误差,实用价值突出。
具体数值可参考:2018-2024年区间,Adaptive-GSM-Alpha因子行业市值中性化后月频Rank IC达12.85%,ICIR达1.91,五分组因子多头年化收益达14.72%;沪深300指数增强策略超额年化收益15.61%,跟踪误差5.16%。相关图表详见图42、表5、表12等。
整体而言,报告不仅提出了前沿的因子生成模型架构,也以严谨的实证数据证明了其有效性和市场适应能力,为量化投资研究和实际策略构建提供了值得借鉴的技术路线和思路。
---
# 以上分析严格基于报告内容及图表,引用页码标明如下:[page::3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28]