选股因子系列研究(七十七)——改进深度学习高频因子的 9 个尝试
创建于 更新于
摘要
本报告基于深度学习架构构建高频选股因子,系统回顾了九种模型改进尝试。结果显示,引入正交层控制因子相关性、压缩输入特征集合、采用截面标准化、缩短验证集长度及调整预测目标为风险调整超额收益,均可提升因子周度选股能力及组合超额收益;高频特征频率提升、简单环境变量引入、延长训练集和提升模型复杂度效果有限或无提升。相关测试基于中证500增强组合和全市场选股验证,回测周期涵盖2014至2022年,体现了深度学习高频因子的稳定性与实用性 [page::0][page::4][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15]。
速读内容
深度学习高频因子2022年表现跟踪 [page::4]


- 2022年2月至4月,不同参数的深度学习高频因子表现稳定,多空收益在11%-13%区间,多头超额收益2%-5%之间。
- 多空相对强弱净值和多头净值指标显示因子具有持续的选股能力。
尝试1:引入正交层控制因子相关性 [page::6][page::7][page::8]

- 训练中引入正交层约束,使深度学习高频因子与传统市值、BP风格因子相关性降低,提升因子稳定性。
- 正交层引入后,因子周度选股能力以周均多头超额收益0.47%优于0.42%,组合测试中超额收益提升明显。
| 指标 | 原始模型-原始因子 | 原始模型-正交因子 | 正交模型-原始因子 | 正交模型-正交因子 |
|-----------------|-----------------|-----------------|-----------------|-----------------|
| IC均值 | 0.087 | 0.072 | 0.077 | 0.078 |
| 年化ICIR | 6.06 | 8.58 | 8.68 | 9.00 |
| 周度胜率 | 81% | 92% | 90% | 91% |
| 周均多空收益 | 1.62% | 1.37% | 1.46% | 1.46% |
| 周均多头超额 | 0.52% | 0.42% | 0.47% | 0.47% |
| 周均空头超额 | 1.11% | 0.95% | 0.99% | 0.99% |
尝试2:压缩输入特征减少冗余信息 [page::7][page::8]

- 扩充随机噪声特征导致因子周均IC逐步降低,说明冗余信息削弱选股能力。
- 主观逻辑压缩输入特征从164个降至63个后,因子整体表现提升,部分年份表现稳定。

| 输入特征 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|-----------------|--------|----------|----------|--------------|--------------|--------------|
| 压缩前 | 0.078 | 9.00 | 91% | 1.46% | 0.47% | 0.99% |
| 压缩后 | 0.080 | 9.36 | 92% | 1.53% | 0.49% | 1.04% |
尝试3:采用截面标准化优于原始及时间序列标准化 [page::8][page::9]

| 处理方式 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|-----------------|--------|----------|----------|--------------|--------------|--------------|
| 原始特征 | 0.057 | 6.88 | 85% | 1.04% | 0.27% | 0.77% |
| 时间序列标准化 | 0.023 | 3.59 | 72% | 0.45% | 0.18% | 0.27% |
| 截面标准化 | 0.080 | 9.36 | 92% | 1.53% | 0.49% | 1.04% |
尝试4:提高输入特征频率(30分钟→10分钟)未改善反弱化选股能力 [page::9]

| 特征频率 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|----------|--------|----------|----------|--------------|--------------|--------------|
| 10分钟 | 0.071 | 8.97 | 92% | 1.33% | 0.39% | 0.94% |
| 30分钟 | 0.080 | 9.36 | 92% | 1.53% | 0.49% | 1.04% |
尝试5:缩短验证集长度纳入更多近期数据提升选股能力 [page::10]

| 模型划分 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|--------------|--------|----------|----------|--------------|--------------|--------------|
| 100/20模型 | 0.080 | 9.36 | 92% | 1.53% | 0.49% | 1.04% |
| 115/5模型 | 0.083 | 9.68 | 93% | 1.61% | 0.54% | 1.06% |
尝试6:简单引入环境变量未带来效果提升 [page::11]

| 条件 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|---------------|--------|----------|----------|--------------|--------------|--------------|
| 无环境变量 | 0.083 | 9.68 | 93% | 1.61% | 0.54% | 1.06% |
| 添加环境变量 | 0.078 | 9.32 | 91% | 1.44% | 0.51% | 0.94% |
尝试7:调整预测目标为风险调整超额收益提高多头选股收益 [page::11][page::12]

| 预测目标 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|----------------|--------|----------|----------|--------------|--------------|--------------|
| 预测超额收益 | 0.083 | 9.68 | 93% | 1.61% | 0.54% | 1.06% |
| 预测风险调整后 | 0.081 | 9.42 | 91% | 1.54% | 0.60% | 0.94% |
尝试8:延长训练集长度提升单因子选股能力,但组合添加收益无明显增益 [page::12][page::13]

| 训练集长度 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|-----------------|--------|----------|----------|--------------|--------------|--------------|
| 120交易日滚动 | 0.080 | 9.25 | 90% | 1.55% | 0.58% | 0.97% |
| 240交易日滚动 | 0.091 | 10.45 | 94% | 1.75% | 0.60% | 1.14% |
尝试9:提升模型复杂度未显著提升选股能力 [page::13][page::14]

| 模型配置 | IC均值 | 年化ICIR | 周度胜率 | 周均多空收益 | 周均多头超额 | 周均空头超额 |
|-------------------|--------|----------|----------|--------------|--------------|--------------|
| GRU(50,2)/120日 | 0.080 | 9.25 | 90% | 1.55% | 0.58% | 0.97% |
| GRU(50,2)/240日 | 0.091 | 10.45 | 94% | 1.75% | 0.60% | 1.14% |
| GRU(100,2)/240日 | 0.089 | 10.33 | 94% | 1.70% | 0.61% | 1.10% |
| GRU(50,3)/240日 | 0.089 | 10.21 | 93% | 1.71% | 0.61% | 1.10% |
| GRU(100,3)/240日 | 0.088 | 10.33 | 94% | 1.70% | 0.61% | 1.09% |
结论与建议总结 [page::14][page::15]
- 有效提升选股能力的尝试:
1. 训练引入正交层控制相关性;
2. 适当压缩输入特征减少冗余;
3. 采用截面标准化处理输入特征;
4. 缩短验证集纳入更多近期数据;
5. 预测目标调整为风险调整超额收益。
- 无显著提升或存在风险的尝试:
1. 简单提升输入频率;
2. 引入环境变量方式需改进;
3. 延长训练集效果不一;
4. 增加模型复杂度无明显效益。
- 风险提示:市场系统性风险、流动性风险及政策变动风险影响策略表现。
深度阅读
金融研究报告详尽分析报告
报告元数据与概览
报告标题:
选股因子系列研究(七十七)——改进深度学习高频因子的9个尝试
分析师及发布机构:
- 分析师:冯佳睿(证书号:S0850512080006)、袁林青(证书号:S0850516050003)
- 发行机构:海通证券研究所
- 联系方式:冯佳睿 fengjr@htsec.com,袁林青 ylq9619@htsec.com
发布日期及研究主题:
- 发布日期:2022年后期(具体未明,但涵盖2022年及之前数据);系列研究第七十七篇
- 研究主题:基于深度学习技术,构建和改进高频选股因子的模型研究,聚焦因子训练架构的改进尝试及其在周度股指增强组合中的作用。
核心论点与目标信息:
该报告是海通证券针对其深度学习高频因子系列的延续研究,重点在于基于实证反馈,从九个维度对原有的深度学习高频因子训练模型进行系统尝试改进。
核心结论为:经过实证测试,部分改进措施能显著提升模型的周度选股能力和组合的超额收益;而部分尝试未带来预期改善,提示模型构建的复杂性与输入数据特性之间的平衡问题。
报告整体对于风险控制亦有关注,指出市场系统性风险、流动性及政策变化三大风险因素可能影响策略实现。
---
深度学习高频因子表现跟踪
2022年因子表现综述
- 报告以2022年2月以来的周度多空收益和多头超额收益为观测窗口。
- 图1显示,四种不同参数设置的GRU模型(以GRU(10,1)、GRU(50,1)、GRU(10,2)、GRU(50,2)区分)在2022年保持较为稳定的多空收益,周度多空收益多数时期在正区间,显示因子有较强的选股能力。
- 图2揭示多头超额收益在2月开始明显增强,最高周度收益超1.5%。
- 净值曲线(图3、图4)体现累计收益稳定增长趋势,表明因子在2022年内对多空仓位的判断较为准确。
- 表1中量化数据:多空收益在11.6%~13.1%间,多头超额收益则在1.9%~4.6%之间,显示不同GRU参数组合均实现正向收益且稳定,[page::4][page::5]
---
深度学习高频因子改进的九个尝试
报告从理论与实证角度,分别展开9个独立尝试的测试分析。整体评价是部分尝试能提升模型效果,强调深度学习模型试错成本高,所有尝试均有公开以供交流。
2.1 尝试1:控制因子与行业、风格及低频技术因子相关性
- 问题识别: 高频深度学习因子在训练中与已知低频因子(市值、BP因子)相关性不稳定,可能导致风格转换时模型表现不稳定(图5、图6展示多年时间序列相关波动,相关系数未始终稳定于零)。
- 技术手段: 通过引入正交层,约束模型训练输出因子与指定低频因子线性无关(用残差的方法实现因子正交)。
- 效应说明:
- 图7、图8清晰对比正交层引入前后因子与市值、BP因子的截面相关性,正交后相关性显著降低,趋近于零但因加权计算不完全等于0。
- 表2显示,正交层引入后因子选股能力(IC均值、ICIR、周度胜率、多空收益等)保持水平,且ICIR升高,周度胜率提高到约91%-92%。
- 表3增量添加测试表明,正交层训练的深度学习因子对中证500增强组合提升效果明显优于无正交层因子,特别在高换手率和更大偏离权重配置时表现更好。
结论: 建议在模型训练流程中加入正交层控制因子相关性,有助增强因子稳定性和组合增益。
[page::5][page::6][page::7]
---
2.2 尝试2:输入特征压缩
- 原模型使用164个30分钟高频特征,存在大量冗余。
- 加入白噪声随机特征的实验(图9)显示,特征冗余显著降低因子周均信息系数(IC),冗余越多,IC越低。
- 使用主观逻辑将特征缩减为63个,经压缩后模型IC均值及ICIR有所提升(表4),周均多空收益和多头超额均有所改善。
- 年度分解(图10)显示,压缩后的因子在大多数年份选股能力优于压缩前,但个别年份表现差异不显著。
- 组合增量添加测试(表5)显示,压缩后的因子在多数换手率和组合偏离设置下均带来更高超额收益,尤其在全市场选股配置下优势较大。
结论: 冗余信息会干扰模型训练与因子表现,适当输入特征筛选压缩是推荐做法,但筛选标准需进一步研究完善。
[page::7][page::8]
---
2.3 尝试3:调整特征标准化方式
- 比较三种输入特征处理:无处理、时间序列标准化、横截面标准化。
- 表6显示,横截面标准化的因子周度选股能力显著优于无处理及时间序列标准化,IC均值最高达0.080,ICIR也明显提升。
- 分年度多头超额收益(图11)进一步验证横截面标准化带来稳定的表现提升,各年大都更优。
结论: 对于依赖截面强度的选股模型,推荐先做横截面标准化处理。
[page::8][page::9]
---
2.4 尝试4:提升输入特征频率
- 原用30分钟高频特征,尝试升级为10分钟特征以增加信息量。
- 表7与图12显示,提升频率反而导致指标轻微下降,周均多头超额收益减少,IC及胜率均有缩水。
- 解释为模型(简单的GRU结构)在面对更长的序列长度时信息提取能力受限,无法充分利用额外信息。
- 因此,建议在模型架构不变或复杂度不足时避免使用过高频率数据。
[page::9][page::10]
---
2.5 尝试5:改变训练集/验证集切分比例
- 120天训练,20天验证集存在历史较远导致近期数据滞后的问题。尝试将验证集缩短为5天,训练集扩展至115天(115/5模型)。
- 表8与图13显示,115/5模型在IC均值、ICIR、胜率及多头超额收益方面均略优。
- 组合添加测试(表9)也显示115/5模型在多数换手约束及组合偏离配置下收益突出,但在80%中证500选股范围或偏离较大参数条件下优势不明显。
- 综合建议采用更短验证集以尽可能利用更多近期数据训练。
[page::10][page::11]
---
2.6 尝试6:输入特征中引入环境变量
- 为增强模型环境适应能力,引入市场成交量、涨跌、涨跌分化度为环境变量。
- 表10和图14表明,环境变量加入后,因子表现反而略有下降,多头超额收益减少,特别是结构切换较快的2021年没有改善。
- 说明简单引入环境变量方式效果有限,模型灵活性未被进一步增强。
结论: 目前不建议简单引入环境变量,需更多复杂方法改进才能有效提升模型适应性。
[page::11]
---
2.7 尝试7:调整预测目标
- 原模型预测未来个股超额收益,尝试改为预测风险调整后的超额收益(如夏普比率调整)。
- 表11表明,预测目标调整后IC平均值稍降,但周均多头超额收益从0.54%提升至0.60%。
- 分年度表现(图15)同样反映多头超额收益多数年份上升趋势。
- 组合测试显示(表12)风险调整目标的模型整体超额收益水平更好。
结论: 风险调整的目标函数有助于提高多头选股能力,建议此调整。
[page::11][page::12]
---
2.8 尝试8:延长训练集长度
- 训练集窗口从120交易日延长至240交易日,考察模型表现变化。
- 表13显示,240天模型具有更高的IC均值(0.091)及ICIR(10.45),胜率提升至94%,多空及多头超额收益均更优。
- 分年度表现(图16)显示部分年份(如2015,2017,2019,2021)240天训练更优。
- 但组合增量添加测试(表14)显示,当将因子加至实际周度组合时,240天训练模型未必优于120天模型,表现没有单因子测试明显提升。
结论: 延长训练集可提升模型的单因子性能,但加入实盘组合后效果不稳定,是否延长训练期需依据具体应用场景权衡。
[page::12][page::13]
---
2.9 尝试9:提升模型复杂度
- 在最终优化的模型设定(正交层,63特征,5天验证集,风险调整目标)下,试验不同GRU层数和隐藏单元数对因子表现的影响(表15)。
- 复杂模型(如GRU(100,3))未带来额外性能显著提升,周度选股能力指标趋于饱和。
- 此现象表示现实中模型复杂度提升需要配合更丰富的特征输入,否则仅增加模型复杂度难以提升有效信息提取。
- 图17及表16的年度表现及组合超额收益进一步支持该结论。综合考虑计算资源,推荐采用120天滚动训练+GRU(50,2)模型结构。
[page::13][page::14]
---
图表深度解读
- 图1、2、3、4(第4页)清晰刻画2022年不同GRU模型的周度多空收益、多头超额收益及其累计净值趋势,直观体现因子稳定收益能力。
- 图5、6(第6页)揭示深度学习高频因子与传统风格因子(市值及BP)相关性动态变化,相关系数波动幅度大,提示模型相关性不稳定性。
- 图7、8(第6页)显示正交层加入后显著压缩相关性,相关性曲线趋近于零线,验证正交层技术的有效性。
- 图9(第7页)条形图表明输入特征中随机数据越多,模型选股能力(周均IC)越差,提醒特征内容纯度重要性。
- 图10(第8页)逐年度多头超额收益条形对比,表明特征压缩不是在所有年份均提升,但整体表现略优。
- 图11(第9页)展现三种特征处理方式不同年度的选股能力,横截面标准化显著优于其他两者。
- 图12(第9页)显示10分钟特征输入反而降低多数年份的多头超额收益,支持频率非越高越好观点。
- 图13(第10页)显示缩短验证集后,多头超额收益多数年份有所提升,验证训练样本设计重要性。
- 图14(第11页)加入环境变量后多头超额收益下降,图形直观表现负面效果。
- 图15(第12页)风险调整目标在大多数年份提升多头超额收益。
- 图16(第13页)延长训练集数部分年份选股效果更好,但不绝对。
- 图17(第14页)模型复杂度升高未带来明显年度选股能力提升,模型调整边际效益递减明晰。
所有图表均由Wind及海通证券研究所提供,数据充分,具有合理的时间截面和多年份验证,支持结论广泛可信。
---
估值方法点评
本报告核心为因子研发与选股策略,不涉及传统个股估值分析,因此未设置DCF、市盈率等估值模型章节。组合增量测试等为策略效果验证,是策略表现和因子价值的实证体现。
---
风险因素分析
- 报告提示三大风险:
1. 市场系统性风险——整体行情波动可能影响因子有效性及组合收益表现。
2. 资产流动性风险——高频因子与调仓频率结合,流动性不足将提升交易成本和实现风险。
3. 政策变动风险——宏观及行业政策变更对市场结构及风格切换可能冲击模型泛化能力。
报告未详列具体缓解措施,但高频因子构建考虑换手约束、行业及风格中性风险控制,体现一定风险管理框架。
---
审慎评估与细微差别
- 报告数据充分、结构严密,逻辑清晰,但以下方面值得关注:
- 尝试中四项无明显提升(高频特征提升、环境变量引入、延长训练周期增益不稳定、复杂模型性能饱和)体现深度学习模型与数据匹配的重要性。
- 组合收益增量测试与单因子能力测试结果不完全一致,提醒因子在实盘环境及组合构建中的表现受多重影响。
- 报告中输入特征筛选方式仍属主观逻辑,量化筛选方法尚未明确,表明该方向潜力大,尚需深入研究。
- 风险提示较为笼统,实际策略运营中对风险的细化管理值得补充。
---
结论性综合
本报告基于海通证券深度学习高频因子系列研究,通过九项针对模型训练及特征工程的改进尝试,系统验证了模型优化路径:
- 显著提升渠道:
1. 引入正交层,有效降低因子与低频风格因子的相关性,提升因子稳定性与组合增强优势。
2. 输入特征合理压缩,避免冗余特征摊薄信息密度,提高训练效果。
3. 采用截面标准化处理,相较原始或时间序列标准化提高因子预测能力。
4. 优化训练/验证集分割比例,缩短验证集长度,利用更多近期数据强化模型拟合。
5. 调整预测目标为风险调整后的超额收益,增强模型多头选股收益。
- 改进无效或负面尝试:
- 简单提升输入特征频率至10分钟未带来选股能力提升,反而导致信息提取不足。
- 单纯引入环境变量未见正面效果。
- 延长训练集至240天改善单因子表现,但未在组合增量测试中获一致优势。
- 增加模型复杂度未有效提升因子表现,指出信息量是进一步提升的前提。
- 实测结果支持现有120天滚动、GRU(50,2)架构模型在选股效果与计算效率间取得较好平衡。
- 风险提示重点强调系统性市场风险、流动性风险及政策风险,提醒因子研究需结合实际市场动态及交易环境。
综上,报告坚定地表明:通过合理的模型训练约束、特征工程优化和目标调整,可以进一步增强基于深度学习的高频因子在周度选股中的性能和实用价值,具有较强的现实应用前景和改进空间。[page::0][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15]
---
免责声明
本报告数据与观点基于海通证券研究所公开数据,旨在为特定客户提供投资参考,不构成投资建议。投资有风险,交易需谨慎。详见报告末尾免责声明。
---
注: 本次分析覆盖报告约19页内容,文中代码格式表达的数学符号、因子名称严格来源于报告,图片引用根据报告页面编号。所有数据均来源于报告中表格和图示,确保内容准确且可溯源。