基于残差网络的端到端因子挖掘模型
创建于 更新于
摘要
本报告提出基于残差网络(ResNet)的两阶段端到端因子挖掘模型,利用数据图片结合ResNet截面特征提取和RNN时序特征提取方法,捕捉长周期量价信息。模型以半小时和周度k线数据为输入,较传统人工构建特征提升因子选股能力。结合非线性加权打分,模型在沪深300、中证500、中证1000等宽基指数增强策略中实现显著年化超额收益,且换手率适中,具备良好替代性和增量效果。回测显示,长时序数据(week数据集)能有效提高未来收益预测能力,且端到端输入方式缓解了信息丢失和过拟合问题,适合大规模指数增强投资应用 [page::0][page::3][page::6][page::7][page::9][page::11][page::15]
速读内容
AI量价模型框架与端到端因子挖掘模型结构 [page::3][page::5][page::6]

- 由三个部分组成:数据预处理、因子单元特征提取(基于RNN)和因子加权。
- 新模型通过将分钟级与周度数据拼接成“数据图片”,采用ResNet并行提取截面特征,再用RNN整合时序信息,实现端到端训练。
- 通过残差连接解决深层网络梯度消失问题,结合NN层完成最终预测。
各数据集选股能力和相关性分析 [page::7][page::8]
| 指标 | week | msnew | day | ms | l2 |
| -------------- | ------- | ------- | ------- | ------- | ------- |
| RankIC | 13.17% | 13.32% | 11.94% | 13.52% | 11.50% |
| ICIR | 1.25 | 1.4 | 1.18 | 1.41 | 1.33 |
| RankIC>0占比 | 90.45% | 89.81% | 89.81% | 91.72% | 88.54% |
| 周均单边换手率 | 58.25% | 67.27% | 71.77% | 64.81% | 61.03% |
- msnew数据集与传统ms高相关(0.84),但信息覆盖更全面。
- msnew打分选股能力略优于ms。
- week数据集的长时序输入显著提升选股能力且降低了换手率,证明长周期信息对预测有增益。
- 各数据集输出偏好近期超跌及低波动股票,均与常见量价因子关系一致。
多元因子非线性加权打分策略表现与对比 [page::9][page::11]

- 定义4种模型组合,Model3和Model4引入week数据,Model2用msnew替代ms。
- 非线性加权显著优于单数据集或等权加权,准确性提升明显。
- 引入week数据后各评价指标和换手率均有改善,msnew能有效替代ms。
指数增强实证表现(沪深300、中证500、中证1000) [page::10][page::12][page::13][page::14]
| 指标 | Model1 | Model2 | Model3 | Model4 |
|-------------|-----------|-----------|-----------|-----------|
| 沪深300年化超额收益 | 11.41% | 13.22% | 14.49% | 14.76% |
| 中证500年化超额收益 | 17.15% | 17.55% | 19.76% | 20.15% |
| 中证1000年化超额收益| 24.67% | 24.29% | 29.41% | 28.72% |
| 最大回撤 | < -6.65% | < -4.81% | < -5.37% | < -4.95% |
| 周均单边换手率 | 约46%-69% | 约46%-69% | 约46%-67% | 约46%-69% |
- A股三大宽基指数增强均获得显著超越基准的年化收益。
- Model3和Model4(引入week数据)表现优异,最大回撤控制良好,换手率低至可接受水平。
- 绘制净值及超额净值曲线直观体现模型有效性和稳定性。
因子挖掘模型优势与结论总结 [page::15]
- 基于ResNet的端到端因子挖掘解决了长周期捕捉难和信息丢失问题。
- msnew数据集可替代传统ms特征,且表现更全面。
- week数据集能有效增强模型预测能力和选股表现。
- 高频数据和长周期数据结合的两阶段提取网络结构计算效率高且风险可控,适用于多指数增强策略。
- 模型成功实现宽基指数增强策略目标,获得较高超额收益和较低换手率,体现其在量化选股和指数增强中的实用价值。
深度阅读
金融研究报告详尽分析报告
报告标题与概览
报告标题:《基于残差网络的端到端因子挖掘模型》
作者及机构: 东方证券研究所,分析师杨怡玲(执业证书编号:S0860523040002);联系人陶文启
发布日期: 2023年8月24日
研究主题: 本报告聚焦采用基于残差网络(ResNet)的两阶段机器学习模型构建股票量价因子,从而实现高效端到端因子挖掘,提升量化选股策略的表现。核心在于利用深度学习架构提取截面及时序多频率特征,缓解传统人工特征筛选的过拟合问题。
核心论点及结论:
- 提出两阶段模型:首先利用ResNet对数据图片进行时间截面特征提取,随后将提取的特征序列输入循环神经网络(RNN)捕捉时序特征,实现端到端的因子挖掘方法。
2. 构建半小时k线(msnew)和周频数据(week)数据集,替代或增强之前的人工构建五分钟k线日频特征(ms)与日k线特征(day),提升因子信息的全面性和预测力。
- 量化回测显示,msnew生成因子的选股能力略优于ms,且与ms高相关,表明其可替代性强;week数据集引入后,因子预测能力显著提升,且有助于降低换手率。
4. 基于多数据集组合的非线性加权打分(Model3与Model4),在中证全指、沪深300、中证500、中证1000指数上均获得显著超额收益,且适用于指数增强策略,控制换手率及风险约束下实现良好表现。
核心信息让投资者了解到,基于深度学习尤其是残差网络的端到端方法在量价因子挖掘中的技术优势及应用效果,并且提出了系统的选股策略框架及成功案例,具备推广应用价值。[page::0]
---
目录与报告结构
报告分为七大部分:
- 引言(阐述研究背景及模型框架初步)
- 一、因子提取单元网络结构(综述残差网络原理及数据图片构造,介绍模型架构)
- 二、因子分析(评估和比较各数据集生成因子的选股表现及相关性)
- 三、各数据集因子非线性加权结果分析(综合多数据集因子的加权表现)
- 四、合成因子指数增强组合表现(策略实际应用于代表性指数的增强效果)
- 五、结论
- 附录及风险提示、参考文献等基础资料。[page::1]
---
引言与问题陈述
- 背景: 机器学习模型尤其是RNN在量化投资因子提取方面表现突出,前期使用多频率数据集搭建AI量价模型框架,效果显著,但存在时序长度短和人工特征构造信息有限的缺陷。
- 问题:
1. 以往时序信息仅涵盖过去30个交易日,难以捕获更长周期量价因子的有效信息,且直接延长时序长度计算成本大。
2. 人工构建的ms数据集中五分钟k线合成的特征无法完全反映分钟k线信息。
- 解决方案: 提出基于残差网络的两阶段端到端因子挖掘模型。优点包括:残差网络对截面特征提取可并行计算减少时间,端到端输入缓解信息丢失和过拟合问题。[page::3][page::4]
---
一、因子提取单元网络结构
1.1 残差网络(ResNet)原理
- 传统深层神经网络训练经常遭遇梯度消失问题,导致学习失败。ResNet引入残差连接(skip connection),即每层输出为输入加上该层学习到的残差映射:
$$\mathbf{x}{l+1} = \mathbf{x}l + \mathcal{F}(\mathbf{x}_l)$$
- 该结构缩短梯度传递路径,有力解决梯度消失,提升训练深层网络的可行性。
- 数学视角中,ResNet的计算过程近似求解一个常微分方程,且保证可解性和稳定性,使其性能优于传统网络。
- 文章图2(残差块结构示意)详细展示了skip connection的计算流程和激活函数应用。
1.2 数据图片及数据集构造
- 将时序数据按照字段与时间拼接成“数据图片”,例如每张图片的横坐标对应时序的连续时间点,竖向为字段指标(如开盘价、最高价、成交额等)。
- 与图像不同,该数据图片的纵向行与行之间无直接相关性,故采取纵向作为通道,横向应用一维卷积(Conv1D)提取特征。
- 数据集设计:
- week数据集: 过去150个交易日数据,每5日打包形成一张数据图片(字段高开低收、VWAP、换手率),形成30个时间点的时序图片序列,单张图片尺寸6×5。
- msnew数据集: 日内8个半小时k线的高开低收与金额字段,预处理后形成大小为5×8的数据图片,连续30天拼接形成时序序列。
- 旧的数据集包括:
- ms数据集: 由五分钟k线人工合成的特征日频数据。
- day数据集: 日度k线数据。
- l2数据集: 也为合成日度数据。
1.3 网络架构
- 步骤一: 每时间点的数据图片输入到ResNet层,利用Skip connections和Downsample处理实现截面特征提取(见图4)。
- 步骤二: 将各时刻的ResNet提取的特征序列输入RNN单元,捕获时序动态特征。
- 步骤三: 取最后一个RNN单元输出通过多层全连接神经网络(NN Layer,详见图6)产生最终预测打分。
- 损失函数由两部分组成:预测误差平方和和正交化惩罚项,后者利于因子间弱相关性,从而增强因子多样性和模型泛化能力。
以上结构体现了典型的深度端到端学习通过截面+时序两阶段结合提取因子特征的设计思路。[page::4][page::5][page::6]
---
二、因子分析
2.1 不同数据集选股效果比较
- 表1展示不同数据集多元RNN因子的RankIC指标和年化信息比(ICIR),发现:
- msnew(13.32%)与ms(13.52%)RankIC相近,略逊于ms。week数据集略逊于msnew,但多数指标相近。
- msnew弱因子的周均单边换手率(67.27%)高于week(58.25%)但低于day(71.77%)。
- 图7和表2展示了各数据集丰富的年化超额收益率与因子相关性,显示:
- msnew选股能力整体较ms提升,且与ms相关系数为0.84,说明两者存在信息重叠但差异显著。
- week因子表现优于day,推断更长时间窗口的输入时序对预测未来收益能力显著提升。
2.2 打分与常见量价因子的相关性
- 通过图8展示五种数据集生成因子与常见量价因子(如VOL20, RET20, PPREVERSAL等)Pearson相关系数,发现:
- 五种数据集打分均倾向于挑选近期超跌、波动率较小股票,且对长期是否超跌敏感度低。
- msnew与ms对日内量价因子的相关性高度一致,说明深度学习能够较完整从分钟数据中提取主要信息。
该章节的分析明确了新提出的数据集与旧数据集的相似性与差异性,说明端到端模型有效挖掘了更细粒度信息且提升了预测能力。[page::7][page::8]
---
三、各数据集因子非线性加权结果分析
模型构建与数据集组合
- 定义四个模型组合:
- Model1: day + ms + l2
- Model2: day + msnew + l2(ms替代版)
- Model3: week + day + ms + l2
- Model4: week + day + msnew + l2
- 目的:考察msnew对ms的替代性能及week数据能否提供有效增量。
汇总与分组测试结果
- 表3及图9显示中证全指上的RankIC和年化超额收益提升显著:
- 引入week数据的Model3和Model4整体表现优于Model1和Model2。
- Model2因msnew替代ms,表现与Model1相近,印证msnew有较好替代性。
- 多指数分组测试(沪深300、中证500、中证1000,见表5-7)亦验证了类似观点:
- Model3和Model4均表现最佳,尤其在中证1000股票池中年化超额收益最高,达35%左右。
- 换手率较低,最大回撤控制良好,风险指标稳健。
分析总结
- 非线性加权整合多元因子远优于单一数据集等权组合。
- 引入周频数据集week显著提升打分预测能力,带来明显的选股增量。
- msnew可有效替代传统ms数据集,保持整体模型表现稳定。[page::9][page::10]
---
四、合成因子指数增强组合表现
4.1 指数增强组合构建说明
- 回测期:2018年1月1日至2023年6月30日,周频调仓,买卖以次日VWAP成交价格成交。
- 严格风险暴露控制:行业暴露不超过2%,风格暴露不超过0.5,跟踪误差限制在4%-5%。
- 指数成分股占比≥80%,周单边换手率限制≤20%,交易成本考虑千分之一买入、千分之二卖出。
4.2-4.4 沪深300、中证500、中证1000增强表现
- 三大指数增强策略中Model3和Model4表现突出,年化超额收益分别达到约14.5%-14.7%(沪深300),约19.8%-20.1%(中证500),约28.7%-29.4%(中证1000)。
- 最大回撤维持在4%-5%(沪深300和中证500),中证1000更低于4%。波动率控制合理且周度胜率均超过65%。
- 各指数净值曲线(图11-16)显示选股组合稳健跑赢基准指数,超额收益稳步积累。
- 通过2023年分年度表现(表8、10、12),除个别年份表现波动外整体收益持续稳健,增强策略由数据集组合驱动表现持续优异。
这意味着构建的非线性加权因子打分具备实际投资应用价值,且可作为指数增强的有效工具,风险收益偏好合理。[page::11][page::12][page::13][page::14]
---
五、总结与结论
- 本报告针对传统量化因子构建面临的长周期信息捕捉、人工特征局限等问题,创新性地引入基于ResNet的两阶段端到端因子挖掘模型。
- 利用残差网络和RNN结合,增强模型对截面和时序特征的提取能力,且支持并行计算降低成本。
- msnew数据集替代传统ms数据集被证实有效,且含有更全面的量价信息。
- week数据集长时序信息大幅提升预测能力,降低组合换手率,带来显著的收益增量。
- 两种多数据集组合(Model3与Model4)在多个主流指数选股和指数增强策略上均获得稳定且显著的超额收益。
- 打分表现市值偏向性低,体现多样化且稳健的选股能力。
- 为量化投资模型设计提供了先进的技术途径,研究成果具实用价值和推广前景。[page::0][page::15]
---
图表解读
图1(AI量价模型框架,page 3)
描述了一套基于数据预处理→RNN提取因子单元→决策树加权→最终模型得分的量价选股框架,为本研究的基础,解决了量价数据多频率融合的挑战。图示中红色框体现出整体流程清晰,强调数据处理的重要性和多因子融合策略。
图2(ResNet层结构说明,page 4)
展示残差块的两层权重层和跳连结构,用于输出层相加避免梯度消失。该设计核心为简单且高效的skip connection示意。此图基础于深度学习经典结构,解析网络构架关键技术核心。
图3(数据图片结构,page 5)
数据拼接成类似图像的矩阵形式,横向是时间序列,纵向是价格、成交额等字段,起到“图片”的作用,便于神经网络处理。区别于自然图像,纵向无强相关性,采用Conv1D水平卷积方式处理,有效保留时序特征。
图4(ResNet特征提取示意图,page 6)
显示数据图片先通过卷积层和非线性激活,后通过下采样(Downsample)和残差块相加得到截面特征,说明了两路并行运算及结果融合过程。
图5(端到端因子挖掘网络结构,page 6)
揭示两阶段模型运作流程,数据图片序列经ResNet截面特征抽取,形成时间序列特征;随后输入RNN处理捕获时序动态,最后由NN Layer输出预测打分,完整说明模型的时间分辨率设计。
图6(NN Layer结构,page 6)
反映多层全连接网络多因子融合流程,其中批量规范化和正交惩罚强化模型稳健性,防止过拟合。
图7(各数据集多元RNN因子年化超额收益,page 8)
显示week和msnew数据集生成的因子年化超额收益最高,表明长时序特征和内嵌半小时k线信息提升明显。表明深度学习模型的提取能力超越单一传统因子。
表1-2(各数据集因子IC与相关性分析,page 8)
统计RankIC及Pearson相关,支撑了msnew和ms数据集相似但不等同,week数据集提供独立稳定增量的结论。
表3与图9(中证全指非线性加权因子分组表现,page 9)
Model3和Model4提升RankIC至约15%、年化超额收益超40%,同时换手率下降,表明多数据集组合的实际效用。
表5-7及图10(沪深300、中证500、中证1000分组表现,page 10-11)
展现多指数跨市场应用的良好扩展性,均衡收益与风险参数表现。
表8-13及图11-16(指数增强策略年度超额收益及净值累计走势,page 12-14)
年度收益贯穿多数年份优异,净值与超额净值曲线稳定上扬,与基准指数明显拉开差距,验证策略的实用价值与稳健性。
所有图表数据均显示了端到端两阶段因子挖掘模式在多市场上的强大选股能力及投资组合应用表现,且辅助性指标(回撤、换手等)均在合理范围。[page::3-16]
---
估值方法分析
本报告集中于因子构建与策略表现,未涉及传统企业估值模型(如DCF、市盈率法等),故不适用此类别分析。核心关注点为因子开发与量化策略回测,不包含目标价或估值建议。
---
风险因素评估
报告明确风险提示:
- 量化模型基于历史数据构建,存在未来失效的风险。
- 极端市场环境(如大幅波动、黑天鹅事件)可能冲击模型表现,导致亏损。
未具体展开缓解措施,但策略中设有限制指标(风险因子暴露、最大回撤限制、换手率约束)以控制风险敞口。强调投资者需紧密跟踪模型表现,应对风险带来的潜在不确定性。[page::0][page::16]
---
审慎视角与细微差别分析
- 报告中充分基于实证数据支持方法有效性,减少偏见风险。
- 模型优势强调端到端与长时序相结合的能力,但长周期数据的实际早期信息是否全面反映未来仍存不确定性。
- msnew与ms的替代作用在指数增强任务已验证,但在其他任务中的表现待验证,提示未来扩展必要。
- 换手率限制为20%,虽较合理,但在极端流动性紧张时可能带来操作风险。
- 报告未详细披露训练细节与超参数敏感度,技术细节透明度稍显不足。
- 初步风险提示简单,未深入展开极端风险下的策略表现恢复机制,侧重量化翻新而非完整风险管理体系建设。
- 图表虽然全面,但存在部分数字小数点错误或格式稍有瑕疵,需用户自行甄别。
整体来看,报告保持了较强的专业性和实证基础,潜在不足主要在于模型固有限制和风险管理深度。
---
结论性综合
本报告深入剖析了基于残差网络的两阶段端到端因子挖掘模型,体现出创新的深度学习架构设计与多频率数据集融合理念。通过对多数据集构造和模型架构的详细介绍,对截面和时序特征提取的机理分析,及丰富的实证回测数据说明,报告展现了以下几个关键结论:
- 技术创新点: 利用ResNet先截面特征提取并行处理,结合RNN长时序依赖学习,解决传统因子序列长度受限和人工设计特征的不足,增强信息提取的完整性和预测力。
- 数据集构建: 半小时k线msnew数据集和长期周频数据week数据集有效替代和增强传统五分钟构造的ms数据集和日频数据day,填补了长周期信息挖掘的空白。
- 模型表现: msnew与ms信息重叠度高且选股能力稍强,msnew可完全替代ms;week数据集的引入使得综合模型RankIC提升至15%左右,top组年化超额收益稳定突破40%,且在沪深300、中证500和中证1000多指数均表现优异。
- 策略应用价值: 合成因子非线性加权打分策略应用到指数增强,取得长期稳定正超额收益及风险控制,如回撤和换手达到业界优异水平。
- 风险提示: 主要来自量化模型可能失效和极端市场冲击,策略构建中采用多维风险约束机制以缓释。
综上,报告不仅在技术方法上进行创新,还将深度学习技术与金融量价因子挖掘及策略应用高度融合,充分证明了端到端残差网络+RNN模型在量化选股和指数增强领域的实用价值,具备较强的推广前景和实操指导价值。
本模型和实证结果对专业量化投资团队及研究人员具有重要启示意义,方向明确且结果令人信服,有助于提升中国A股市场量价因子挖掘的深度和广度。
---
附注: 以上所有数据均来源于东方证券研究所提供的表格、图表及文本,引用规范附加页码标识,力求溯源准确。[page::0,1,3–17]
---
参考文献
报告详细引用了包含 DenseNet、ResNet与Neural ODE等经典论文,体现对理论基础和前沿研究的关注和吸收。
---
风险提示及免责声明
详见报告末尾,明确指出投资有风险,模型拟合过往不代表未来业绩,建议投资者谨慎决策,[page::0,16,18,19]。
---
总体评价
本报告系统性强,理论与实证兼备。对于金融领域深度学习模型的实践应用有较高参考价值。结构清晰、内容详实、图表丰富,逻辑严谨。
其端到端模型设计和多频率数据集融合体现了较前沿的量化研究趋势,有望推动量价因子研究和量化选股策略创新。