`

基于深度组合的选股策略——数量化专题之九十七

创建于 更新于

摘要

本报告基于深度学习中的“深度组合”理念,提出将自编码网络提取的非线性价格特征应用于沪深300选股,并转化为分类问题进行收益预测。策略在2010-2017年间取得18.37%的年化收益及8.33%的最大回撤,表现优于传统动量策略。报告还提出利用自编码损失函数指标评估策略置信度,实现策略的动态优化,降低风险。深度组合方法有效补充传统多因子模型,未来有望在更高频交易中发挥更大作用 [page::0][page::2][page::4][page::5][page::7][page::11][page::13][page::16][page::18][page::19]

速读内容


深度组合理念与传统理论的兼容性 [page::3][page::5][page::6]

  • 深度组合通过深度神经网络提取隐藏在价格序列中的非线性因子,区别于传统线性因子模型。

- 该方法基于Markowitz均值方差、Black-Litterman和多因子风险模型,同时借鉴信息论中编码解码的思想,确保特征提取的有效性和预测能力。
  • 神经网络隐含层节点可视为非线性组合因子,预测短期股票收益特征稳定性。


自编码网络用于特征提取及置信度判断 [page::7][page::8]


  • 输入120日收益率,经过编码和解码,最小化原始输入与复原的误差,误差大小用于衡量特征提取的有效性。

- 个股编码损失超过阈值则剔除,整体模型编码损失过大时判定模型失效,建议空仓或切换策略。
  • 优化目标函数结合L2正则,抑制过拟合,提高模型泛化能力。


选股转为分类问题及神经网络模型选择 [page::9][page::10]



  • 利用隐含特征预测下一期收益率是否超过基准,采用交叉熵优化分类模型。

- 通过训练集和验证集分时间段划分,减少过拟合风险,验证超参数的敏感性。
  • 最终选定的网络结构为69-90-5-10-100-3,各参数通过验证集调优确定。


沪深300选股实证及回测表现 [page::11][page::12][page::13][page::14][page::15]




  • 选股范围为沪深300成分股,回测时间2010.5-2017.5。

- 策略采用等权和按输出概率加权两种配置,年化收益分别达18.37%和19.69%,最大回撤分别为8.33%和8.64%。
  • 表现超过传统动量策略,且在2013-2015动量行情明显提升,回撤控制优于动量策略。

- 同一模型在中证500选股表现类似,年化收益19.03%,最大回撤9.61%。

策略风格与行业偏好分析 [page::15][page::16]



  • 策略偏好小市值、高盈利性、动量和高流动性股票。

- 行业配置倾向电子元器件、医药、房地产、机械,低配传媒、银行、非银金融和军工。
  • 风格和行业偏向表明单一模型偏向捕捉共性价格模式,缺乏中性处理。


损失函数指标与策略有效性验证 [page::16][page::17][page::18]



  • 编码损失函数$\overline{\Delta}(\psi)$与策略月度收益呈显著负相关,相关系数达0.3776。

- 损失函数提前计算,具有领先性,能有效预警策略失效。
  • 基于阈值过滤低置信度区间,策略最大回撤从8.33%降至6.14%,年化收益从18.37%提升至19.98%。


总结与未来展望 [page::18][page::19]

  • 深度组合优势在于能够学习非线性特征,弥补传统多因子选股不足。

- 特征维度通过网络结构可控,且数据量充足时过拟合可控。
  • 黑箱问题依然存在,缺乏直观因子解释。

- 未来重点是在更高频、更丰富数据中挖掘深度组合潜力,拓展应用场景。

深度阅读

金融工程报告《基于深度组合的选股策略》详尽分析报告



---

1. 元数据与概览


  • 报告标题:基于深度组合的选股策略 ——数量化专题之九十七

- 作者:刘富兵(分析师)、殷明(研究助理)等
  • 发布机构:国泰君安证券研究所

- 发布日期:2017年7月11日
  • 研究主题:将深度学习方法引入股票选股领域,基于沪深300及中证500的选股实践,探讨深度组合理念及其实证表现。


核心论点摘要

报告重点阐述“深度组合”理念,即通过深度神经网络提取股票价格的非线性特征,用于股票的选股预测和组合构建。深度组合虽然不是新的选股方法论,但它提供了从不同视角(非线性特征抽取)对价格信息的解读。实证显示,从2010年至2017年,基于深度组合的选股策略在沪深300股票池中实现18.37%的年化收益率,最大回撤为8.33%,显著优于传统动量策略,且策略可用损失函数指标有效判断其策略有效性与风险,为实时策略管理和优化提供工具。
此外,报告提出了深度组合的黑箱问题及过拟合挑战,并给出利用自编码网络损失函数优化策略的思路。

[page::0, page::2]

---

2. 逐节深度解读



2.1 引言



引言部分回顾了传统量化因子选股的挑战:新因子挖掘困难,因子稳定性下降。深度学习在多个传统领域爆发,投资界开始尝试引入该技术,但由于金融市场中噪音大、信息复杂,深度学习效果有限。深度组合强调非线性特征挖掘,与传统线性多因子模型不同,利用深度神经网络在海量数据和复杂特征下构建选股策略。报告选取沪深300池做实证,回测显示策略在不同市场环境具有较好超额收益表现。

提出尽管深度组合稳定性不及传统多因子方法,但其在传统方法失效年份表现出更强的超额收益,说明该策略作为补充选股策略价值。

报告结构清晰,涵盖基本理念、理论基础、算法细节、实证分析及后续展望。
[page::2]

2.2 深度组合理念


  • 2.1 基本概念

深度组合最初由Heaton(2016)提出,核心思想是用深度神经网络从价格时序中构建预测因子,区别于传统动量因子,深度组合提取非线性复杂特征。报告指出,虽不着重介绍深度学习技术细节,但强调其在解决“黑箱”与“过拟合”上的具体思考。
  • 2.2 组合构造方法

具体步骤包括:
(a) 以选股池内股票过去120个交易日的收益率作为模型输入,代表市场原始信息,
(b) 利用自编码网络提取隐含非线性特征,捕获共振模式,
(c) 将股票未来期收益预测任务转化为分类问题,输出各收益区间的概率,基于概率选股建仓。
  • 2.3 隐含假设

核心假设为“所有因子信息(已知和未知)均体现于价格序列中”,这是一个理想的强假设,实际市场可能不完全成立,但是深度组合方法的理论基础。模型通过损失函数指标判断该假设是否成立及模型是否失效。
[page::3, page::4, page::5]

2.3 理论基础与不同视角



报告站在传统金融理论角度解析深度组合的合理性。分别从:
  • Markowitz均值-方差模型与Black-Litterman模型

深度组合可以看作是从价格数据中学习出非线性“因子”,而均值-方差模型则通过均值和协方差矩阵“编码”价格信息。Black-Litterman通过加入置信度修正,构造的优化问题和深度组合中的损失目标函数形式相似。
  • 信息论视角

神经网络通过编码、解码减少传输信息的损失,达到压缩且最大限度保留可预测信息的目的。自编码算法的本质是学习可逆的变换,减少噪音,提取本质特征。
  • 传统多因子模型视角

报告将深度组合隐含层节点比作多因子模型的因子,认为深度组合提取的特征在短时间内稳定,用以预测未来期收益,实现了因子分解与风险收益管理。

综上,深度组合与传统模型并不冲突,是对市场特征的一种非线性更深层的解读。[page::5, page::6]

2.4 基于深度组合的选股算法细节


  • 4.1 自编码学习

自编码网络由输入层(原始数据)、隐含层(编码特征)和输出层(解码重构)组成。优化目标是重构误差(损失函数)加上正则项(L2惩罚)$\zeta(W)$。该损失函数既训练模型参数,也作为编码信息保真度的度量。
通过比较每只股票的编码损失值$\Delta(W)$,剔除信息损失大的“不可信”个股,提升整体策略置信度。对整体池的平均损失也设阈值,作为模型失效判断的指标。
图2详细示意了自编码结构与流程。
使用该损失函数作为策略置信度度量,解决了投资者对神经网络“黑箱”和过拟合的顾虑。
  • 4.2 转化为分类问题

使用自编码学习到的特征作为输入,将预测未来$^{T+1}$期个股是否击败基准指数转为二分类(或多分类)问题,输出为各类别概率,优化交叉熵损失函数。
图3示意分类网络结构,权重参数通过梯度下降学习。
  • 4.3 模型选择与验证

报告指出过拟合来源包括超参数过拟合及时间序列验证集按时间切分主观性,强调用含牛熊市、不同市场风格的时间段作训练和测试,做超参数的敏感性检验。
  • 4.4 构造深度组合的一般步骤

分为编码提取非线性特征,转化分类,超参数选择及滚动训练,具体流程见图4。
[page::7, page::8, page::9, page::10]

2.5 实证分析——沪深300选股案例


  • 5.1 数据预处理

原始数据覆盖2000~2017年,分2000-2008训练集,2009-2010验证集,2011-2017测试集。以个股过去60个交易日(累计日收益率)和9个月(月累计收益率)等共69维数据做输入,去除停牌ST股,做Z-score标准化。$^{T+1}$期收益以三段区间标注用于监督。
图5通过二维热力图直观对比编码前后数据还原质量,说明自编码对部分股票有效提取特征,部分股票信息丢失严重,涉及个股筛选。
  • 模型调参

固定最后一层100节点,先调第一隐藏层S2节点数,结果表明S2=90时重构损失最低(表1);进一步增加层数测试第二隐藏层S3节点数,最终确定结构为69-90-5-10-100-3,经实验五层结构无明显降低损失,故不再加深(表2)。
  • 5.2 选股策略具体构建

换仓日对每只沪深300成分股计算其编码损失$\Delta(W)$,若大于阈值0.30则剔除,不参与下期预测。对其余股票预测输出3分类概率$\hat{y}_i$,选取排名前20%的50只股票多头建仓。选仓方式包括(1)等权重(2)概率加权两种。考虑交易成本(千三双边)。
强调策略无市场择时,未做风格中性处理,策略由神经网络自行学习市场风格。且预测为概率非权重,可结合传统风险模型做组合优化。
  • 5.3 策略表现

回测2010.5~2017.5,图6显示等权重策略净值显著跑赢沪深300基准和传统动量因子(未中性处理),实现年化18.37%,最大回撤8.33%; 图7展示概率加权略优,年化19.69%,回撤8.64%(表3、4)。
策略在动量强势的13-15年表现尤为突出,期间多次股灾中深度组合策略回撤控制明显好于传统动量因子策略,显示策略适应市场变化的灵活性。
在中证500成分股池进行类似测试(图8,表5),表现类似,年化约19%,最大回撤9.61%。
  • 5.4 策略归因分析

策略风格(图9)偏向小市值、高盈利、动量和高流动性,行业偏好(图10)偏重电子元件、医药、房地产和机械,低配传媒、银行、国防军工。归因结果显示,因统一模型挖掘共性特征,带来一定的风格和行业偏差。
  • 5.5 策略指标分析及优化

以编码解码损失函数均值$\overline{\Delta}$作为策略置信指标,观察其与策略月度收益的关系。
从表6和图11可见,损失函数高时,策略表现差;损失函数低时,策略表现好,且指标为当前换仓日计算,具有提前判断能力,相关性绝对值达0.3776,说明该指标为可信的有效性检测工具。
利用该指标,设定阈值($\overline{\Delta}=100$)进行仓位管理:亏损概率高时弃用策略,使用基准组合,图12显示该优化使最大回撤由8.33%降至6.14%,年化收益由18.37%升至19.98%。

总体来看,深度组合策略有效挖掘了价格时序中的非线性特征,且通过损失函数指标提升策略的稳定性及风险管理能力。
[page::11, page::12, page::13, page::14, page::15, page::16, page::17, page::18]

---

3. 图表深度解读



图1:深度神经网络示意



展示神经网络输入层(时间序列收益率)->多层隐含层(非线性“因子”)->输出层(分类标签)的结构。说明层次增加可以捕获更复杂非线性特征。
支持深度组合的非线性复杂因子抽取思想。
[page::3]


图2:自编码简化网络示意



示意输入层(原始收益率向量X)通过编码函数H映射至隐含层特征Z,再由解码函数G映射回输出层Y,优化目标为输入输出重构误差最小。
该结构是深度组合非线性特征提取的核心基础,损失函数衡量了特征提取的信息保真度。
[page::7]


图3:分类示意图



隐含层Z特征输入至输出层,输出层节点根据未来期是否超越指数划分(如二分类)。交叉熵作为损失函数对网络进行训练。
展示了如何将特征提取转化为分类预测,为选股提供概率依据。
[page::9]


图4:深度组合构造流程



流程图依次为:非线性特征抽取(自编码)->分类优化预测->模型选择验证->滚动更新学习参数。
明确步骤清晰,是深度组合实际应用框架的核心。
[page::10]


图5:编码解码结果与原始数据对照



上半部分(1、3行)为原始69维输入数据的二维色块图,下半部分(2、4行)为自编码网络回归后的数据。可以直观判断个股信息损失,例如部分个股颜色变化巨大,代表回归误差大,不适合纳入进一步预测。
说明网络能够较好还原部分个股信息,但不同个股差异明显,支持用损失函数对个股置信度筛选。
[page::11]


表1 & 表2:模型验证与超参数调优


  • 表1列出了固定网络层次结构下不同隐藏层节点数S2对应的损失函数数值,显示S2=90时损失最小;

- 表2在增加更多层级结构中调整S3层节点数,据此确定最佳网络结构为69-90-5-10-100-3。

体现了模型选择的科学性,旨在降低过拟合风险,提升泛化能力。
[page::11, page::12]

图6-7、表3-4:沪深300选股策略收益及指标


  • 图6和表3展示50只股票等权做多策略回测,年化收益18.37%,最大回撤8.33%;

- 图7和表4展示权重按输出概率配比策略回测,年化收益19.68%,最大回撤8.64%。

与沪深300基准和传统动量策略对比,深度组合策略优势明显,表现稳定。
[page::13, page::14]

图8、表5:中证500选股策略表现



同样的深度组合策略在中证500成分股中应用,年化收益19.03%,最大回撤9.61%,表现接近沪深300池,体现方法的通用适用性。
[page::14, page::15]

图9-10:策略归因分析(风格及行业偏好)


  • 图9显示策略偏好Beta正相关、小市值、强动量及高流动性因子,负相关市盈率倒数(收益率指标)、杠杆率;

- 图10显示行业偏好高配电子元器件、医药、房地产等,低配传媒、金融和军工。

说明深度组合捕捉了特定市场风格和行业特征,具备解释层面,为风险控制和风格调节提供线索。
[page::15, page::16]

图11、表6:损失函数$\overline{\Delta}$与月度收益关系分析


  • 图11叠加展示了月度策略收益(柱形)与损失函数(折线),明显负相关,损失高月收益低,反之亦然。

- 表6展示详细月度收益与对应损失数值,分析验证了指标的领先性和有效性。

此指标为预警信号,辅助动态仓位管理。
[page::16, page::17]

图12、表7:基于损失函数阈值策略优化回测


  • 放弃损失函数高风险区间,使用基准持仓后收益曲线(图12)显示,策略表现更稳定,最大回撤降至6.14%,年化收益19.98%明显提升。

- 表7数据明确体现优化效果。

验证了损失函数作为置信度指标对提升策略风险控制的实用价值。
[page::17, page::18]

---

4. 估值分析



报告未涉及证券估值层面,聚焦于量化选股策略构建与表现。因此不存在传统意义的DCF、PE、EV/EBITDA等估值分析。

深度组合本质是基于量化的风险调整收益优化模型,估值内涵体现在模型的性能指标(收益率、回撤率、最大回撤相关指标)及策略的优化过程(交叉熵损失函数最小化、自编码损失函数衡量特征有效性)中。

---

5. 风险因素评估



报告主要识别和分析以下风险因素:
  • 强假设风险:认为所有因子信息均包含在过去价格序列中,但现实市场可能存在非价格信息驱动风险,或结构性断裂导致模型失效。[page::4]
  • 模型失效风险:市场风格变化、非平稳性可能导致模型提取的深度特征失去有效性。对应策略采用损失函数指标检测模型失效,实时调整或放弃策略避免损失。[page::8, page::17]
  • 过拟合风险:网络结构与超参数复杂度可能过高导致训练数据拟合良好但泛化能力弱。通过验证集设计与超参数敏感性分析缓解,推荐使用多风格、不同时期数据集训练。[page::9]
  • 黑箱解释风险:深度学习隐含层特征难以直接解释,投资者难以直觉理解策略回撤或异常。虽通过损失指标部分缓解风险,但风险管理能力依赖更深层次的因子解析仍有限。[page::18]
  • 操作风险:策略仅作选股,不含择时及风格调整,未做风险中性处理,可能引致风格风险暴露。[page::12, page::15]


报告通过损失函数指标作为策略置信度衡量工具,显著增强风险监测及缓释能力,实现动态仓位调整,降低最大回撤,提升整体稳定性。[page::17, page::18]

---

6. 审慎视角与细微差别


  • 模型假设强度:报告假设所有因子信息寄存于历史价格序列中,实际市场中此假设难以完全成立,可能影响策略稳健性,尤其在突发事件或信息非对称严重情况下。[page::4]
  • 黑箱问题难解:非线性隐含特征难以金融语义解释,影响投资者信心和风险管理实操,报告仅用损失指标进行间接判别,尚无直观的因子透明度工具。[page::18]
  • 数据预处理与样本划分:按时间切分训练验证与测试数据,固然契合时间序列预测逻辑,但可能存在样本偏差,且未涉及如何处理样本不平衡、异常值对训练的潜在影响。[page::9]
  • 风格和行业偏差:策略未做中性化处理,导致一定的风格集中与行业集中风险,略显单一策略的潜在风格风险暴露,建议将该策略纳入多因子多策略框架,做多维度风险分散。[page::12, page::15]
  • 交易成本与流动性:仅考虑双边千三费用,未对换手率和市场冲击成本做更深入模拟,真实交易成本可能更高,影响净值表现。
  • 换仓频率较低:月度换仓限制模型学习速率,特别对日内数据优势发挥不足,未来研究将深化对高频数据的应用。[page::19]
  • 缺少异常市场环境测试:回测主要依赖历史数据,缺少对异常市场(例如2015年股灾外的危机型事件)策略稳定性和鲁棒性测试。


---

7. 结论性综合



本报告通过系统地介绍“深度组合”的理念、理论基础、算法细节及沪深300与中证500的实证回测,展示了深度学习技术在量化选股中的创新应用。核心结论如下:
  • 深度组合思想基于深度神经网络提取股票价格非线性特征,突破了传统线性多因子的局限,体现更丰富的市场信息规律。
  • 报告充分论证了深度组合与Markowitz均值方差模型、信息论编码、多因子风险管理模型等经典理论兼容,增加了新视角而非违背传统金融学。
  • 实证结果表明,通过69-90-5-10-100-3深度网络结构,对沪深300及中证500分别达到18~19%年化收益率,最大回撤控制在6~9%区间,明显优于基准指数及传统动量因子策略。
  • 利用自编码网络的重构损失函数$\Delta(W)$作为策略置信度量化指标,该指标领先策略收益,显著相关,具备识别模型失效的能力,是解决深度学习“黑箱问题”的有效工具。
  • 通过基于该指标动态仓位管理,策略最大回撤可由8.33%降至6.14%,年化收益由18.37%升至19.98%,风险调节显著改善。
  • 策略存在的 不足 包括对强因子假设的依赖、黑箱解释难题、风格和行业集中风险、较低换仓频率等,建议未来结合风险中性处理,提高高频数据利用,提升模型透明度。
  • 对未来展望,报告强烈看好深度学习在更高频、更丰富数据维度(如盘中数据、期货市场)中的应用,预计能发挥更大作用。


总体而言,该报告提供了选股领域中深度神经网络应用的详尽理论与实践探索,表明深度组合方法能够在现有多因子体系外为股票选股带来有效的补充和提高,为金融工程和量化投资提供重要新工具和研究方向。

报告无评级明确给出,结合报告内容,策略属于“增持”性质的较强选股策略,表现超越沪深300基准。

---

主要图表汇总



| 图表编号 | 描述 | 主要内容与意义 |
| -------- | --------------------------------| ------------------------------------------------- |
| 图1 | 深度神经网络结构示意 | 输入层、隐含层、输出层架构体现非线性特征抽取 |
| 图2 | 自编码网络结构图 | 编码-隐含特征-解码,重构损失为特征保真度指标 |
| 图3 | 分类预测结构示意 | 利用隐含层特征进行二分类,转化为预测任务 |
| 图4 | 深度组合构造流程 | 四步法示意,体现选股全过程和动态参数更新 |
| 图5 | 编码解码结果与原始数据对照 | 可视化信息损失,实现个股置信度筛选 |
| 图6,7 | 沪深300选股策略回测收益曲线 | 明显优于基准和动量,验证网络参数优化有效 |
| 图8 | 中证500选股策略收益曲线 | 策略泛化能力验证 |
| 图9 | 策略风格因子偏好柱状图 | 策略重Beta、动量、小盘股等风格特征 |
| 图10 | 策略行业偏好柱状图 | 策略配置集中电子、医药等行业 |
| 图11 | 策略月度收益与损失函数指标关系图| 损失函数领先且负相关收益,为有效性评估指标 |
| 图12 | 优化策略收益曲线(基于置信度剔除) | 动态仓位管理提升策略稳健性,降低最大回撤 |

---

参考文献及相关工作


  • Heaton, J., Polson, N., & Witte, J. (2016). Deep Learning in Finance: Deep Portfolios.

- Lawrence Takeuchi et al., Applying Deep Learning to Enhance Momentum Trading Strategies in Stocks
  • Jakob Aungiers, LSTM Neural Network for Time Series Prediction


---

结束语



本报告深入系统讲述了如何将深度学习技术应用于当前金融选股领域,突破线性因子模型限制,发掘非线性复杂信号,通过实证验证策略的有效性和风险控制能力。以沪深300和中证500两个典型样本池为基准,结果令人鼓舞,为金融量化研究开辟了新的方向。然而,随着信息融合度和数据频度的提升,深度组合方法仍面临更严峻的模型复杂性和解释性挑战,未来需要更强大的因子透明化技术与风险管理手段辅助。整体来看,深度组合方法代表了金融科技发展的重要趋势,值得业界持续关注。

---

(以上分析内容均基于该报告原文内容,并附页码标识。)

报告