`

基本面因子模型的深度学习增强

创建于 更新于

摘要

本报告提出一种基于基本面因子初选股票池,结合深度学习模型二次筛选的增强模型。该模型显著提升了选股绩效,在中证800和沪深300基准下实现了年化超额收益分别达24.29%和22.23%,年化收益率最高达28.58%,且换手率控制在约9倍,优于单独基本面和深度学习模型,具备交易成本优势与应用价值[page::0][page::14][page::23]。

速读内容


基本面多因子模型构建 [page::4][page::5]


  • 选取盈利(ROE、GPM)、成长(YoyOr、YoyAsset)及估值(CFP)因子。

- 筛选条件组合得到持股中位数76只的股票池。

基本面模型表现 [page::6]



  • 年化收益率达18.12%,超额收益14.07%,显著跑赢中证800基准。


深度学习模型构建与表现 [page::7][page::8]


表2:深度学习模型采用7层神经网络,输入156个特征,输出股票涨跌概率,打分为涨跌概率差。

  • 深度学习模型年化收益率24.70%,超额收益20.65%,进一步优于基本面模型。


基本面与深度学习模型结合的可能性分析 [page::9][page::10][page::11]





  • 两模型相关性接近零,十分档选股重合度不高,仅约10%。

- 基本面风格因子中性化对深度学习模型打分影响甚微,表明选股逻辑差异大,具备组合互补潜力。

因子IC加权组合表现 [page::12]



  • 简单使用IC均值加权因子,年化收益率24.62%,超额收益20.69%,优于单独模型。


增强模型选股方法与实证回测 [page::13..17]


  • 基本面模型放宽筛选条件,初选股票池248只;用深度学习模型对初选池打分分三组,选最高组组建组合,持股约83只。

- 回测结果显示,增强模型年化收益率达28.58%,超额收益24.29%,显著高于其他模型。
  • 年化换手率8.83倍,低于深度学习和IC加权模型,费用敏感度更低。

- 分年度表现优异,11年回测期内8年超额收益领先基本面模型。
  • 交易成本提升至双边千分之五后,增强模型仍保持领先。


增强模型基准切换(沪深300)表现 [page::19..22]







  • 以沪深300为基准,增强模型年化收益与超额收益分别达到27.58%和22.23%,超越IC加权及单模型表现。

- 超额收益年度表现稳定,11年中9年超越基本面模型。
  • 换手率相较于基本面模型和深度学习模型有所提升但显著低于单深度学习模型。


深度学习模型分组敏感性分析 [page::23]


表5:不同分组数量对应策略表现

| 分组数 | 持仓股票数量 中位数(只) | 年化超额 | 年化收益率 | 年化换手率倍数 |
|--------|-------------------------|----------------|----------------|----------------|
| 3 | 83 | 24.29% | 28.58% | 8.83 |
| 4 | 62 | 22.81% | 27.03% | 9.44 |
| 5 | 50 | 23.42% | 27.60% | 9.80 |
  • 分组数提高导致持股数量和换手率小幅下降,指标变化不大,且总体优于单一基本面及IC加权模型[page::23].


深度阅读

深度解析报告:《基本面因子模型的深度学习增强》



---

一、元数据与报告概览


  • 报告标题:《基本面因子模型的深度学习增强》

- 系列名称:深度学习研究报告之八
  • 作者及机构:广发证券发展研究中心,联合多位资深金融分析师撰写,主要分析师包括文巧钧、安宁宁、罗军国等。

- 发布日期:2021年3月(相关研究日期)
  • 研究主题:通过深度学习技术对传统基本面选股模型进行强化,评估其效果,探索模型融合策略的潜力。

- 核心论点与目标
- 通过先用传统基本面模型筛选股票形成初选池,再利用深度学习模型进行二次筛选,形成“增强模型”。
- 此增强模型在保持较低换手率的同时,提高投资组合的年化超额收益。
- 在中证800和沪深300基准下,该增强模型的年化超额收益显著优于单独的基本面或深度学习模型,且换手率更低,具备收益和交易成本双重优势。
  • 关键结论

- 基本面模型与深度学习模型收益表现优异且相关性低(相关系数近似0),模型融合路径合理且具有潜在增值空间。
- 增强模型2011年至2021年3月回测显示,中证800基准下年化超额收益达24.29%,换手率8.83倍,远超基本面和深度学习模型。
- 即使提高交易成本(千分之五),增强模型仍优于单模型,说明其具有较好的交易成本适应性。
  • 风险提示:模型未保证绝对有效,市场结构和交易行为变化可能导致策略失效。


---

二、逐章节深度解读



1. 基本面投资与技术面投资结合趋势



报告首先指出,基本面投资基于公司的盈利能力、成长性、估值水平,因信息更新频率较低,适宜低换手率策略;而技术面投资利用价量、衍生技术指标等高频数据,适合高换手率交易。两者选股信息来源差异大,结合二者可以提升收益、降低换手率、扩大策略容量。

近年来,国内量化市场技术面策略兴起,换手率高问题突出。公募基金则偏好低换手率的基本面策略。深度学习技术的兴起为将技术面模型与基本面模型结合提供了新的实现路径。

报告关键观点:期望通过“基本面因子+深度学习技术面因子”形成的新型组合策略,兼具收益和成本优势。[page::3]

---

2. 基本面多因子模型构建与表现



模型构建


  • 基本面模型围绕盈利能力(ROE、毛利率)、成长性(营业收入同比增长率、资产同比增长率)、估值(市现率倒数CFP)三大类因子。

- 因子均经过行业中性和市值中性处理,因子选择集中于市场公认的有效指标。
  • 股票筛选逻辑:盈利因子选取前25%和50%,成长因子同理,估值选取前70%,最终交集构成投资组合,组合规模中位数约76只。


业绩表现


  • 月度调仓,调仓周期20个交易日,交易成本千分之三,行业权重与基准一致。

- 图2显示净值明显跑赢中证800指数,超额收益持续稳步累积。
  • 图3显示年化收益率18.12%,超额收益14.07%

- 结论:基本面多因子模型稳定有效,是精选股票的良好工具。[page::4-6]

---

3. 深度学习选股模型的构建与表现



模型结构


  • 7层神经网络,156个输入特征,含传统选股因子、技术面价量指标及行业哑变量。

- 隐藏层节点分布为512-200-200-200-128,输出层3节点对应涨(超额收益)、平、跌分类。
  • 使用softmax函数进行多分类概率输出,模型评分为上涨概率减去下跌概率的差,反映股票预期超额收益的强度。


业绩表现


  • 与基本面模型回测参数一致,滚动训练,半年更新一次参数,采用过去6年的数据。

- 股票持股数量中位数75只。
  • 图4显示净值稳步上升,远超中证800。

- 图5显示年化收益24.7%,超额收益达20.65%。

深度学习模型有效捕获短期价量特征,实现较高超额收益,但换手率较高。[page::6-8]

---

4. 两种模型的组合可能性探讨



相关性与重合度分析


  • 深度学习模型打分与基本面因子相关性均值在-0.05至+0.05之间,近似无关(图7)。

- 选股重合度方面,基本面与深度学习在十分组多头股票的重合率最高仅10.49%,接近随机重合度(约10%)(图8)。
  • 使用基本面因子中性化深度学习模型对选股能力影响不大(图9),进一步说明两者选股逻辑迥异。


组合逻辑


  • 两模型均显著优于基准,且选股角度互补,理论上可以组合提升效果。

- 一种简单组合方法为基于过去120天信息系数(IC)加权两类因子,构建综合因子模型,实现稳定收益(图10、图11)。
  • IC加权模型年化收益达24.62%,超额收益20.69%,表现接近深度学习模型。


结合两类因子进行股票评分,能提升组合收益,但仍存在综合排序可能导致选股未两者因子齐头并进的问题。[page::9-12]

---

5. 增强模型构建及股票筛选方法



设计逻辑


  • 先用基本面模型选出“初选股票池”,范围比一般基本面模型略宽,目标为涵盖足够优质股票(约248只)。

- 再用深度学习模型在初选股票池内评分,选取排名最高的组(常用分三组,选最高组)构成最终组合,约83只股票。
  • 该方法融合基本面中长期选股优势和深度学习短期价量信号优势。

- 参数可根据实际需求调整,兼顾资金容量、交易成本等考虑。

筛选条件示例


  • ROE前40%,GPM前70%,营业收入同比增长率前40%,资产同比增长率前70%,市现率倒数前70%。[page::12-13]


---

6. 实证分析(以中证800为基准)



回测参数


  • 回测周期2011年1月至2021年3月,交易成本分别考虑千分之三和千分之五,20日换仓周期。

- 行业中性,股票池为全A股。
  • 股票权重行业维持基准,行业内市值加权。


关键表现


  • 图13、图14显示,在交易成本千分之三情况下,增强模型年化收益达28.58%,显著优于基本面(18.12%)、深度学习(24.7%)、IC加权模型(24.62%)、基准(3.97%)。

- 通过深度学习将初选股票池分三组验证,评分最高的组年化收益达28.58%,明显高于中间和低分组(图15)。
  • 超额净值和年化超额收益(图16、17)显示增强模型领先所有单一及IC加权模型,且稳定性较好。

- 分年度数据(图18,表4)显示11年中8年增强模型超额收益优于基本面模型,表现持续稳定。
  • 年化换手率8.83倍,显著低于深度学习(10.89倍)和IC加权模型(10.04倍),兼顾收益与交易成本(图19)。


交易成本敏感性


  • 在交易费用提升至千分之五后,增强模型依然优于基本面及其他模型,年化收益达25.22%,超额收益21.00%(图20-23)。

- 换手率相对较低,增强模型交易成本敏感性较弱,具有更强实际应用价值。

---

7. 实证分析(以沪深300为基准)


  • 保持相同参数设置及流程,行业中性。

- 净值曲线(图24)显示增强模型明显优于基准及其他模型。
  • 年化收益27.58%,超额收益22.23%,均显著领先基本面(17.8%/12.74%)和深度学习模型(24%/19.04%)。

- 分年度超额收益(图28)中11年里9年增强模型优于基本面模型。
  • 年换手率仍维持8.83倍,明显低于深度学习(10.89倍)和IC加权模型(10.04倍)(图29)。

- 说明增强模型同样适用不同市场基准,具有良好稳健性。

---

8. 参数敏感性分析 — 深度学习分组数影响


  • 分组数为3、4、5时,组合持股数分别为83、62、50只,年化换手率轻微上升(8.83、9.44、9.80倍)。

- 年化收益率和超额收益略有波动但差别不大(28.58%-27.03%),均优于单一基本面及IC加权模型。
  • 表明分组数变化对最终策略表现影响有限,策略相对稳健。


---

9. 总结与展望


  • 本报告创新提出基于深度学习模型对基本面模型进行增强的两步筛选方法,合理融合两类不同选股逻辑。

- 通过多维实证回测,在双边千分之三和千分之五交易成本条件下,增强模型均显示显著超额收益和较优交易成本控制。
  • 年化换手率约9倍,介于传统基本面和纯深度学习模型之间,适配公募基金等对交易成本及换手率有要求的现实环境。

- 回测区间内,在中证800和沪深300基准均实现超过20%的年化超额收益,且多年度均保持超额收益,展示策略的鲁棒性。
  • 净值及超额净值曲线和年度表现均强于传统多因子和深度学习模型单一策略及因子加权组合策略。

- 未来可进一步探索深度学习模型中输入特征优化、动态分组策略和组合权重调整,以提升策略表现和稳定性。

---

三、图表深度解读


  • 图1(基本面选股三要素):展现盈利、成长、估值三大关键维度构成基本面多因子模型的核心框架。

- 图2-3(基本面净值和年化收益):显示基本面模型从2011至2020年期间收益递增趋势显著,年化超额收益14.07%。
  • 图4-5(深度学习模型净值和收益):深度学习模型能够获得超过20.65%的年化超额收益率,净值线陡峭攀升,体现其优异的预测能力。

- 图6(两模型年化收益比较):对比验证深度学习模型优于基本面模型,均远超基准3.97%。
  • 图7(相关性曲线):清晰显示深度学习因子和各基本面因子间的相关性大多在±0.05内波动,弱相关性支撑模型组合逻辑。

- 图8(选股重合度):多头组重合度不断波动,且长期维持低水平,说明二者选股高度互补。
  • 图9(中性化前后IC):中性化操作对深度学习模型选股能力影响甚微,实质选股逻辑不同。

- 图10-11(IC加权模型表现):模型实现年化超额收益20.69%,年化收益约24.62%,稳健提升。
  • 图12(增强模型选股流程图):清晰展示先用基本面筛选再用深度学习优选的两层筛选框架。

- 图13-14(增强模型净值与年化收益):增强模型净值领先其他所有模型,年化收益28.58%。
  • 图15(分组年化收益率):深度学习分组越高,收益越高,验证深度学习因子提升选股有效性。

- 图16-17(超额净值及超额收益):增强模型具备最强的超额表现。
  • 图18(分年度超额收益):超过70%年份增强模型胜出基本面模型,结果稳定。

- 图19(年化换手率):增强模型换手率明显低于深度学习和IC加权,控制交易成本优势明显。
  • 图20-23(交易费率为千分之五):增强模型仍维持最优净值和年化收益,说明其交易成本弹性强。

- 图24-27(沪深300基准下表现):稳健跑赢基本面和深度学习单模型,年化超额收益22.23%。
  • 图28-29(沪深300分年度超额和换手率):9年胜出基本面模型,换手率控制良好。

- 表1-5(因子与分组表现):详细描述基本面选股因子、深度学习网络结构、筛选条件、年度表现及分组敏感性,数据充分支持论点。

---

四、估值分析


  • 本报告主要聚焦深度学习与基本面选股模型构建和回测表现,未涉及企业估值具体计算。

- 选股模型收益作为策略指标,而非直接对上市公司做估值。
  • 使用IC(信息系数)加权体现因子权重动态调整的思想,间接反映因子预测能力。

- 深度学习模型属于预测模型,基于多层神经网络对未来收益概率分布进行估计,结合softmax输出概率分类,因此使用概率差异作为打分。

---

五、风险因素评估


  1. 模型有效性风险:选股模型非100%有效,可能存在样本外失效,尤其在市场结构变化和流动性紧缩期间表现波动。

2. 市场结构及交易行为变化:市场中对类似策略的采用增多会引发拥挤效应,侵蚀超额收益。
  1. 模型过拟合风险:深度学习模型虽强大,但存在过拟合风险,需定期验证和更新。

4. 交易成本变化风险:尽管增强模型换手率较低,但极端交易成本或流动性风险仍可能影响收益。
  1. 数据质量与频率风险:基本面因子低频且滞后,技术面因子高频,二者融合可能受不同数据噪声影响。

6. 合规与交易限制风险:特别是公募基金存在合规限制,过于频繁交易可能面临监管限制。

报告未详述缓解措施,但通过低换手率及滚动更新等机制,体现了部分风险控制思路。[page::0,23]

---

六、批判性视角与细微差别


  • 增强模型优势明显,但年化换手率近9倍,在公募基金中仍属中高频,需要关注实际执行中的合规与交易成本问题。

- 深度学习模型虽提升选股能力,但黑箱特性和解释性不足,是深度学习策略常见限制。
  • 报告中基本面初选池扩大准入门槛,易提高组合多样性,但实际资金规模和市场容量能否支持仍需实践验证。

- IC加权模型表现虽优,但未融合深层筛选逻辑,表现略逊于增强模型,提醒模型融合策略设计的重要性和复杂度。
  • 回测期间市场风格多变,模型性能能否延续到不同市场环境尚需持续跟踪。

- 报告假设交易成本为千分之三或五,未考虑滑点及大资金冲击风险,可能导致实际成绩有偏差。
  • 报告中较少涉及风险调整收益指标(如最大回撤、Alpha、Beta等),如增加相关指标可提升策略风险收益比的完整性分析。


---

七、结论性综合



本报告详细构建并评测了基于深度学习增强的基本面因子选股模型,提出了一种两层筛选方法,先以经典基本面因子模型筛选股票池,再利用深度学习模型进行次级筛选。回测结果清晰展示:
  • 增强模型在2011-2021年期间年化超额收益远超单一基本面模型和深度学习模型,基于中证800年化超额收益达24.29%,基于沪深300为22.23%。

- 换手率适中(约9倍),相较深度学习模型和IC加权模型更低,有助于控制交易成本风险。
  • 增强模型策略在高交易费用环境(双边千分之五)仍具吸引力,显示较强鲁棒性。

- 图表如图13至图29系统展示了净值及超额收益曲线、各模型收益对比、换手率数据和年度表现,进一步佐证结论。
  • 低相关性及重合度分析(图7-9)支持两模型组合的理论基础,深度学习模型补充了短期走势信号,有效增强了传统基本面选股。

- 实证分析覆盖多参数敏感性验证,说明该方案的稳定性与适用性较强。

综上,报告展示的增强模型为量化投资领域融合基本面与技术面方法,利用深度学习技术提升股票精选能力的有力示范,兼顾收益和交易成本,适合资金规模较大且对换手率有控制需求的机构投资者参考与应用。

[page::0-23]

---

本分析严格基于报告内容,完整客观复现原文数据、方法论与结论,同时结合金融研究报告分析要求对图表和数据予以细致解读。

报告