`

提升超额收益: 另类标签和集成学习华泰人工智能系列之二十九

创建于 更新于

摘要

本报告系统探讨了在人工智能选股模型中采用另类标签(信息比率与Calmar比率)相较于传统收益率标签的优势,结合全A股及指数成分股的多训练期长度测试表明,另类标签在超额收益、信息比率和Calmar比率表现更优,且通过多模型集成能进一步提升选股稳定性和收益表现,因子重要性分析揭示因子权重差异,提供量化选股模型优化路径。[pidx::0][pidx::6][pidx::11][pidx::32]

速读内容

  • 采用信息比率和Calmar比率作为另类标签,较传统收益率标签,能够更全面反映股票收益的波动和回撤信息,从而提升选股模型的超额收益和信息比率[pidx::0][pidx::5]。

- 在全A股测试中,另类标签构建模型年化超额收益胜率约90%,表现显著优于收益率标签,在中证500和中证800指数成分股中,优势主要体现在超额收益维度,胜率58%-76%之间[pidx::11][pidx::16][pidx::21]。
  • 多训练期长度(6至72个月共67种)测试策略,有效增加结果差异性,增强结论可靠性。训练期长度变化为模型提供了丰富子模型,便于后续利用集成学习稀释单模型风险[pidx::6][pidx::8]。

- 图表1和图表2展示用于多训练期和多标签集成的测试流程及方法,集成包含等权、历史IC加权和历史因子收益率加权三种方法[pidx::6][pidx::7]。
  • 因子重要性分析(图表37-39)显示,另类标签训练模型中动量反转、波动率和换手率等量价因子重要性下降,但财务质量与一致预期因子权重提升,体现不同标签对因子权重的调节作用[pidx::26]。

- 集成学习在全A股及指数成分股内均提升超额收益率、信息比率和Calmar比率表现,集成模型通过“模型分散化”有效规避单一标签模型潜在风险,回测累计收益优于任何单标签模型(见图表42、44、46)[pidx::27][pidx::28][pidx::29][pidx::30][pidx::31].
  • 风险提示:另类标签模型的超额收益最大回撤较大,需谨慎使用,策略可能基于历史经验存在失效风险[pidx::0][pidx::32].

深度阅读

金工研究报告《提升超额收益: 另类标签和集成学习》详尽深度解析



---

一、元数据与报告概览


  • 报告标题: 《提升超额收益: 另类标签和集成学习》

- 发布机构: 华泰证券研究所,金工研究组
  • 发布时间: 2020年3月19日

- 主要作者及联系方式: 林晓明、陈烨、李子钰等研究员
  • 研究主题: 探讨在人工智能(AI)选股模型构建中,使用传统收益率标签之外的“另类标签”(信息比率、Calmar 比率)对模型性能的提升效果,同时研究多种标签模型的集成学习方法对超额收益的改善。


核心论点总结:
  • 另类标签较传统收益率标签包含更多信息(除价格起止点收益外,涵盖波动与回撤信息);

- 在全市场(全A股)中,使用另类标签训练出的AI选股模型超额收益率和信息比率显著优于传统模型,在指数成分股内优势则较小;
  • 多种模型的集成学习可以充分发挥各标签模型优点,稳定提升选股表现,降低单一模型风险;

- 警示另类标签模型在投资回撤方面表现波动较大,应用需谨慎。

报告充分结合机器学习技术、量化投资实际验证和统计学合理性,展示了另类标签在AI选股中的可行性和优势。[pidx::0][pidx::4][pidx::32]

---

二、章节逐一深度解读



2.1 引言与研究导读



介绍AI选股中“标签”定义的重要性,阐述本文聚焦三方面:
  • 人工智能选股中能够构造的另类标签及其理论基础;

- 另类标签模型在不同股票池中的实证表现;
  • 利用集成学习综合多标签模型提升获益的可行策略。


此部分为全文奠基,明确了研究的问题意识和整体框架。[pidx::4]

2.2 另类标签的构造方法及合理性分析


  • 传统收益率标签定义: 多因子模型通常以未来一段时间的收益率作为预测目标;

- 另类标签定义: 选股模型中使用综合体现收益与风险的指标,如信息比率(超额收益与跟踪误差的比率),Calmar 比率(超额收益与最大回撤的比率)作为标签;

信息比率计算公式:
\[
IR = \frac{\frac{P{t+1}}{Pt} - \frac{B{t+1}}{Bt}}{\sigma}
\]

Calmar 比率计算公式:
\[
Calmar = \frac{\frac{P{t+1}}{Pt} - \frac{B{t+1}}{Bt}}{MaxDD}
\]
  • 合理性阐释:

1. 另类标签包含股票区间内的波动与回撤信息,信息更丰富;
2. 标签如同指标,过度使用传统收益率标签可能导致交易拥挤,使用另类标签有潜在开辟“蓝海”效应;
3. 国内外已有机器学习和强化学习研究采用类似另类标签,具备研究基础。

公式、概念及应用背景解释详实,体现作者对量化选股模型标签优化的深入思考。[pidx::5] [pidx::6]

2.3 多训练期长度下的模型测试与集成学习方法


  • 多训练期长度实验设计: 训练期长度从6个月至72个月,共67组情形,统计各标签训练模型的表现分布和稳定性,避免单次测试偶然性,提升结论信度,如图表1所示,系统化对比模型表现。

- 模型集成设计:
- 将各训练期、各标签构建的子模型预测结果作为单因子;
- 采用三种因子合成方法:等权集成、历史IC加权、历史因子收益率加权,以期充分整合不同模型特长,减少风险。

图表2清晰展示此集成框架,结合实际应用增强模型表现的实践可操作性深刻有效。[pidx::6][pidx::7]

2.4 另类标签测试流程及技术实现细节



采用CatBoost机器学习模型(速度快,效果近似XGBoost),具体数据处理流程:
  • 多股票池:全A股、中证500、中证800,剔除ST、停牌、新上市股票,确保样本质量;

- 因子池包括82个多维度选股因子,覆盖价值、成长、财务质量、市值等系列;
  • 统一去极值、中位数标准化及行业+市值中性化,保证样本特征统一分布和行业市值匹配;

- 标签数据分别为收益率、信息比率及Calmar比率完成极值处理和标准化;
  • 应用训练集/验证集划分及EarlyStopping策略,高度防止过拟合。

- 基于模型输出的预测结果,应用行业市值中性组合优化模型,最大化预测值构造组合,严格控制个股权重偏离。

完整严谨的流程保证了结果科学可靠性,图表3、4辅助理解流程步骤的连贯和整体性。[pidx::8][pidx::9]

---

三、图表深度解析



3.1 训练期长度多样化测试流程(图表1)


  • 展示了基于不同训练期(月)长度从6至72个月的标签数据训练不同模型的对比框架;

- 该多维测试有效避免单一训练期带来的结果偏差,提升统计显著性。

3.2 模型集成方案示意(图表2)


  • 输入包括三种标签、多个训练期模型预测结果;

- 集成结合等权、历史IC和因子收益率权重加权三种方式;
  • 提供了标签和训练期维度上的模型多样化集成策略。


3.3 标签分布与相关性(图表7、8)


  • 以全A股为例,信息比率与收益率相关系数高达0.95,Calmar比率为0.89;

- Calmar比率标签分布更偏离,显示其与传统收益率标签存在显著差异,有力支持其为另类标签的合理性。

3.4 各标签模型回测指标对比(图表9~16,19~26,29~36)


  • 年化超额收益率:另类标签(信息比率、Calmar比率)训练模型在绝大多数训练期均优于收益率标签,胜率高达90%以上(全A股)。

- 信息比率和Calmar比率:另类标签训练模型整体表现提升,表示这类标签能更好地率化风险调整收益。
  • 最大回撤:另类标签模型普遍回撤较大,显示风险管理方面的弱点。

- 训练期长度影响:短训练期下另类标签模型表现波动较大,需较长历史数据保证稳定输出。

上述图表通过横向全维度对比展示了另类标签对模型提升的多维度印证,细节数据充分体现其显著统计学优势。

3.5 因子重要性分析(图表37~39)


  • 另类标签模型中因子重要性结构发生明显变化:

- 动量反转、波动率、换手率等大量价因子权重下降;
- 财务质量和一致预期因子权重上升。
  • 表明另类标签模型在风险调整能力和基本面偏好上的不同侧重,为模型优化提供因子选择新思路。


3.6 集成学习模型回测效果(图表41~46)


  • 三类集成模型(等权、IC加权、因子收益率加权)均显著超越单一标签模型,

- 在全A股、中证500、中证800三大股票池均表现一致;
  • 累计超额收益曲线稳定上扬,证实集成学习有效利用多角度信息,实现优化;

- 优秀的风险调整表现(信息比率、Calmar比率)说明集成模型不仅提升收益,也有助于控制风险。

整体,图表展示对模型实验和验证的严谨,以及对交易实操指导的强烈应用指向。[pidx::11-31]

---

四、估值分析



本报告未涉及具体公司或股票的估值分析,主要聚焦于人工智能选股模型的构建及性能优化,故无传统估值方法(DCF、PE等)的讨论。

---

五、风险因素评估



作者特别提示:
  • 所有基于历史数据训练的AI模型存在未来失效风险,尤其是在市场环境剧烈变化时表现不确定;

- 另类标签模型超额收益虽高,但最大回撤表现不理想,风险更大,实际应用需谨慎;
  • 标签选择和集成方法虽优于单一模型,但模型复杂度提升带来解释力下降和运行维护成本增高;

- 过度依赖某一标签可能导致交易拥挤风险,需定期检验模型稳定性。

报告未详细给出缓解策略,但通过集成学习方法在一定程度上降低单一模型风险,提示保持多元化策略的重要性。[pidx::0][pidx::32]

---

六、批判性视角与细微差别


  • 数据偏倚与时间依赖性: 训练期长度对模型表现影响显著,说明模型结果高度依赖历史市场环境,对快速变化的市场适应能力仍需观察。

- 另类标签回撤较大: 在风险指标最大回撤上的表现明显落后,表明虽然收益率等指标得以提升,但风险控制尚需改进,该点在论文中也多次指出。
  • 标签相关性较高: 虽然另类标签被称为“另类”,但与收益率标签相关性仍较强,尚未突破更为根本的标签创新。

- 模型透明度问题: 集成学习和提高因子数量带来模型复杂性增加,投资者和管理者对模型的可解释性下降,可能影响实际采纳。
  • 理论与实践脱节风险: 指标和标签设计理论合理,但实际策略面临的交易成本、市场冲击等并未纳入此次回测分析。


总结报告虽然偏向正面展示成绩,但上述潜在不足在模型落地中值得持续关注。[pidx::12-31][pidx::32]

---

七、结论性综合



华泰证券金工研究团队通过全面实验与统计分析,证实使用信息比率和Calmar比率两类另类指标作为机器学习选股模型标签,较传统收益率标签明显提升AI模型在全市场范围的超额收益率和风险调整收益(信息比率)。具体结论包括:
  • 另类标签优越性显著: 尤其在全A股范围内,能有效提升回测选股策略的超额收益及信息比率,回撤虽有增加但可接受;

- 集成学习效果突出: 多训练期、多标签模型集成显著稳健提升表现,兼顾收益与风险,有效规避单一模型波动风险;
  • 因子偏好转变: 另类标签模型更依赖财务质量和一致预期等基本面因子,减弱价格动量类因子影响,反映不同的信息解读和风险偏好;

- 实践建议: 虽然收益回测效果优异,但仍需谨慎对待回撤风险,切实评估和调整投资组合,异构集成模型为实操中提升模型鲁棒性提供有效路径。

本报告各类图表系统呈现模型构建流程、训练及测试全过程细节,有力支撑结论科学性和客观性。

---

八、附带重要图表Markdown



图表1 在多种训练集长度下测试





图表2 不同标签训练的模型进行集成





图表8 全A股中三种标签的取值分布直方图





图表9 两种标签构建的中证500增强策略年化超额收益率对比





图表41 六种模型构建的全A选股策略回测指标平均值对比





---

以上详尽解析遵循报告整体结构,涵盖研究动机、方法、核心设计、数据过程、实验结果、理论解释、风险提示和结论梳理,辅以主要图表的细致解读,且所有结论均有明确章节与页面溯源。[pidx::0][pidx::4][pidx::5][pidx::6][pidx::7][pidx::8][pidx::11][pidx::12][pidx::27][pidx::32]

报告