`

多因子系列之一:多因子选股体系的思考 | 量化专题报告

创建于 更新于

摘要

本报告从多因子选股系统工程化构建角度出发,深入探讨了多因子体系中风险模型的低估问题、因子测试方法差异、组合优化回测体系建设及多期收益归因模型,提出改进方案并系统化总结多因子选股整体架构和底层数据平台设计,为投资者理解多因子体系细节提供全面视角。[page::0][page::1][page::2][page::3]

速读内容

  • 国盛多因子选股体系架构 [page::0][page::1]

- 体系分为两大数据库(原始数据库与因子数据库)与三大系统(风险模型、Alpha模型、组合管理)
- Alpha模型包含因子挖掘与改进、因子检验与回测、因子配置算法和尾部风险模型四大模块

  • 多因子数据构建与更新要点 [page::1]

- 基础数据需保证可靠性、及时性及可回测性,数据结构分静态表、状态表和流量表,采用不同更新机制
- 因子数据库设计需兼顾可扩展性、访问速度及结构统一性,提升因子存取效率与规范性
  • 风险模型存在的核心问题及改进举措 [page::1][page::2]

- 多因子风险模型低估组合风险实际情况普遍存在,核心原因包括风险模型系统性低估、月中权重和因子暴露变化、策略风险及因子-风险因子不一致等
| 序号 | 原因 | 对组合风险的影响 | 可能的解决方法 |
|------|------------------------------|------------------|-------------------------------|
| 1 | 风险模型系统性的低估风险 | 增加 | 优化风险模型 |
| 2 | 月中股票权重的变化 | 增加 | 影响较小,暂时可忽略 |
| 3 | 月中因子暴露的变化 | 不定 | 必要时进行月中调整 |
| 4 | 残差收益和因子收益的相关性 | 不定 | 根据策略做相应测算 |
| 5 | 策略风险 | 增加 | 基于历史策略风险调整(Qian,2007)|
| 6 | Alpha因子与风险因子不一致 | 增加 | 加入更多因子或对残差Alpha风险惩罚|
  • 因子测试方法详解 [page::2]

- 包含信息系数(IC)、分组测试、因子收益FM检验、回归法,方法各有优劣,需结合具体策略选用
| 方法 | 优势 | 劣势 |
|------------|----------------------------------|--------------------------------------------------------------|
| IC | 计算简便,含义明了 | 仅反映线性相关,忽略非线性 |
| 分组测试 | 反映多头/空头收益及组合表现 | 受市场风险及其他因素影响,中性控制有限 |
| FM检验 | 判断因子时间序列收益显著性 | 受回测窗口影响,无法反映组合表现 |
| 回归法 | 控制风险因子影响,提纯因子表现 | 纯因子组合不可投资,实际应用存在差异 |
  • 组合优化与回测系统构建 [page::3]

- 基于开源框架,集成优化模块,实现策略回测,真实考虑成本和可成交性,增强回测结果贴近实盘
  • 多期收益与风险归因框架 [page::3]

- 多期收益归因需考虑收益的累乘关系及残差与因子收益相关性,采用平滑系数调整
- 风险归因拆分为共同风险和特质风险,主要驱动因素包括组合因子暴露、因子波动率及相关性
| 时点 | 组合收益 | 因子贡献a | 因子贡献b | 残差贡献 |
|------|---------|-----------|-----------|----------|
| t1 | R1 | Fa,1 | Fb,1 | E1 |
| t2 | R2 | Fa,2 | Fb,2 | E2 |
| 总计 | R | Fa | Fb | E |

深度阅读

多因子系列之一:多因子选股体系的思考 —— 深度分析报告



---

一、元数据与报告概览



报告标题: 多因子系列之一:多因子选股体系的思考
作者: 殷明,刘富兵
发布机构: 国盛证券研究所金融工程团队
发布日期: 2019年1月16日
主题: 多因子选股体系的构建、风险模型的改进与因子测试方法
核心论点: 本报告作为多因子系列的开篇,重点探讨传统多因子选股模型中存在的问题,包括风险低估、因子配置、组合优化与回测的结合、因子测试方法的差异以及收益与风险的归因方法。报告提出了通过构建完善且灵活的多因子选股体系和改进风险模型,提高策略的稳定性和准确性的方法论,旨在为投资者提供系统化、工程化的量化选股工具。[page::0][page::1][page::2]

---

二、逐节深度解读



2.1 报告引言与多因子选股体系概述



报告开篇说明了多因子体系的重要性及其细节决定策略成败的观点,提出五大核心问题:
  1. 多因子系统的工程化构建细节

2. 风险模型的准确性和低估风险问题
  1. 组合优化与回测工具的结合

4. 因子测试方法及其差异
  1. 单期与多期收益和风险归因问题


国盛证券构建了完整的多因子选股体系架构,该体系由两大数据库和三大核心系统组成:
  • 两大数据库:原始数据库和因子数据库

- 三大系统:风险模型、Alpha模型(含因子挖掘、检验、配置和尾部风险识别)、组合管理系统(组合优化、组合回测、业绩归因)

这一体系以数据为基础,以多层次子模块支撑策略研发和风险控制,实现了从因子构建到组合管理的全流程覆盖,突显其工程化与系统化特色[page::0][page::1]。

---

2.2 基础数据库与研究平台构建



2.2.1 基础数据的构建注意点:
  • 数据源选择优先指标为可靠性、及时性和可回测性

- 数据结构区分静态表、状态表和流量表,采用相应的更新策略
  • 解决历史数据不可得及数据被修改问题,提高数据存储的逻辑层次和稳定性

- 警惕爬虫等不稳定数据源风险,保证数据质量和一致性

2.2.2 因子数据库设计问题:
  • 数据库设计需保证强扩展性,允许添加新因子时对结构影响最小

- 需优化数据存取速度以满足研究效率需求
  • 要使同类型因子数据逻辑结构相似,确保数据美观和逻辑清晰

- 讨论了因子存储模式及批量计算的技术实现细节

该部分体现了多因子体系工程化建设的基础工程思考,强调数据的正确性、实时性和结构的标准化,为后续因子分析和策略开发奠定坚实基础[page::1]。


---

2.3 风险模型建设与风险估计的挑战



3.1 风险模型建设问题:
  • 尽管市场上已有诸多文档介绍多因子风险模型(如Barra CNE5模型),实际实现时面临众多细节难题

- 直接套用公开参数常导致风险估计不准确
  • 报告强调风险模型每个环节的细致优化和参数调整的重要性,持续改进风险计算方法以避免系统性低估风险


3.2 风险低估及其根源:
报告通过风险归因总结了六大导致实际组合风险超过预设风险的原因,并提出对应的解决方案:

|序号|原因|对组合风险影响|解决方案|
|----|----|--------------|---------|
|1|风险模型系统性低估风险|增加风险|优化模型结构及参数|
|2|月中股票权重变化|增加风险|影响较小,暂时忽略|
|3|月中因子暴露变化|不确定|必要时月中调整|
|4|残差收益与因子收益相关性|不确定|针对具体策略测算|
|5|策略风险|增加风险|基于历史策略风险调整|
|6|Alpha因子与风险因子不一致|增加风险|加入更多因子或对残差Alpha风险惩罚|

上述分析揭示风险模型在估计组合波动率和跟踪误差时存在结构性缺陷,需要在模型优化、因子设计和组合管理层面协同解决,尤其是对残差Alpha风险予以重视,从而提高风险预测的准确性和策略稳定性[page::2]。

---

2.4 因子测试方法框架与方法差异



报告构建了统一的因子测试系统,流程包括因子计算及预处理、测试方法运用和结果分析,确保因子表现科学且可比较。

因子测试步骤:
  1. 因子处理:计算、缺失值处理、去极值、标准化、中性化

2. 测试方法:信息系数(IC/Rank IC)、分组测试(如市值行业分层)、因子收益FM检验、回归法
  1. 结果解读:量化因子表现,辅助判断因子稳定性与有效性


不同方法优劣对比总结如下:

|方法类别|具体方法|优势|劣势|
|--------|--------|----|----|
|信息系数|IC、ICIR、Rank-IC|计算简便,直观体现线性相关|只反映线性,不考虑非线性影响,忽略选股极端表现|
|分组测试|十组测试、市值行业分层打分|真实反映组合收益和波动,辅助时序分析|无法完美中性化,受市场及其他因子干扰|
|因子收益FM检验|检验因子时序收益显著性|辅助时序表现判断|不反映组合内表现,受回测窗口影响|
|回归法|纯因子组合回归|能剥离其他风险因子影响,灵活调整风险暴露|难判定多空来源,纯因子组合不可投资,和实际组合存在差异|

该部分体现出报告对因子测试的严谨态度,强调采用多角度、多方法综合评估因子有效性,兼顾统计显著性、经济含义及实际投资可行性[page::2]。

---

2.5 组合优化与回测系统建设



报告介绍其回测平台,以开源框架为基础,整合了组合优化模块,支持:
  • 基于目标函数及约束条件的组合权重计算

- 结合成本和可成交性约束,模拟更贴合实际的交易执行
  • 支持策略回测和性能分析,提升研究效率和策略实用性


该模块构成了组成因子研究与实际投资执行的桥梁,使得研究成果具备落地能力,且反映了国盛对回测与实际交易联动的重视[page::3]。

---

2.6 业绩归因分析:多期收益与风险归因



多期收益归因:

报告指出多期收益归因前需完成单期收益归因,将因子贡献、残差等指标累乘,否则总收益不会等于各因子和残差收益之和。此外,累乘过程中因出现冗余项,会导致因子收益与残差收益存在相关性,须采用平滑系数或剥离技术以保证归因准确。

示例表格展示了以时间为维度分解组合收益及各因子贡献的方法:

| 时间 | 组合收益 | 因子贡献a | 因子贡献b | 残差贡献|
|-------|----------|-----------|-----------|---------|
| t1 | R1 | Fa,1 | Fb,1 | E1 |
| t2 | R2 | Fa,2 | Fb,2 | E2 |
| 总计 | R | Fa | Fb | E |

风险归因:

组合风险由共同风险与特质风险驱动,三个关键影响因子包括组合因子暴露、因子波动率和因子与组合收益相关性。只有三者同时较大时,因子对组合风险贡献显著。

强调风险归因基于历史数据和统计模型,未来市场变动可能导致模型失效,有必要灵活调整和校正[page::3]。

---

三、图表深度解读



3.1 多因子选股体系结构图(图片1)



多因子选股体系结构

该图呈现国盛量化选股体系的金字塔结构:
  • 底层为原始数据库,包含状态数据、财务、事件及附加信息

- 中间为风险因子库和Alpha因子库,支撑上层系统
  • 上层包括三大核心系统:风险模型(风格因子暴露、收益率计算、协方差矩阵估计)、Alpha模型(因子挖掘、测试、配置、尾部风险识别)、组合管理(优化、回测、归因)


图形直观展示了数据和模型层层递进的关系,强调了体系中数据驱动、因子演进和组合管理的互动机制,反映出整体架构的系统性和模块化,确保策略研发流程的科学性与高效性[page::1]。

---

3.2 组合风险影响因素总结表



| 序号 | 原因 | 对组合风险的影响 | 可能的解决方法 |
|-------|-------------------------|-----------------|-----------------------------------|
| 1 | 风险模型系统性低估风险 | 增加 | 优化模型 |
| 2 | 月中股票权重变化 | 增加 | 影响较小,暂时忽略 |
| 3 | 月中因子暴露变化 | 不定 | 必要时月中调整 |
| 4 | 残差收益与因子收益相关性| 不定 | 针对策略进行测算 |
| 5 | 策略风险 | 增加 | 依据历史策略风险作调整 (Qian, 2007) |
| 6 | Alpha因子与风险因子不一致| 增加 | 增加因子数量,优化风险惩罚 |

该表系统归纳风险模型低估风险的实际原因及对策,帮助投资者理解为何投资组合风险经常高于风险模型的预期,提出针对性的改进方向,具有较强的实用价值[page::2]。

---

3.3 因子测试方法优劣对比表



该表详尽分类并评价了信息系数、分组测试、因子收益检验和回归法的应用优缺点,强调每种方法对因子表现的不同侧重及局限,提示投资者需多角度综合判定因子有效性,避免单一指标带来的偏差,提高因子筛选质量和稳定性[page::2]。

---

3.4 多期收益归因示例表



| 时间 | 组合收益 | 因子贡献a | 因子贡献b | 残差贡献|
|-------|----------|-----------|-----------|---------|
| t1 | R1 | Fa,1 | Fb,1 | E1 |
| t2 | R2 | Fa,2 | Fb,2 | E2 |
| 总计 | R | Fa | Fb | E |

该表展示如何分解多期组合收益和因子贡献,强调归因过程中存在的非线性累积及相关性问题,提示归因分析的复杂性和需采用合适方法处理以获得准确结果[page::3]。

---

四、估值分析



本报告未涉及具体上市公司估值及目标价格,也无传统意义上的估值模型论述。其核心关注点在于多因子体系的构建和风险模型的技术优化,从方法论的角度推动量化选股策略精进,因而无估值部分内容。

---

五、风险因素评估



报告系统识别了多因子风险模型的潜在低估风险,主要包括:
  • 模型结构性缺陷带来的系统性风险低估

- 组合权重和因子暴露在持仓期中的波动影响
  • 残差收益与因子收益关联

- 策略本身的特殊风险
  • Alpha因子维度与传统风险因子维度不对齐


对应风险均可能导致实际波动和跟踪误差超过预期,这些风险因素未被传统风险模型充分覆盖。报告建议通过模型加因子、风险惩罚、策略风险调整等多管齐下的方式缓解,并提出月中调整策略以管控部分时变风险,体现对风险管理的全面考量和动态应对[page::2]。

---

六、批判性视角与细微差别


  • 报告强调多因子体系的完善与细节优化,但对某些风险因素(如策略风险、残差Alpha风险)的量化处理尚存在方法较为依赖历史数据经验,未来面对市场结构变化仍有不确定性。

- 风险模型的低估问题虽被详细分析,但解决方案偏向优化和惩罚,缺少具体模型创新介绍。
  • 因子测试中不同方法存在本质局限,报告建议多方法综合,但在实际操作和因子筛选权重尚需明确指导。

- 多期收益归因的平滑系数解决方法未详述,相关算法复杂性和计算负担需关注。
  • 本报告回避了直接估值和投资建议,更侧重方法论和系统搭建,适用于专业量化研究团队,但对一般投资者参考价值有限。


总的来看,报告扎实系统,但仍需在量化策略执行的稳定性和动态适应性方面进一步突破。

---

七、结论性综合



本报告通过详尽解析多因子选股体系的构建和多因子研究过程中的关键问题,确立了国盛证券自有量化选股体系的结构框架。报告重点强调:
  • 以工程化为导向的数据管理和因子数据库设计,确保系统高效、灵活且扩展性强

- 针对传统风险模型低估风险的问题,提出了多层面归因和相应的优化措施,强调Alpha因子和风险因子的匹配及对残差风险的管理
  • 全面而系统的因子测试体系,覆盖多种检验方法,并阐释其优缺点,建议多维度综合判断因子表现

- 构建基于组合优化与回测紧密结合的研究平台,有效连接策略研发和实盘执行
  • 提出多期收益归因和风险归因方法,深化对收益与风险成因的理解,提升策略评估的准确性


报告利用清晰的图表辅助说明,全方位展现多因子策略研究流程与风险管理策略,体现了较高的专业水准和技术深度。整体来看,国盛证券的多因子选股体系既重视理论基础,又注重工程实现,具备较强的实践指导意义,为量化投资者提供了较为完备的策略构建与风险控制框架。

---

本分析严格基于报告原文及图表内容,引用标注为:
[page::0][page::1][page::2][page::3][page::4]

报告