`

锦上添花:机器学习算法助力组合优化——机器学习系列报告之五

创建于 更新于

摘要

报告主要探讨在既定复合因子的基础上,采用机器学习算法(CCD与ADMM)构建多头股票组合,实现指数增强。相较传统线性优化与二次规划,风险预算模型结合机器学习算法在中证500和沪深300增强组合中表现优异,信息比率明显提升,最大回撤及换手率降低,持股更分散稳定。风险预算优化算法克服了大规模股票组合中的参数敏感性和多约束难题,有效提升组合稳定性和风险控制能力 [page::0][page::4][page::13][page::17]

速读内容


线性优化的优势与不足 [page::4][page::5]


  • 线性优化简单、计算效率高,适用于因子组合构建。

- 以EBQC因子构建中证500增强组合,年化超额收益7.28%,信息比率1.38,最大回撤9.14%。
  • 但组合个股集中度较高,平均持仓约64只,换手率达56.5%。


二次规划的有限边际提升 [page::6][page::7][page::8]



  • 假设因子值与预期收益线性关系,将二次规划应用于中证500增强组合测试不同λ参数,信息比峰值仅1.41,提升有限。

- 利用风格因子协方差矩阵替代历史收益估计协方差,信息比提升到最高1.49,但波动和最大回撤增大且持仓特征无明显变化。
  • 结论:二次规划对收益端提升有限且参数敏感,未显著优化换手率和持仓分散性。


机器学习算法驱动的风险预算模型 [page::9][page::10][page::11][page::12]

  • 借鉴风险预算模型,优化目标为风险贡献与预设风险预算匹配,提升参数稳定性。

- 引入回归坐标下降(CCD)算法通过分量更新并结合投影实现有约束条件下优化。
  • 配合交替方向乘子法(ADMM),处理复杂约束和分解大规模优化为迭代子问题。

- 双算法协同解决了大规模股票组合优化中的效率和约束难题,保证了最优解收敛。

不同优化方法对中证500增强组合表现比较 [page::13][page::14][page::15]





| 优化方式 | 年化收益 | 年化波动 | 夏普比率 | 最大回撤 | 年化超额收益 | 信息比率 | 相对最大回撤 | 平均持仓只数 | 换手率(双边) |
|----------|----------|----------|----------|----------|--------------|----------|--------------|--------------|--------------|
| 线性优化 | 15.2% | 28.5% | 0.64 | -52.2% | 7.0% | 1.54 | -7.7% | 93 | ~48.5% |
| 风险平价 | 11.3% | 29.0% | 0.52 | -61.3% | 3.0% | 0.98 | -6.5% | 395 | 21.2% |
| 风险预算 | 15.8% | 28.8% | 0.65 | -52.5% | 7.0% | 1.80 | -6.4% | 240 | 41.0% |
  • 风险预算模型较线性优化提升信息比率20%以上,最大回撤和换手率都有明显改善。

- 风险平价优化换手率和波动最低,但收益显著不足。
  • 风险预算组合持仓数量适中,风险分散程度更高,且表现更稳定。


不同优化方法对沪深300增强组合表现比较 [page::15][page::16][page::17]





| 优化方式 | 年化收益 | 年化波动 | 夏普比率 | 最大回撤 | 年化超额收益 | 信息比率 | 相对最大回撤 | 平均持仓只数 | 换手率(双边) |
|----------|----------|----------|----------|----------|--------------|----------|--------------|--------------|--------------|
| 线性优化 | 11.3% | 24.2% | 0.56 | -43.1% | 4.6% | 1.49 | -4.4% | 84 | 37.4% |
| 风险平价 | 9.7% | 24.5% | 0.50 | -47.1% | 2.7% | 1.04 | -3.9% | 288 | 16.9% |
| 风险预算 | 11.6% | 24.3% | 0.57 | -43.7% | 4.4% | 1.61 | -3.6% | 77 | 33.0% |
  • 风险预算优化略低于线性优化的超额收益,但提升了信息比率和风险控制能力,最大回撤更低。

- 持仓数量与线性优化接近,而风险分散度更优,具有更优稳定性和风险控制。

量化因子组合优化及机器学习算法具体应用 [page::10][page::11][page::12]

  • 采用风险预算目标函数,结合机器学习算法CCD与ADMM,实现具多约束的组合权重优化。

- CCD算法为循环坐标下降,仅针对单个权重坐标更新,辅以约束投影,逐步收敛权重解。
  • ADMM算法用于分解复杂优化问题,拆分成x更新(无约束风险预算问题)与y更新(约束投影问题),并不断迭代收敛。

- x更新中解决关于权重的非线性方程;y更新通过邻近算子和Dykstra算法实现多约束投影,确保权重满足所有约束条件。
  • 相关算法保障了解的唯一性、稳定性与可操作性,使得风险预算组合优化适用于大规模股票组合。


深度阅读

报告详尽分析:《锦上添花:机器学习算法助力组合优化——机器学习系列报告之五》



---

1. 元数据与报告概览


  • 标题:《锦上添花:机器学习算法助力组合优化——机器学习系列报告之五》

- 作者及联系方式:胡骥聪、周萧潇、刘均伟,光大证券研究所,具体联系方式见报告头部
  • 发布机构:光大证券研究所

- 发布日期:报告页中未明确提及具体日期,但测试数据截止至2019年底,推测发布时间应为2020年左右
  • 主题:基于多因子投资组合优化方法的研究,重点探索机器学习算法在组合优化中的应用,尤其在因子组合构建基础上进行指数增强的实践优化

- 核心论点
- 传统的线性优化和二次规划方法在因子组合构建上存在不足,尤其是忽略个股相关性或敏感参数带来的边际改善有限
- 借鉴资产配置中的风险预算模型,引入机器学习算法(循环坐标下降CCD与交替方向乘子ADMM),解决多约束下的优化难题
- 风险预算优化方法在多头股票组合构建中能够显著提升信息比率,降低最大回撤,换手率更低,持股更分散,从而实现较为稳定且实用的指数增强组合

主旨是通过实证分析比较各种优化方法,强调机器学习算法赋能下的风险预算组合优化效果优异,为基金经理提供了具有实际操作意义的组合优化建议[page::0,4,12,17]。

---

2. 报告逐节深度解读



2.1 引言与主流组合优化方法



关键论点

  • 因子投资领域核心在于有效因子的挖掘和组合权重的优化构建

- 传统构建方式包括:
- 简单排序等权持股:选因子值较高的若干股票,易受风格暴露度影响稳定性不足
- 线性优化(Linear Optimization,LO):以因子值为权重目标函数,用约束条件限制权重,计算高效但忽略了个股相关性且容易形成个股权重集中
- 二次规划(Quadratic Programming,QP):经典均值方差框架,兼顾预期收益与风险(协方差)间的权衡,考虑资产间相关性

逻辑与数据支持

  • 线性优化因仅考虑一次项,优化简洁,计算量小,实现容易。但因为忽视协方差信息,可能会导致个股集中度高。报告通过构建EBQC质量因子驱动的中证500增强组合(约束涵盖行业偏离、市值暴露、单只股票权重上限2%等),实证结果显示该组合年化超额收益7.3%,信息比率1.38,最大回撤9.1%,持仓股票约64只,换手率56.5%,显示权重确实趋于集中[page::4,5]。
  • 二次规划应用现状及瓶颈:

- 将因子值假设与预期收益呈线性关系,融合历史收益计算的协方差矩阵,结果信息比率提升不显著,换手率和持仓均与线性优化相近,边际提升有限
- 用风格因子估计协方差矩阵代替历史收益估计,信息比略升0.05左右,但回撤与波动增大,持仓及换手率无显著变化
- 表明二次规划因参数敏感和计算复杂性,难以带来质的飞跃,其提升受限于协方差的估计波动性及优化结构的适应性

具体数据体现在表2、表3,图2及图3中。表2和图2显示参数λ取不同值下的信息比波动极小,最高为1.41;表3和图3则展示采用风格因子法估计协方差,信息比最大达1.49,但回撤有所增加(见下文统计)[page::6,7,8].

2.2 配置型组合优化与机器学习算法



关键论点

  • 传统风险预算模型(基于风险贡献匹配风险预算)在资产配置中表现优异,因参数稳定性较优,拉格朗日形式优化问题存在唯一解

- 直接应用于股票组合面临两难:资产数目极多(数百至千级),计算效率低;而且多约束条件下优化解存在复杂性,传统数值算法难以快速收敛

机器学习算法介入

  • 采用机器学习领域的循环坐标下降(CCD)交替方向乘子法(ADMM)算法:

- CCD逐个坐标更新问题,配合约束的投影操作(投影函数说明详见附录)
- ADMM算法拆分问题,将复杂约束问题分解为两子问题交替迭代,其中一部分用CCD解算,提高问题求解效率和扩展性
  • 该中复杂优化流程确保在多约束场景下快速收敛并求得满意解,支持规模化多头股票组合风险预算优化


数学表达与操作

  • 风险预算优化目标函数包含风险测度与风险预算对数惩罚项

- 通过参数λ二分法寻找满足权重归一化条件的λ值
  • 具体优化流程与算法迭代步骤详见文本与附录,确保对非负权重、行业暴露等约束透明兼容


该节还对CCD与ADMM算法进行了清晰介绍,特别强调了约束集合投影的重要性及其实现方式,较好说明技术可操作性[page::9,10,11,12,22].

2.3 配置型优化实际投资组合效果



优化方法比较

  • 参与优化方案:

1. 线性优化:最小化负因子值期望收益
2. 风险平价优化:风险预算模型特例,所有资产风险贡献相等
3. 风险预算优化:设定差异化风险贡献预算,提升因子驱动性能

中证500指数增强组合

  • 线性优化:年化超额收益7.0%,信息比1.54,相对最大回撤7.7%,换手率约48.5%

- 风险平价组合:波动较低,换手仅21.2%,但超额收益仅3.0%,信息比下降至0.98,持股极分散(平均395只)
  • 风险预算组合:保持与线性优化相当的收益(7.0%),却在风险管理上明显优于线性组合,信息比提升至1.80,换手率低至41.0%,最大回撤降低至6.4%,持仓数约240只,持股集中度适中且风险分散率高(均值1.68对比线性1.64)


图4、图5展示净值及相对净值表现,风险预算组合净值增长更稳健,回撤控制更优;图6进一步揭示风险分散比率差异,直观支持上述结论[page::13,14,15].

分年度表现(表5)显示风险预算组合每年均跑赢基准,控制波动,除2015年波动较大外,其它年份相对波动稳定,表现持续且稳定。

沪深300指数增强组合

  • 线性优化:年化超额收益4.6%,信息比1.49,最大回撤4.4%,换手37.4%

- 风险平价:收益低(2.7%),但换手率极低(16.9%),稳定性好
  • 风险预算:年化超额收益4.4%,信息比1.61,最大回撤3.6%,换手33.0%,收益略低线性优化但风险控制及稳定性优于之,持仓较集中(77只),风险分散比率略高于线性优化(1.68比1.65)


图7–图9及表6、表7展示了净值走势、相对净值和分散比率数据。综合来看,风险预算组合兼顾收益和风险管理,尤其表现出较好风险控制能力。

---

3. 重要图表深度解读



表1 与图1(线性优化统计及净值表现,page 5)


  • 内容:展示线性优化下EBQC因子中证500增强组合关键指标

- 核心数据:年化超额7.28%,相对波动5.20%,信息比1.38,最大回撤-9.14%
  • 图解:净值曲线中EBQC增强组合整体跑赢中证500基准,权益增长稳定,右轴相对净值稳步提高,说明有超额收益

- 意义:线性优化作为基线模型,表现良好但风险指标仍有提升空间

表2 与图2(基于历史收益估计协方差的二次规划,page 6-7)


  • 内容:不同λ参数对应的优化结果,对比信息比率

- 核心数据:信息比率范围1.33-1.41,最高点1.41仅略高于线性优化1.38
  • 图解:信息比率随λ调整起伏较小,整体差异有限

- 意义:证实传统二次规划基于历史收益协方差未显著优于线性优化

表3 与图3(风格因子估计协方差的二次规划,page 8)


  • 内容:风格因子方法估计协方差后不同λ的表现

- 核心数据:信息比高达1.49,部分参数点甚至超过1.5,回撤增加明显至约9%
  • 图解:信息比普遍优于线性基准,但伴随回撤风险扩展

- 意义:风格因子法改善协方差估计,短期提升组合收益测度,但风险波动加剧

表4 与图4-6(配置型组合优化中证500绩效比较,page 13-14)


  • 核心数据

- 风险预算组合信息比1.80 > 线性1.54 > 风险平价0.98
- 最大回撤最低的为风险预算6.4%,次之线性7.7%,风险平价6.5%
- 换手率风险预算41% < 线性48.5%,风险平价21.2%
- 分散率风险预算1.68 > 线性1.64
  • 图解

- 净值曲线:风险预算优化线明显优于线性和风险平价
- 相对净值:风险预算展现更强稳健超越性
- 分散比率:风险预算优化风险分散优于线性优化
  • 意义:综合指标展现风险预算配置兼顾了收益、风险与流动性,是最优策略推荐


表6 与图7-9(沪深300优化组合绩效,page 15-16)


  • 核心数据

- 风险预算组合信息比1.61 > 线性1.49 > 风险平价1.04
- 最大回撤最小:风险预算3.6% < 线性4.4%,风险平价3.9%
- 换手率风险预算33% < 线性37.4%,风险平价16.9%
- 持仓股票数少,风险预算77只,线性84只,风险平价288只
- 分散比风险预算1.68 > 线性1.65
  • 图解

- 净值表现风险预算优化长期领先
- 分散比率风险预算持续高于线性
  • 意义:虽然股票集中度提升,风险预算优化依然实现更优风险调整表现,风险控制和收益稳定性兼备


---

4. 估值与算法方法解析


  • 线性优化:目标最大化加权复合因子$\alpha$,在约束下易于求解,但忽略协方差信息,导致个股集中风险
  • 二次规划:均值-方差框架最小化组合风险与预期收益权衡,关键在于协方差矩阵准确估计。报告两种估计:


- 以历史收益数据估计协方差,参数λ控制风险规避程度,通过调整λ探究信息比变化
- 使用风格因子交替搭建协方差矩阵($\Sigma=L\Sigma{style}L^T$),更稳定,提升组合性能
  • 风险预算模型:通过等式$wi \partial risk(w)/\partial wi = risk(w)*RBi$,确保每只资产贡献风险预算匹配预设,算法以拉格朗日形式最优化
  • 机器学习算法


- 循环坐标下降(CCD):逐坐标优化子问题,结合约束投影保证理论收敛性,降低高维优化难度
- 交替方向乘子法(ADMM):将复杂目标拆分为子目标,在$x,y$空间交替优化,配合CCD与投影算子提升解算规模和效率
  • 约束处理:通过邻近算子和Dykstra算法处理行业、市值、权重上下限、相对基准约束,实现复杂约束下的优化[page::5-8,9-12,20-22].


---

5. 风险因素评估



报告明确风险提示:
  • 历史数据与模型风险:所有结论基于历史数据和模型假设,不排除模型失效和历史不可重复的风险

- 参数敏感性:二次规划尤其参数敏感,历史协方差估计噪声高,导致优化结果波动,实际应谨慎应用
  • 市场风格变化风险:组合的行业、市值等暴露约束未必适应未来市场风格变动,可能影响收益表现

- 算法稳定性风险:尽管CCD与ADMM算法提升求解效率,但较复杂的多约束非凸问题下仍可能存在局部最优或者收敛问题

报告没有具体给出缓解策略,但通过测试显示风险预算优化在多个指标上均优于传统方法,暗示此方法能降低部分风险影响[page::0,18].

---

6. 审慎视角与细微差别


  • 方法优势与局限

- 机器学习算法确保了大规模多约束环境下的优化可行性,但算法复杂度较高,实际工程实现及数据质量要求较高
- 二次规划的提升有限,实际应重视协方差估计方法与参数选择;风格因子法表现较优,但风险回撤增加值得关注
  • 数据与模型假设一致

- 报告中因子-预期收益线性假设较简单,是否存在非线性关系未探讨
- 投资组合约束多样,约束的合理设置对结果影响极大,报告未深入讨论各约束灵敏度与对比
  • 报告内部一致性

- 结论对风险预算方法明确支持,且实验数据与理论推导一致
- 可注意风险提示页对模型局限体现,显示作者审慎态度

整体报告立场稳健,结论建立在充足数据与算法测试基础上[page::6-8,10-12,17,18].

---

7. 结论性综合



本报告系统梳理并实证比较了基于综合质量因子EBQC的多头股票组合优化方法在中证500与沪深300指数增强场景下的表现:
  • 线性优化作为主流基线方法实现简单,效率高,收益稳健但存在个股集中和忽略协方差的不足

- 二次规划优化尝试融合协方差信息,但基于历史收益的估计波动大且响应有限;采用风格因子估计协方差虽小幅提升信息比,但伴随波动和最大回撤上升,整体边际改善有限
  • 风险预算模型借鉴资产配置模型理论,通过机器学习中CCD和ADMM算法有效解决大量股票、多约束条件下复杂优化问题,提升计算效率与稳定性

- 实证测试表明风险预算组合优化相比线性与风险平价优化,在收益-风险权衡上具有显著优势:
- 中证500增强组合信息比由1.54上升至1.80,最大回撤降低,换手率降低,持股更分散
- 沪深300增强组合信息比由1.49上升至1.61,最大回撤降低,换手率降低,风险分散性提升

图表充分展现了风险预算优化超额收益稳定性更好,波动与回撤受控,持仓及换手率合理,均衡了组合的收益性、稳健性和可操作性。

该方法对传统量化投资因子组合优化是有效的提升方案,特别适合规模化指数增强场景,适合基金经理实际应用。最后,报告谨慎提醒基于历史数据和模型结果存在不确定性风险,投资决策应综合考量风险因素。

---

主要图表引用范例(部分)


  • 图1:线性优化下EBQC中证500增强组合净值走势(page 5)


  • 图2:基于历史收益估计协方差的二次规划信息比(page 7)


  • 图3:基于风格因子估计协方差的二次规划信息比(page 8)


  • 图4、图5、图6:中证500 多种优化组合净值、相对净值及分散比率序列(page 14)




  • 图7、图8、图9:沪深300 多种优化组合净值、相对净值及分散比率序列(page 16)





---

综上所述:



本报告为因子组合优化领域引入了机器学习算法,成功解决多约束配置型组合风险预算问题,实证证明风险预算机器学习组合优于传统线性与简单二次规划,展现较好收益与风险平衡。该研究为指数增强及多因子组合构建提供了富有实践价值的模型构建方法,是量化投资组合优化重要的理论与实务贡献。

[page::0,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22]

报告