`

ETF 组合构建再优化

创建于 更新于

摘要

本报告基于多维度指标构建ETF组合,通过K-Means模型对市场上259个A股指数聚类,选出35只代表性ETF指数,构建组合。核心策略以盈利、动量、分析师预期三大类因子评价指数得分,月度调仓,回测显示组合收益显著优于沪深300指数且控制行业偏离有助于风险控制。此外,报告分析了Wind偏股基金指数的优秀表现及其难以复制的原因,并用Lasso回归模型拟合ETF组合模拟偏股基金指数,验证拟合效果良好,支持ETF策略在基金指数复制中的应用 [page::0][page::4][page::5][page::8][page::14]。

速读内容


代表性ETF选取及聚类方法 [page::3][page::4]

  • 全市场259个A股指数剔除沪港深与QDII后,采用K-Means聚类算法设定k=35,结合基金规模和成立时间筛选代表性ETF。

- 表1列示35只代表性ETF覆盖主要行业及主题,涵盖宽基、金融地产、消费、医疗、周期、先进制造、科技等细分领域。

指数组合构建与回测表现 [page::4][page::5]


  • 指数组合以盈利(单季度ROE、净利润同比增长率)、动量(过去1月涨跌幅、夏普比率)、分析师预期(FY2同比FY1净利润预测)三类因子等权加权打分。


| 指标 | 聚类后指数组合 | 原指数组合 | 沪深300 |
|----------------|----------------|------------|----------|
| 总收益率 | 30.87% | -1.75% | -7.28% |
| 年化收益率 | 8.56% | -0.54% | -2.28% |
| 年化波动率 | 24.01% | 22.15% | 19.94% |
| 最大回撤 | -36.93% | -36.12% | -39.59% |
| 年化夏普比率 | 0.46 | 0.09 | -0.02 |
  • 回测期间(2020/1/1起)策略超额收益显著,最大回撤低于沪深300,风险调整收益提升明显。


控制行业偏离的组合优化效果 [page::6][page::7]



| 行业偏离度(%) | 3 | 5 | 8 | 10 | 15 | 沪深300 |
|-----------------|-------|-------|-------|-------|-------|----------|
| 总收益率 | 28.53%| 26.08%| 19.17%| 19.84%| 21.71%| -7.28% |
| 年化收益率 | 7.96% | 7.33% | 5.50% | 5.68% | 6.18% | -2.28% |
| 年化波动率 | 24.60%| 24.69%| 24.74%| 24.90%| 25.23%| 19.94% |
| 最大回撤 | -36.66%| -37.03%| -37.58%| -37.65%| -35.24%| -39.59%|
| 年化夏普比率 | 0.43 | 0.41 | 0.34 | 0.35 | 0.36 | -0.02 |
  • 设置3%行业最大偏离度时,组合表现最佳,总收益率和风险调整收益较优,最大回撤较沪深300小。


Wind偏股基金指数表现与特点 [page::8][page::9][page::10]



| 指数 | 总收益率 | 年化收益率 | 年化波动率 | 最大回撤 | 年化夏普比率 |
|-------------------|-----------|------------|------------|----------|--------------|
| Wind偏股基金指数 | 895.18% | 13.79% | 21.66% | -56.63% | 0.71 |
| 沪深300 | 292.55% | 7.99% | 26.09% | -72.30% | 0.43 |
| 中证500 | 509.68% | 10.70% | 29.56% | -72.42% | 0.49 |
| 中证1000 | 561.40% | 11.20% | 30.64% | -72.51% | 0.50 |
  • Wind指数表现优于主要宽基指数,且最大回撤和波动率较低,风险收益指标更优。


Wind指数难以复现原因分析 [page::11][page::12]



  • 等权重加权导致基金表现高估,规模较小基金业绩更佳且反向规模效应明显。

- 指数采用每日等权再平衡策略,隐含低买高卖交易优势。
  • A/C份额未合并,C份额加权重复计算,导致权重虚高。


量化组合与Wind偏股基金指数业绩对比及模拟 [page::13][page::14]



| 指标 | 控行业偏离组合 | 未控行业偏离组合 | Wind偏股基金指数 |
|----------------|----------------|------------------|------------------|
| 总收益率 | 30.96% | 30.87% | 28.35% |
| 年化收益率 | 8.58% | 8.56% | 7.91% |
| 年化波动率 | 24.49% | 24.01% | 19.43% |
| 最大回撤 | -36.56% | -36.93% | -30.19% |
| 年化夏普比率 | 0.46 | 0.46 | 0.49 |
  • ETF组合虽能小幅跑赢Wind偏股基金指数,但风险指标表现略逊色。

- 使用Lasso回归基于1260日滚动窗口拟合Wind指数收益,正则化参数基于BIC确定,确保系数非负,消减多重共线性。
  • 回测结果显示模拟指数与Wind指数走势高度吻合,体现ETF组合在复现基金指数上的有效性。


2023年3月回归系数示例 [page::15]


| 指数代码 | 指数名称 | 系数 |
|-------------|--------------|-------|
| 000300.SH | 沪深300 | 0.01 |
| 000852.SH | 中证1000 | 0.30 |
| 000688.SH | 科创50 | 0.06 |
| 399330.SZ | 深证100 | 0.30 |
| 399987.SZ | 中证酒 | 0.04 |
| 931151.CSI | 光伏产业 | 0.06 |
  • 显示回归模型选取的主要ETF及其权重,反映Wind偏股基金指数的关键行业暴露结构。


深度阅读

ETF组合构建再优化——详尽分析报告



---

一、元数据与报告概览


  • 报告标题:《ETF组合构建再优化》

- 作者:证券分析师 宋施怡
  • 发布机构:申万宏源证券研究所

- 发布日期:2023年6月19日
  • 研究主题:ETF组合构建方法及优化,特别探讨了基于多维度指标的ETF聚类和组合构建,以及与Wind偏股混合型基金指数的比较分析。

- 核心论点
- 通过K-Means聚类模型筛选出市场上具有代表性的35只ETF。
- 基于指标打分体系,等权选取得分最高的10只ETF组成组合,实现收益与风险的优化。
- 行业偏离度控制在3%以内,可平衡组合收益和风险,防止过度集中。
- Wind偏股混合型基金指数表现优异但难以复制,原因在于其指数构建方法特点。
- ETF组合能在一定程度上小幅跑赢Wind偏股基金指数,但在风险调整收益上表现欠佳。
  • 目标:提供一种有效的ETF组合构建及优化方案,既实现超额收益,又合理控制行业配置偏离,提升投资组合的风险收益表现。


---

二、逐节深度解读



1. 如何获取代表性ETF?



1.1 采用K-Means模型对ETF聚类



报告指出,截至2023年6月14日,A股市场拥有737只股票ETF,总规模约1.46万亿元。鉴于市场上ETF数量众多且存在同质化现象(多只ETF对应同一行业/主题指数),采取有效聚类方法非常关键。传统方法基于CAPM模型剥离超额收益并计算相关系数判断主题相似性,但该方法难以确定相关系数阈值。

申万宏源研究所创新采用基于2019年12月31日至今的月度收益率的K-Means聚类算法,将259个A股指数(剔除沪港深、QDII指数)划分为35个类别(k=35)。该非层次聚类依赖最小化样本间的距离(相似性度量)进行赋类,结合ETF基金规模及成立时间甄选出每组的代表ETF。代表性ETF列表具体揭示了覆盖宽基、金融地产、消费、医疗、周期、先进制造和科技等领域的标的,如著名的沪深300ETF(510300.OF),中证500ETF(510500.OF),创业板50ETF等[page::3][page::4]。

1.2 指数组合表现更优的分析



基于2020年1月1日起的回测,结合盈利(单季度ROE、净利润同比增长)、动量(过去一个月涨跌幅、夏普比率)和分析师预期(三年净利润同比)三个因子等权加权计算指数得分体系(详见图1,指标打分体系),报告每月选取得分最高的10只ETF等权构建组合。实证显示:
  • 聚类后的组合总回报达到30.87%,年化收益率8.56%,超出沪深300年化收益10.83%;

- 最大回撤36.93%,低于沪深300的39.59%;
  • 年化夏普比率为0.46,也明显优于沪深300的-0.02。


此外,相较原指数组合,聚类优化后的组合在各项指标普遍表现更优,表明聚类筛选提升了组合有效性(图2与表2详述)[page::4][page::5]。

2. 控制行业偏离,提升组合表现?



报告进一步探讨了将组合的行业权重相对于沪深300基准控制在±3%的约束条件下的优化组合构建,数学模型为凸优化以最大化组合得分(α)的线性组合,限制行业偏离度和个股最大权重(w):

$$
\max \alpha^{T} w \quad \text{s.t.} \quad It \leq H(w - wb) \leq Ih, \quad 0 \leq w \leq h, \quad 1^T w = 1
$$

其中,H为ETF行业分布矩阵,w为组合权重,w
b为基准权重,It 和 Ih为行业偏离度上下界。

针对3%的最大行业偏离限制,2019/12/31至2023/5/31回测结果显示:
  • 历史总收益率28.53%,略低于未限制偏离的30.87%;

- 最大回撤和夏普比率轻微改善(最大回撤-36.66% < -36.93%,夏普比率0.43 vs 0.46);
  • 行业偏离度限制显著降低了行业集中风险,尽管牺牲部分收益但提高了组合的稳健性。


报告对比多种行业偏离度(3%、5%、8%、10%、15%)发现3%为最佳折中点(见表4),进一步体现风险收益权衡[page::5][page::6][page::7]。

2023年6月的具体ETF配置名单(表5)反映了组合广泛涵盖医疗、科技、消费、新能源等热点产业,且权重分布合理,最高权重不超过20%[page::7]。

3.Wind偏股基金指数的难以复制性与优势



3.1 编制方案与样本



Wind偏股混合型基金指数是市场重要的万得基金投资类型指数之一。基金类型定义基于权益类资产配置比例,样本包括所有符合规则的偏股混合基金,截至2023年6月15日累计3710只基金(含A、C份额分别计入),指数基点始于2003年12月31日,采用成份基金等权重计算复权净值(公式详见文本),考虑分红再投资。

3.2 优于宽基指数的业绩表现



Wind偏股基金指数自2005年至2023年06月15日表现卓越:
  • 累计收益895.18%,年化13.79%;

- 最大回撤56.63%,低于沪深300等宽基指数近72%的最大回撤;
  • 年化夏普比率0.71,明显优于沪深300的0.43及中证500/1000;


图4与表6清晰展示指数长期稳健的优势表现,表7进一步支持其在偏股基金中的排名稳定,主要维持在45-55分位之间,自2021年起位于45分位左右,体现其具有代表性和相对优势[page::7][page::8][page::9][page::10]。

3.3 与其他股票基金指数的对比



相比中证股票基金指数、中证主动股票基金指数和中证偏股基金指数,Wind偏股基金指数同样展现出业绩领先地位:
  • 累计收益101.54%,年化4.81%,较其他指数高出约1-2个百分点;

- 最大回撤及夏普比率均优于对手(图5和表8)。

说明Wind指数不仅在绝对收益上表现优秀,且在风险调整后维持较为高效的投资表现[page::10][page::11]。

3.4 难以复制的原因



报告细致解析Wind偏股基金指数复制难点:
  • 成分基金规模普遍较小(70%集中在0-5亿元),存在规模反向效应,即小规模基金往往业绩更佳,导致指数等权加权高估整体基金表现(图6);

- 指数实现等权重每日复权净值再平衡,等同于每日“低买高卖”,这在实际交易难以复制;
  • A/C份额未合并计算,C份额重复计入,导致指数成份基金权重出现放大;


上述三点从规模结构、权重调整机制和数据合并角度说明了指数表现优异但复制成本和技术门槛高[page::11][page::12]。

4. ETF组合能否跑赢Wind偏股基金指数?



4.1 基金行业配置及市场判断



通过季报持仓数据统计,2023Q1 Wind偏股基金偏重食品饮料(19.01%)、电力设备(13.32%)、医药生物(11.65%)。2023Q1较上一季加仓较多行业为计算机、食品饮料、通信,减仓则以电力设备、银行和军工为主(图8)。显示基金行业配置与市场行情及投资经理判断高度相关,行业变动反映策略偏好与风险管理[page::12][page::13]。

4.2 行业偏离后指数组合能否超越Wind指数?



参考行业加权和限制方案,在基于季度季报数据并延迟1个月采用行业权重滞后方法的回测中:
  • 2019/12/31至2023/5/31,控制行业偏离(3%)的ETF组合累计收益30.96%,稍好于未限制的30.87%和Wind指数28.35%;

- 年化收益率分别为8.58%、8.56%、7.91%;
  • 风险指标方面,ETF组合波动性更高,最大回撤更大,夏普比率略低于Wind指数(图9、表9);


这一结果表明,在多因子量化及行业控制下,ETF组合理论上可以略跑赢Wind偏股基金指数的收益,但风险调整后的表现仍有不足,说明后者风险管理、组合稳定性略胜一筹[page::13]。

4.3 模拟Wind指数的Lasso回归方法



为更精准复制Wind偏股基金指数,报告采用Lasso回归模型进行多因子组合系数挖掘:
  • 以Wind偏股基金指数的日收益率作为因变量,35个代表性ETF对应指数的日收益率为自变量;

- 限制系数非负,避免卖空;
  • 运用滚动窗口(120个交易日)和BIC方法确定正则化参数;

- 2020年9月30日开始,考虑科创板指数基日限制;
  • 回测拟合结果显示模拟指数与Wind指数走势高度一致(图10)。


该方法增加了指标间选择与降维,减少共线性影响,是风险控制和拟合效果兼顾的数学工具[page::14][page::15]。

2023年3月31日的系数显示沪深300占比极低(0.01),中证1000和深证100贡献最大(均为0.30),体现规模和风格的匹配度[page::15]。

---

三、图表深度解读



图1:指标打分体系


  • 展示了ETF指数的多维度评分机制,三个一级指标:盈利、动量、分析师预期,各占总分1/3;

- 盈利包含单季度ROE和净利润同比增长率(各1/6),动量含过去一个月涨跌幅和夏普比率(各1/6),分析师预期用未来两年净利润同比。
  • 该体系平衡短期价格动量与基本面成长预期,确保选出综合表现优异的指数[page::4]。


图2:聚类后的指数组合表现对比


  • 蓝线(聚类后组合)显著跑赢橙线(原指数组合)和绿线(沪深300),表现更稳健;

- 2020年至2023年间走势显示聚类选出的ETF组合捕捉市场机会更积极,回撤幅度相对更小,年化夏普比率支持其风险调整收益的优越性[page::5]。

图3:行业偏离控制后组合表现


  • 蓝色线(行业偏离控制组合)略低于橙色线(未控制组合),但相比沪深300表现远超且更稳定;

- 说明行业约束虽带来收益微降,却能够有效控制组合风险敞口,提高组合的风险管理能力[page::6]。

图4:Wind偏股基金指数与主要宽基指数历史业绩


  • 蓝线(Wind偏股基金指数)长期明显跑赢沪深300、 中证500、 中证1000;

- 证明Wind指数稳定的中长期超额收益,最大回撤明显小于主要宽基指数,夏普比率最高[page::9]。

图5:Wind偏股基金指数与其他股票基金指数对比


  • Wind指数持续领先其他股票基金指数,展现其在同类基金指数中的优越表现和稳健性。

- 说明Wind偏股指数在多维度组合效率及风控上的优势[page::10]。

图6与图7:基金规模及份额分类


  • 绝大多数成份基金规模集中在0-5亿元内,规模较小;

- A份额与C份额数量接近,但C份额未合并导致计算偏差,助长了复制困难。
  • 这表明基金小规模优势在指数表现中被放大且难以复制[page::12]。


图8:Wind偏股基金指数历史行业配置变化


  • 各行业权重随时间变动明显,食品饮料、电力设备、医药生物长期占比较大;

- 反映基金经理对市场变化的动态调整策略;
  • 行业配置对指数收益影响重要,是模拟策略时不可忽视因素[page::12]。


图9:控制行业偏离后的指数组合与Wind指数对比


  • ETF组合(蓝、橙线)虽表现略好于Wind指数(绿线)收益率,但波动率和最大回撤也明显更大;

- 风险调整后,Wind指数仍稍占优势;
  • 表明基于限制行业偏离度的ETF策略存在改进空间,但基本能模拟基金收益路径[page::13]。


图10:用ETF指数模拟Wind偏股基金指数走势


  • 模拟指数蓝线与实际Wind指数橙线走向高度重合,拟合良好;

- 证明Lasso回归方法有效捕捉到Wind偏股基金指数的核心收益因子及权重分布;
  • 为ETF复制基金指数策略提供理论基础[page::14]。


---

四、估值分析



本报告针对ETF组合构建与比较,未涉及传统股票估值模型如DCF或市盈率估值。核心方法为多因子评分与行业约束的组合优化,及基于历史回报和风险指标的绩效比较。Lasso回归中用到的正则化参数alpha经BIC准则调节,用以防止过拟合。

---

五、风险因素评估



报告末专门列出风险提示:
  • 历史业绩不代表未来,指数表现受宏观经济、市场波动、投资风格转换影响;

- 指数样本股变化可能导致分析结果偏差;
  • 基金表现与管理能力相关,不同基金未来表现难预料;

- 报告不代表投资建议,客户需独立判断投资风险及决策。

这些风险提示体现了研究的审慎性,提醒用户关注模型和市场本身的内在不确定性[page::0][page::15]。

---

六、批判性视角与细微差别


  • 报告高度依赖历史回测,存在未来环境变化导致模型失效风险;

- Wind偏股基金指数的非典型成分加权(等权且含C份额)人为提高表现,可能高估市场实际可复制收益,下游投资者严格复制难度大;
  • 行业偏离限制虽然风险管理有效,但对收益的轻微压制说明存在权衡,实际执行需结合投资者风格;

- 模拟回归基于季度数据滞后一个月,未来构建更频繁调仓或多因子整合可能提升拟合度和收益风险表现;
  • 未披露手续费、换手率与流动性成本等现实交易细节,实际操作风险或高于理论预测;

- Lasso回归结果显示沪深300系数极低,偏离传统大盘核心配置,对大多数投资者具挑战性。

总体而言,报告提供的是一套较为翔实且系统的ETF多因子优化及模拟方案,兼顾收益提升与风险控制,但现实执行时需关注流动性及交易成本等限制。

---

七、结论性综合



本报告对中国A股市场ETF组合构建方法做了全面细致阐述。通过K-Means聚类算法筛选出的35只代表性ETF结合多因子指标打分,实现了优于沪深300等宽基指数的超额收益,并且在行业偏离度控制下组合更趋稳健。报告系统比较了Wind偏股基金指数的业绩优势及其难以被普通投资者复制的原因—尤其是其规模分布、等权重日复权及份额合并方式的特殊性。

基于季度基金持仓数据,结合行业偏离约束条件,ETF组合可实现轻微超越Wind指数的收益,但风险调整收益仍落后,表明真正全面复制基金指数仍有一定难度。使用Lasso回归进行风险敞口分解,以确定各ETF对Wind指数收益的贡献,取得较好的拟合效果,为投资者提供了量化模拟偏股基金指数的可行路径。

图表系统地支持了上述分析,表明优化聚类后的ETF组合表现优越,行业限制在3%时效果最佳,Wind偏股基金的表现优于其他主流指数和股票基金指数,且其行业持仓反映了基金经理的市场判断。

综上所述,报告立场明确:通过聚类筛选、指标打分和行业约束构建的ETF组合优化策略,能够有效提升主动选基的被动投资工具表现,但复制约束指数等高级指数仍面临历史加权方式、份额重复计入等结构性难题。投资者应权衡收益、风险与交易成本,结合自身偏好审慎部署ETF组合。

---

以上分析依据报告内容及图表数据完成,涵盖了报告的结构、关键论点、数据指标、模型工具及风险提示,期限清晰,保障后续内容溯源需求[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]。

报告