`

运用少量 ETF 可以复制主动基金的业绩吗?——“学海拾珠”系列之一百五十

创建于 更新于

摘要

本报告通过实证研究美国主动共同基金的业绩分布,提出运用3到5只特定ETF组合可以有效复制大多数主动基金业绩,ETF基准优于传统风险因子,能更真实反映交易成本影响,估计约95%的主动基金未能为投资者创造额外价值。基于FDR方法和多种ETF选择算法,验证了ETF组合作为基金业绩评价基准的可行性,且特定ETF组合优于随机选择,建议关注少量高效ETF组合在绩效复制上的应用 [page::0][page::3][page::12][page::15][page::18][page::19]。

速读内容


ETF作为主动基金业绩的基准新视角 [page::0][page::3]

  • 报告从使用ETF而非传统风险因子作为绩效基准的角度切入,认为ETF收益包含交易成本,更接近现实投资环境。

- 通过FDR方法,估算美国主动基金样本中约95%的基金未能为投资者创造正向价值。
  • ETF组合特别是在3到5只ETF时的组合效果显著,可以复制大部分主动基金业绩。


数据样本与方法论概览 [page::9][page::10][page::11]

  • 使用1980-2019年美国基金数据,剔除AUM低和样本期短的基金,最终分析13,922只基金及约100只ETF。

- 采用多重检验的FDR方法控制假阳性,分辨有投资能力、零Alpha及投资能力匮乏基金。
  • ETF选择方法包括随机选取、基于基金表现的筛选、Lasso回归以及正向逐步选择。


基金能力分布估计结果与ETF数量影响 [page::12][page::13][page::14]


  • 随机选择ETF组合时,超过6只ETF后平均Alpha趋于稳定,水平高于传统风险因子约0.15%。

- 𝑎𝑑𝑗𝑢𝑠𝑡𝑒𝑑-$R^2$ 在约8只ETF组合时与风险因子相当,约87.7%,显示ETF组合具备良好解释力。
  • 基金分类中,投资能力匮乏基金比例由风险因子的41.27%降至约10%,说明ETF基准更现实反映投资能力。

- 最佳ETF数量为3-5只,能最大化零Alpha基金比例,最小化有能力基金比例,优化业绩评价判断。

特定ETF组合选择及绩效分析 [page::15]


| 指标 | 风险因子 | 随机选择 | 基于基金业绩选择 (Ps) |
|----------------|------------|------------|---------------------|
| 平均Alpha (%) | -0.12% | 0.03% | -0.01% |
| adjusted-$R^2$ (%) | 87.72% | 86.43% | 86.15% |
| 有能力基金比例 (%) | 1.18% | 19.02% | 5.73% |
  • 基于基金表现优化选择的ETF组合(如VVU、IJT、SLYV、XLY、XLV)在解释能力和降低有能力基金假阳性方面优于随机选择。

- 估计绝大多数基金(94.27%)未产生正向风险调整收益,验证主动管理普遍难以超越被动。

基于风险因子的ETF选择方法比较 [page::16][page::17][page::18]

  • Lasso选择的ETF组合侧重于解释市场四因子,对ETF数量少但表现次于正向选择方法。

- 正向逐步选择方法通过迭代选择ETF,提升了风险因子的解释力,峰值adjusted-$R^2$达到99.6%,有能力基金比例减少至约11%。
  • 这表明采用引导机制选择的ETF组合能够有效复制风险因子表现,提供了更优的基金业绩评估基准。


研究总结与风险提示 [page::18][page::19]

  • ETF作为基准更适合反映市场真实交易成本影响,随机及定向选择数只ETF就可较好复制主动基金表现。

- 研究确认绝大多数主动基金不能为投资者带来超额收益,倡导对主动基金的绩效判断应使用ETF等实际可投资资产组合为参考。
  • 结果基于历史数据和海外市场,具有局限性,不构成具体投资建议。


深度阅读

分析报告详尽解读——《运用少量 ETF 可以复制主动基金的业绩吗?——“学海拾珠”系列之一百五十》



---

1. 元数据与报告概览


  • 报告标题: 《运用少量 ETF 可以复制主动基金的业绩吗?——“学海拾珠”系列之一百五十》

- 作者及联系方式: 分析师严炜(执业证书号:S0010520070001,邮箱:yanjw@hazq.com)、钱静闲(执业证书号:S0010522090002,邮箱:qianjx@hazq.com)
  • 发布机构: 华安证券研究所

- 发布时间: 2023年7月19日
  • 研究主题: 采用少量ETF组合是否能有效复制美国主动管理基金的业绩表现,并评估ETF作为主动基金业绩基准的有效性及风险因子基准的不足。


核心论点总结:

报告研究了采用少量交易型开放式指数基金(ETF)组合来复制美国主动共同基金的业绩表现,基于Barras等人(2010)提出的False Discovery Rate(FDR)方法,发现在使用ETF作为基准时,更能准确衡量主动基金的Alpha表现,且3-5个ETF组合能够很好地复制绝大多数主动基金的业绩,揭示了约95%的主动管理基金未能为投资者创造净价值。同时,报告指出传统风险因子模型未考虑交易成本,而ETF收益表现中已包含交易成本,因此ETF基准更具投资实际。此研究对国内市场具有启发意义,尤其在ETF快速扩展的背景下,通过少量ETF业绩复刻筛选出具备真实投资能力的主动权益基金[page::0,3,11,12,15,18]。

---

2. 逐节深度解读



2.1 引言(第1章)


  • 关键内容: 报告摒弃传统风险因子基准,转而用ETF组合来研究主动基金业绩,FTD方法控制运气带来的假阳性识别风险,使用2005-2019年美国市场数据探讨“基金是否具备真投资能力”问题。

- 支撑理由: 传统风险因子未计入交易成本,故估计Alpha偏低。ETF作为真实投资标的,收益含交易成本,更贴近期望收益。历史数据和以前文献(如Barras等2010)显示约95%主动基金无法创造超额价值。
  • 方法基础: 样本基金被分为投资能力匮乏、零Alpha和有能力三类,Alpha用来衡量是否创造超额经济收益,FDR方法防控假阳性导致的失真[page::3,4,5]。


2.2 研究方法(第2章)


  • 核心内容: 构建以ETF收益为解释变量的线性模型$\gamma{i,t} = \alphai + \betai ETFt + \varepsilon{i,t}$,其中$\gamma{i,t}$表示基金超额收益,强调样本中资金为零Alpha时p值应均匀分布。采用FDR估计整体样本中有技能基金的真实比例,控制因误判带来虚假正Alpha。

- ETF选择方法:
- 随机选择ETF,重复500次取均值,测试不同ETF数量组合的超额收益能力;
- 基于基金超额收益分布、调整$R^2$和正Alpha比例的特定算法逐步筛选ETF组合;
- 利用Lasso和正向选择法在风险因子空间选择可以代表风险因子的ETF组合。
  • 假设与数学基础: 利用零Alpha基金p值均匀分布特性估计$\pi0$(无Alpha基金比例),从而对超额收益显著性校正,避免第一类错误,计算修正后的正Alpha基金比例$\hat{\pi}+$[page::4,5,6,7]。


2.3 数据描述(第3章)


  • 样本轮廓: 使用CRSP数据库剔除偏差后,涵盖1980-2019年间美国约13,922只主动基金及100只主流ETF。基金月数据尽量保证时间序列的连续性和样本充足。

- ETF市场趋势: 1994年至2019年ETF数量从数百逐渐增长至约875只,AUM规模达到2.1万亿美元,涵盖广泛资产类别。研究设定时间窗口2005年至2019年覆盖流动性与样本规模的平衡。
  • 基金和ETF统计特征: 平均超额收益均为正但较低,夏普比率与市场风险因子相比偏低,表明大多数基金未能创造稳定Alpha,但ETF与基金夏普比率更为接近,支持ETF作为基准合理性[page::9,10,11]。


2.4 结果分析(第4章)



2.4.1 ETF作为基准的可能性(第4.1节)


  • 基金技能比例估计: 1980-2019年间0 Alpha基金约38%,技能匮乏基金约61%,技能基金仅1.2%。2005-2019年技能匮乏比例上升至41.3%,技能基金依旧不足2%。

- ETF数目对基准效果影响: 随机选ETF组分析发现,6个ETF组合后,平均Alpha稳定在约0.02%,高于风险因子模型估计约0.15%;调整解释方差($adjusted-R^2$)也随ETF数目上升趋近风险因子约88%。为得到与风险因子相似的解释效果,需约8个ETF。
  • 技能基金比例变动: 投资能力匮乏基金比例对ETF数量敏感度低,稳定在约10%。零Alpha基金比例随ETF数量增加而上升,有技能基金比例则下降,3~5个ETF时达到最优平衡,且ETF组选择影响显著。

- 结论强调: ETF可有效代替传统风险因子做基准;交易成本导致使用风险因子时技能匮乏基金比例高估;最佳ETF组合数量宜控制在3-5个范围内[page::11,12,13,14]。

2.4.2 基于特定方法的ETF选择(第4.2节)


  • 基于基金业绩的ETF选择(第4.2.1节):

- 通过逐步筛选算法,选出5个ETF(如VVLU、IJT、SLYV、XLY、XLV),组合满足$\text{adjusted-R}^2\geq 85\%$且有投资能力基金比例和平均Alpha均较低。
- 结果展示,所选ETF组合平均Alpha接近零略为负(约-0.01%),调整后解释方差约86%,对应技能基金比例仅5.7%,明显低于41%风险因子估计,证实绝大多数基金无真实Alpha。
  • 基于风险因子的ETF选择(第4.2.2节):

- 通过Lasso方法选择6个ETF以解释四因子模型,其中市场因子调整$R^2$最高达95.5%,但整体解释能力较基金业绩方法略逊,且估计技能基金比例较高(39.4%),说明Lasso选择的ETF组合未必有效代表风险因子覆盖。
- 采用正向选择法(迭代选择1至2个ETF),提升解释能力(调整$R^2$最高达99.6%),估计技能基金比例约11%,结果优于Lasso但仍高于基于基金业绩的选择。
  • 综合表现比较:

- 基金业绩导向的ETF选择在兼顾低技能基金比例与高解释力上表现最佳。
- 风险因子基于选择简单易用但存在较高的技能基金比例估计偏差。
  • 结论: 通过适当算法,少量ETF组合可有效覆盖风险因子暴露,准确评价基金业绩,实现对基金技能的严苛筛选[page::15,16,17,18]。


2.5 总结(第5章)


  • ETF数量快速增长,为基金业绩评估带来精准基准的新工具。

- 本文证实,采用3-5只ETF组合能够接近传统风险因子评价效果甚至更优,且更符合市场实际交易成本。
  • 超过95%的主动基金无能力创造净超额收益,这一结论与过往文献一致,但ETF基准定义更合理。

- 采用特殊选择算法能进一步优化ETF组合结构,减少估计偏误。
  • 研究对国内ETF及主动基金评价具有重要启示意义,尤其是快速膨胀的行业主题ETF背景下[page::18,19]。


---

3. 图表深度解读



图表1(第5页)


  • 描述: 显示在零Alpha假设($H0: \alphai=0$)下模拟数据的p值分布及估计零Alpha基金比例$\hat{\pi}0$的计算过程。

- 解读: p值在0到1均匀分布,代表零Alpha基金p值均匀理论,下方深色区域对应假阳性以外基金(有真实Alpha或匮乏),浅色右区($p
i > \lambda^=0.40$)被认为完全来自零Alpha基金,$\hat{\pi}_0 = 0.798$,即78%的基金接近无能力。
  • 结论支持: 该图形验证了FDR方法假设基础,为后续正Alpha基金比例校正提供准确估计基础[page::5]。


图表2(第6页)


  • 描述: t统计量分布,Panel A为单只基金统计量,Panel B为横截面汇总统计。

- 解读: 显示幸运基金(假阳性)和不幸运基金(假阴性)对应的t统计极端区域面积,未校正正Alpha基金比例高达13.6%,校正后为9.9%,贴近模拟真实基金比例,说明FDR校正有效控制误判。
  • 联系文本: 反映FDR方法在控制多重检验错误中的效果,避免过度判定技能基金[page::6]。


图表4(第9页)


  • 描述: 1980-2019年每月活跃基金数量走势。

- 解读: 基金数逐年增长,特别是2005年后基金数急速增加至6000只以上,印证样本的时间分布和规模大多集中近十余年。
  • 联系文本: 支持研究聚焦2005年后的ETF样本选择及数据环境[page::9]。


图表5(第10页)


  • 描述: 1994-2019年ETF基金数量走势。

- 解读: ETF基金数呈指数增长,1994年不足100只,2019年超过800只,表明ETF市场迅速扩张。
  • 限制: ETF快速增加带来样本时间长度与ETF数量间的平衡问题。

- 联系文本: 解释采样2005年起数据原因,平衡样本时长度和涵盖ETF数量[page::10]。

图表6(第10页)


  • 描述: 同期ETF资产净值(AUM)对比。

- 解读: 选样ETF覆盖总市场超过85%的资产规模,确认样本代表性和市场流动性保证。
  • 联系文本: 支撑样本ETF具备代表性,结论适用于实务市场环境[page::10]。


图表7(第11页)


  • 描述: 细化基金和ETF样本基本指标(平均超额收益、夏普比率、资产规模、时间长度等)。

- 解读: 平均基金超额收益0.51%/月,夏普比率0.13,ETF平均略优,市场因子夏普比率最高,显示基金表现弱于市场。时间序列较长保证估计稳健。
  • 联系文本: 针对基金表现通常难正Alpha的背景,支持论文主题[page::11]。


图表8(第11页)


  • 描述: 三个时间段内不同基金技能类型比例。

- 解读: 投资能力匮乏基金比例逐渐提升(1980-2004:26.3%→2005-2019:41.3%),有能力基金始终<2%,零Alpha基金占主体,反映主动基金竞争加剧,精英基金寥寥。
  • 联系文本: 与Fama及Barras文献呼应,进一步显示ETF基准下的基金能力划分[page::11]。


图表9(第13页)


  • 描述: 随机ETF数量对平均Alpha及Adjusted-R²影响。

- 解读:
- 平均Alpha稳定于0.02%左右,比风险因子模型高约0.15%。
- 解释方差逐渐提升,8个ETF时与风险因子模型(约88%)基本持平。
  • 结论: 说明少量ETF组合足以模拟风险因子组合,且含交易成本更真实[page::13]。


图表10(第14页)


  • 描述: 不同ETF数量随机组合下三类基金比例(无能力、零Alpha、有能力)的95%置信区间。

- 解读: 有能力基金比例随ETF数量增加初期下降后略有反弹,零Alpha基金比例上升,投资能力匮乏基金比例总体稳定且远低于风险因子估计。
  • 结论: 3-5个ETF组合时,得到最优技能基金判断效果,支持少数ETF复刻业绩假说[page::14]。


图表11(第15页)


  • 描述: 基于基金业绩结合算法选择出的ETF组合表现指标。

- 解读: 组合占优于随机ETF选择,接近风险因子组表现。平均Alpha约-0.01%,Adjusted-R²约86%,技能基金比例5.7%,明显低于风险因子41%的估计。
  • 结论: 该方法优于随机选择,筛选出更真实反映基金业绩的ETF组合[page::15]。


图表12(第16页)


  • 描述: Lasso选出的ETF对应风险因子分布及调整$R^2$。

- 解读: 多数ETF同时用于多个风险因子,Adjusted-R²分别为95.5%(市场)、74.5%(SMB)、53.4%(HML)、33.9%(WML),整体覆盖能力不如预期。
  • 联系文本: 可能因过拟合及多重共线性导致解释力不足[page::16]。


图表13(第17页)


  • 描述: 正向选择方法选出的ETF组合及对应Adjusted-$R^2$。

- 解读: 第一次迭代共选4个ETF,调整$R^2$从33.2%到99.6%,第二次迭代额外4个ETF,解释力进一步提升(最高达99.6%,最低45.5%)。
  • 结论: 正向选择在覆盖风险因子空间上更有效[page::17]。


图表14(第18页)


  • 描述: 不同筛选法对应基准的Alpha、调整$R^2$与技能基金比例。

- 解读: Lasso方法表现最差,技能基金比例39.37%;正向选择方法性能更优,Alpha近零,技能基金比例约11%,更符合基金真实情况。随机选择次之,风险因子模型对应技能基金比例最低。
  • 联系文本: 说明基于基金业绩的ETF选择优于风险因子追踪,且灵活筛选重要[page::18]。


---

4. 估值与模型方法解析


  • 基准模型: 线性回归类模型,基金超额收益被解释为ETF组合超额收益的线性函数,含截距Alpha衡量技能水平。

- FDR方法: 一种多重检验下控制第一类错误率的统计方法,通过阈值$\lambda^
$划分零Alpha基金的p值分布,以估计零Alpha比例和修正正Alpha比例,防止虚假正Alpha高估基金技能。
  • ETF筛选工具:

- 随机选择: 简单但性能波动大,提供基准参考。
- 绩效驱动特定选择: 优先选择可最大限度解释基金收益且减少正Alpha基金的ETF,通过迭代算法保证模型拟合。
- Lasso回归: 加入L1正则项,压缩系数稀疏化,选出代表风险因子的ETF。
- 正向选择: 迭代增加单个解释变量,以显著提升调整$R^2$为目标选择ETF。
  • 交易成本影响: 传统风险因子不含交易成本,导致技能匮乏基金比例高估,ETF作为真实投资产品收益已扣成本,更符合实务判断。


---

5. 风险因素评估



报告明确指出:
  • 数据和结论限制: 依赖历史数据和海外文献总结,结果可能受市场环境和数据选取影响。

- 模型假设风险: FDR方法假定零Alpha基金p值均匀分布等,若实际偏离,估计结果可能失真。
  • ETF代表性风险: 虽然覆盖大量ETF,但市场快速变化可能导致样本代表性不足。

- 交易成本估计: 虽考虑交易成本差异,但对交易费用准确估计仍有限,可能影响Alpha和技能基金比例判断。
  • 非投资建议声明: 报告多次强调仅供参考,不构成买卖推荐,投资需谨慎。


---

6. 审慎视角与细节


  • 报告客观说明约95%主动基金无能力,这一结论虽符合主流研究,但可能忽视了部分异象或在极端市场中主动管理价值。

- 不同选择ETF的方法结果差异较大,对模型选择与经济含义解释需谨慎区分。
  • 报告未深入讨论市场环境变化对基金技能及ETF组合稳定性的动态影响,未来研究空间大。

- 尽管报告提出ETF收益含交易成本更真实,但具体交易成本的异质性与动态变化未全面考虑,或存在估计偏差。
  • 报告强调ETF数量3-5个最佳组合,但该结论是否稳健适用于其他市场或资产类别,仍需验证。


---

7. 结论性综合



本报道深入探讨了使用少量ETF组合复制和评估美国主动共同基金业绩的潜力,显示了ETF基准相比传统风险因子基准的优势,特别是在交易成本计入方面的贴近实务表现。基于FDR多重检验方法,通过建立以ETF组合为解释变量的线性模型,并对基金技能新华比例进行校正,揭示了超过95%的主动基金无法创造风险调整后的超额收益。

重要发现包括:
  • 随机选择ETF组合分析表明,大约3-5只ETF的组合已能复制主动基金绝大部分收益表现,且解释力高达85%以上,调整后$R^2$与风险因子模型相仿。

- 通过专门算法选择的特定ETF组合在降低假阳性技能基金比例方面效果更佳,仅少数基金被判定为真正有技能,强化了主动管理能力稀缺的结论。
  • 不同的ETF筛选方法表现参差,基于基金业绩的选择优于单纯风险因子匹配的Lasso或正向选择方法,提示应结合基金收益实际来设计ETF组合。

- 图表数据和模型结果一致支持ETF作为基金基准的可行性和优势,交易成本的重要性不容忽视。
  • 研究对国内ETF市场的激增提供了理论支持和方法借鉴,有助于识别真正具有投资能力的主动权益基金。


总之,本报告系统地验证了“以少量ETF复制主动基金业绩”的可行路径,强调主动基金超额收益稀缺并易被交易成本侵蚀,ETF组合基准既现实又具前沿研究价值,提供了对基金业绩评价和资产配置的新视角[page::0,3,4,6,9,11,13,14,15,18,19]。

---

参考图表展示



图表1:零Alpha假设下模拟数据集的估计p值分布



图表2:模拟数据集的t统计量分布



图表4:1980年1月至2019年12月每月基金数量



图表5:Bloomberg数据库ETF数量



图表6:ETF资产净值(AUM)变化



图表9:随机选择ETF与风险因子潜力对比



图表10:随机ETF组合不同ETF数下基金类别比例



---

总结建议



该报告严谨地采用先进计量方法揭示了主动基金技能层次及少量ETF组合对基金业绩复制的有效性,兼顾统计稳健性与实务适用性,为资产配置及主动基金评价提供了可靠依据。研究方法和结论对国内ETF及主动管理市场尤具启示,建议投资者与监管机构关注ETF基准的深入应用,以更公平、合理地识别和激励具备真正投资能力的主动管理人。

[全部结论内容均基于报告原文内容及图表数据,详见各页码溯源说明][page::0-20]

报告