`

选股池错配时如何做超额收益:以创业板为例

创建于 更新于

摘要

本报告通过对创业板指数成分股流通市值、估值、净利润及交易活跃度等特征的系统分析,发现其投资价值逐渐提升但选股空间有限,传统单因子选股难以获得稳定超额收益。针对选股池与基准池错配问题,报告采用“纯因子组合”方法,以全市场为选股池、创业板指数为基准,构建44种多因子模型。结果显示,允许市值暴露时年化超额收益达18.5%,IR达1.98;不允许市值暴露时仍有9.2%的超额收益和1.03的IR,体现纯因子组合“所见即所得”的优势,为解决选股池错配提供有效路径[page::0][page::3][page::21][page::29]。

速读内容


创业板指数成分股风格演变分析 [page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10]







  • 创业板指成分股市值显著提升,中位数由7亿元增至111亿元,最大市值由43亿增至740亿,市值排名由后2%上升至前58%。

- 估值水平PE中位数从60倍下降至44倍,位置由市场后段提升至中游水平。
  • 净利润中位数大幅提升至3.9亿,排名前24%,且交易活跃度也显著增加,体现创业板整体资金活跃及业绩改善。

- 利润增速相对稳定,处于全市场中上游水平,显示成长性相对稳健。
  • 成交额中位数和排名大幅提升,反映市场流动性提升及关注度增强。


单因子回测分析及选股池错配困境 [page::14][page::15][page::19]




  • 评估多种单因子指标在创业板成分股中的表现,流通市值、估值类因子效果较弱,盈利及成长因子整体有效期望减弱,量价类因子(换手率、成交额、波动率、小单流入额)表现较好。

- 日均换手率最小组因子表现最佳,IR仅0.81,超额收益7.8%,但整体收益稳定性有限。
  • 扩大选股池至创业板综指或全市场时,存在无意识小市值暴露带来的损失风险,导致基准错配,效益不确定。


纯因子组合模型构建及收益分析 [page::21][page::22][page::23][page::24][page::25]






  • 构建44因子体系(包含14类风格因子、29个一级行业因子与国家因子),采用纯因子组合方式,确保选股池可独立于基准池,解决选股池错配问题。

- 风格因子如流动性、小单流入额、规模及一致预期变化表现突出,行业因子波动率较高但IR较低。
  • 纯因子组合年化收益波动性平稳,IR最高因子达到2以上,盈利能力显著优于单因子策略。


多因子组合优化回测及因子收益估计方法探讨 [page::25][page::26][page::27][page::28]




  • 采用不同长度历史数据(1个月、3个月、6个月、1年及全部数据)来估计因子收益,发现更长历史数据估计效果更佳,短期预测动量不显著提升表现。

- 结合因子收益估计进行多因子权重优化,允许市值暴露时年化超额收益18.5%,IR1.98;限制市值暴露时超额收益仍达9.2%,IR1.03。
  • 市值因子为超额收益的主要贡献来源,小单流入额及是否创业板成分股等因子也发挥重要作用[page::15][page::20][page::26][page::28]


结论总结 [page::29]

  • 创业板指数成分股虽有良好基本面和流动性,但受限于规模,单因子选股难以取得持续超额收益。

- 纯因子组合方法有效解决选股池与基准错配问题,通过基准单位暴露构建多因子投资组合,实证验证其在创业板市场显著超越基准的能力。
  • 该方法为以全市场为选股池,创业板指数为基准提供了较优的投资工具,适合希望突破成分股限制的投资者。

深度阅读

报告分析:多因子模型系列报告之四——选股池错配时如何做超额收益:以创业板为例



---

一、元数据与报告概览


  • 报告标题:多因子模型系列报告之四——选股池错配时如何做超额收益:以创业板为例

- 发布机构:长江证券研究所
  • 发布日期:2018年5月14日

- 报告类型:金融工程专题研究报告
  • 研究主题:创业板指数成分股特点分析、多因子模型选股问题及解决方案,重点探讨在选股池与基准池错配情况下,如何实现相对创业板的超额收益。


核心论点
  • 创业板指数成分股整体规模(市值)上升、估值水平下降、利润水平提升且利润增速稳定,且交易活跃,具有良好投资价值。

- 传统量化选股在创业板成分股范围内难以获得稳定超额收益,扩大选股池则面临选股池与基准池错配及小市值暴露问题。
  • 纯因子组合(Pure Factor Portfolio)方法,允许选股池与基准池错配,通过相对基准单位暴露构建组合,实现显著超额收益,是解决该问题的有效工具。

- 实证回测显示,利用44个因子(含14大类因子、29一级行业因子及国家因子)、选股池为全市场A股、基准为创业板指数的纯因子组合,年化收益最高达27.9%,超额收益18.5%,IR达1.98,表现优异。[page::0, 3, 29]

---

二、逐节深度解读



2.1 创业板指数成分股分析



市值分布


  • 创业板指成分股流通市值显著增长:

- 2010年中位数约7亿元,2018年跃升至111亿元;
- 最大市值由43亿元增加至740亿元;
- 最小市值提高至35亿元。
  • 图1显示流通市值五分位数整体上升趋势,曲线呈现平稳增长与跳跃,反映整体创业板公司规模显著扩大。

- 创业板市值排名提升显著(图2,图3),2010年中位数排名处于全市场后11%(1664位),2018年跃升至前19%(683位),市值总体提升超过81%的上市公司。
  • 最大市值上升显著,排名由498位提升至75位(前2%)。[page::4, 5]


估值(PE)变化


  • 创业板指PE中位数由60倍降至44倍(图4),估值整体回落,估值水平由全市场最高26%下降至57%,显示部分成长股已具备合理估值基础。

- 最大PE波动较大,2018年最高达505倍(非常极端的个别高估值),最低PE降至市场最低16%。图5分位数显示估值整体下降态势。[page::5, 6]

盈利与利润增速


  • 净利润水平显著提升(图6),中位数由0.5亿元增长至3.9亿元,最大值由3.2亿元上涨至49.9亿元,显示企业盈利能力增强。

- 净利润分位数明显上升(图7),中位数从后40%跃升至前24%,最大值升至前2%。
  • 利润增速相对稳定(图8),虽中位数有所下降(37%至26%),但仍保持较快增长,分位数排名稳定维持在全市场前40%左右(图9)。

- 成交额也大幅提升(图10),中位数由0.6亿元提升至2.5亿元,活跃度显著增强,成交额排名提升至全市场前12%(图11)。[page::7, 8, 9, 10]

在典型规模指数中的分布


  • 创业板成分股在沪深300、中证500和中证1000指数的分布权重逐年变化,反映部分创业板大盘股逐渐纳入主板体系(图12, 图13)。

- 2018年,约30%成分股属于沪深300,29%属于中证500,50%属于中证1000。
  • 该变化体现创业板整体“成长→规模”转变趋势。[page::11, 12]


创业板50指数成分股分析


  • 创业板50指聚焦流动性好、市值大、代表性强的成分股。

- 以成交额、换手率、市值、PE、净利润、净利润增速、beta、波动率等指标切分成组,发现创业板50成分股对高成交额、高换手率、高beta、高波动率以及大市值公司偏好明显,PE和利润增速分布较均匀(图14-21)。
  • 说明创业板50更倾向于流动性较强或市场认可度高的公司。[page::12, 13, 14]


---

2.2 单因子测试


  • 在创业板指数成分股范围内,将不同因子划分五组进行等权收益测试,剔除退市、停牌及ST股票及交易限制,计算超额收益。

- 主要因子包括规模(流通市值)、估值(EP、CFP)、盈利(净利润、ROE)、成长(利润增速)、量价(beta、波动率、成交额、换手率、小单流入额)、预期指标(wind一致预期营收增速、中期预期EPS变化)等。
  • 结果显示:

- 规模因子对创业板股票区分能力很弱,分年收益波动大。
- 估值类因子(EP,CFP)效果通常不佳,2018年甚至出现反向收益。
- 盈利因子总体有效,净利润及ROE高组回报较好,2018年同样效果减弱。
- 量价指标中成交额低、换手率低、波动率低、小单流入小的股票组合表现较好,今年区分度明显。
- 预期指标表现不稳定,预期营收增速和GPE今年方向反转,预期EPS变化率影响相对稳定。
  • 综合来看,当前市场环境下,传统价值、盈利成长因子效用减弱,量价因子影响较为突出,反映投资者情绪和分析师预期的变化是关键因素。

- 重点选取IR最高的策略包括日均换手率最小组(IR=0.81,超额7.8%)和小单流入额最小组,表现最佳因子策略超额收益波动较大,难以稳定实现超额回报(表1至表16,图22-23)。[page::14, 15, 16, 17, 18, 19]

---

2.3 样本池扩张及错配问题


  • 扩大选股池至创业板综指,提升了投资广度,IR水平提升(小单流入额最小组IR1.35,超额收益16.9%),但也引入了无意识(unintentional)的小市值暴露,带来额外风险及2017年损失(图23-24,表19)。

- 该问题类似于全市场选股对沪深300基准的错配风险,传统多因子策略难以规避。
  • 综上,创业板指成分股由于数量及规模限制,且选股池和基准存在错配,单因子和简单组合效果有限。[page::19, 20, 21]


---

2.4 纯因子组合多因子模型概述及优势


  • 纯因子组合构建方法是基于相对于基准的单位因子暴露,不强制选股池=基准池,天然允许选股池和基准池错配,是克服传统错配问题的有效工具。

- 该方法“所见即所得”:通过历史数据直接衡量单因子组合对应的超额收益,多个纯因子组合按权重合成多因子组合,便可直接获知组合整体的超额收益贡献(图25-26)。
  • 相比于传统IC加权、方差优化等在因子层面加权的方式,纯因子组合方法在投资组合层面更直观、透明。

- 回测依然采用剔除退市、停牌、涨跌幅限制及ST股票,并计入交易成本3‰,以保证实战参考价值。[page::21, 22]

---

2.5 纯因子组合构建与收益表现


  • 选取44个因子:14类风格因子(包括规模、成长、估值、ROE、Beta、波动率、流动性、一致预期变化、动量、反转等)、29个中信一级行业哑元因子以及国家因子。

- 因子内部按照预定义权重合成,如成长因子包括净利润增速、营业收入增速、ROE同比变化、GPE和一致预期GPE,权重均为1;估值因子负权重(反向因子);ROE分市值前30%和后70%赋予不同权重等(表20a、20b)。
  • 图27显示行业因子年化收益较高,计算机、通信、国防军工等表现亮眼,但波动率高(图28);风格因子年化收益与波动率整体较行业因子稳定,且IR(信息比率)多高于1,流动性、规模、小单流入额因子表现尤佳(图29)。

- 结论是行业因子虽带来较高收益但带来更大风险,保持行业中性可减风险但牺牲部分收益。[page::22, 23, 24, 25]

---

2.6 优化器再平衡及因子收益估计方法


  • 通过优化器组合各纯因子组合,因子收益期望可输入不同历史长度的收益均值,包括过去1个月、3个月、6个月、1年及全部历史数据,力求捕捉因子收益的稳定预期,提升估计准确性(数学公式详见报告)。

- 回测显示,使用更长历史数据收益率及IR均升高,短期数据波动较大,建议优先考虑长期平均收益,但因规模因子表现有短期波动,建议对其单独监控和调整(图30-32)。
  • 同时考量市值暴露限制对组合表现的影响,面向投资者风险偏好不同给出两档选择。[page::25, 26]


---

2.7 回测结果与因子贡献分析


  • 允许市值暴露时,纯因子组合年化收益率高达27.9%,同期创业板指9.4%,超额收益18.5%,跟踪误差9.3%,IR 1.98(图33),综合风险收益率表现优异。

- 限制市值暴露时,年化收益18.6%,超额收益9.2%,跟踪误差8.9%,IR 1.03(图34),虽然收益降低,但波动率相应减小,适合风险偏好较低投资者。
  • 2015年表现出异常高超额收益,剔除后二者平均超额收益仍较为稳健。

- 因子暴露显示,允许市值暴露时规模因子为最大贡献因子,平均贡献约7%;小单流入额、是否创业板指成分股因子紧随其后;限制市值暴露时规模因子无贡献,主要收益来源转向流动性、小单流入额等因子(图35-36)。
  • 综合来看,规模因子在无限制暴露场景下是驱动组合收益关键因子,市值暴露限制会影响该因子贡献。[page::27, 28, 29]


---

2.8 报告总结


  • 创业板指数成分股规模成长、估值降低、利润显著提升、增速稳定且交易活跃,是优质标的。

- 传统单因子及因子组在创业板成分股范围内难以获得稳定超额收益,扩大选股池引入错配风险和小市值暴露问题。
  • 纯因子组合构建方法,基于相对基准单位暴露,天然克服选股池、基准池错配,具有“所见即所得”特点。

- 以44因子构建的纯因子组合在创业板指数基准下,以全市场为选股池进行实证回测,年化超额收益最高达18.5%,IR 1.98,效果显著。
  • 报告为创业板及类似结构中小盘及成长股量化投资提供了有效思路和方法参考。[page::29]


---

三、图表深度解读



创业板成分股风格变迁


  • 图1-3:创业板成分股市值中位数由7亿元升至111亿元,市值排名从后11%跃升至前19%,说明创业板不再是纯小盘市场,规模拓展明显。

- 图4-5:PE估值中位数下行,最高PE数极端扩张,但整体估值区间扩宽,表明投资者对部分个股估值高度分歧。
  • 图6-7:归母净利润大幅提升,中位数净利润已较全市场前24%的公司更优,体现盈利能力持续改善。

- 图8-9:利润增速排名稳定,虽然中位数有所下降,但仍保持较高增长,创业板企业增长稳定性较好。
  • 图10-11:成交量提升夯实市场活跃度,中位数上升至全市场前12%,活跃交易保证了量化策略流动性。

- 图12-13:创业板成分股权重从中证1000向沪深300、中证500迁移,规模效应和市场认可逐渐增强。

创业板50成分股分布(图14-21)


  • 以成交额和换手率为核心流动性指标,创50成分股明显集中于流动性第五组(最高);

- Beta和波动率相对较高组分布多,匹配活跃交易风格;
  • PE和利润增速指标分布较均匀,显示成分股风格多样。


单因子测试结果(表1-18,图22-24)


  • 流通市值因子表现不明显,年化收益波动较大,表明创业板非典型规模效应市场。

- EP和CFP等估值因子多期反向,盈利因子表现较好但同样面临短期反向拟合风险。
  • 量价类指标(换手率、成交额、波动率、小单流入)成为市场情绪和行为偏好反映主因。

- 预期类指标波动大,反映市场对未来的预期调整显著。
  • 跨创业板综指扩充选股池虽提升IR,但引入均衡权重外的小市值风险,影响全年稳定收益。


纯因子组合指标(表20-21,图25-36)


  • 组合中行业因子贡献大但波动显著,行业中性策略平衡风险收益;

- 风格因子中流动性、小单流入、规模和一致预期变化表现突出,IR较高(>2);
  • 长期因子收益估计优于短期,尤其规模因子表现需动态调整;

- 允许市值暴露时收益及IR高,规模因子贡献主导;市值暴露限制配合流动性等因子维持稳定超额收益;
  • 回测净值曲线展现长期累积超额,验证多因子组合构建逻辑有效。


---

四、估值方法解读



尽管报告重点非公司估值,而是多因子模型构建与收益表现,但涉及因子构建时使用了经典市值、估值类指标作为因子输入:
  • 规模因子:流通市值取自然对数,反映公司体量大小。

- 估值因子:EP(盈余收益率)、CFP(现金流收益率)、BP(账面市值比)等,系数为负表明价值股倾向买入低估值股票。
  • 成长因子:归母净利润及营业收入同比增速,ROE及其变化,GPE及分析师预期(wind一致预期)等指标。

- 因子收益预期由历史均值估计,用于优化器计算因子组合权重。
  • 优化器通过求解指数收益最大化问题,同时控制风险暴露和行业中性约束,形成多因子组合。


这种基于因子暴露和超额收益的组合构建方法属于现代投资组合理论范畴,关键在于确定因子收益预期及波动风险协方差。报告中特别强调利用“纯因子组合”方法直接估计对应于基准单位暴露的因子超额收益,简化估值和权重调节过程。[page::21, 22, 25]

---

五、风险因素评估


  • 选股池错配风险:扩大选股池(如全市场)时,因选股与基准(创业板)属性差异引入无意识的小市值暴露,影响组合跟踪误差及超额收益稳定性。

- 行业暴露风险:行业因子带来高收益但同时导致波动率上升,行行业中性处理可降低风险但减收益,要求组合管理中平衡。
  • 单因子表现周期性波动:某些价值、成长因子效能波动大,存在所见即所得的局限,需密切监控和动态调整因子预期。

- 市场极端事件影响:2015年超额收益异常高,排除该年后收益仍稳健,但说明组合对极端市场波动存在敏感性。
  • 规模暴露风险:限制规模因子暴露会降低收益,造成因子收益结构变化风险。

- 报告未明确给出缓解策略,但通过纯因子组合和优化器约束手段控制暴露是其主要风险管理方式。[page::20, 25, 27, 29]

---

六、批判性视角与细微差别


  • 报告对纯因子组合方法的推广充分,强调其“所见即所得”优势,但同时对因子估计依赖历史数据,假设未来因子收益稳定,存在历史偏差风险。

- 单因子测试中,2018年多个主要因子出现反向收益,表明市场阶段性异象混杂,投资者须谨慎对待因子长期有效性。
  • 扩大选股池时,引入的小市值暴露风险提醒模型在基准不一时需特别注意隐含风险,纯因子组合方法虽能部分缓解,但并非完全消除。

- 行业因子高收益但高波动现象突显,若缺少有效轮动策略,保持行业中性或牺牲收益是在所难免。
  • 报告未详细说明交易成本和流动性风险对回测结果的影响,尤其创业板小市值股票中成交可能受限,应谨慎参考。

- 规模暴露调整虽提供不同策略选择,但规模因子作为高收益因子,限制后或降低组合长期收益期望。
  • 总体而言,报告结构严谨,数据详实,结论相对稳健,但对于某些极端年份及因子非稳态表现可进一步加强警示。[page::14, 19, 27, 29]


---

七、结论性综合



长江证券研究所发布的这份《多因子模型系列报告之四》详尽分析了创业板指数成分股自2010年起至2018年的结构演变,展示了创业板公司规模显著提升、估值下降且盈利能力增强,市场活跃度积累提升,传统上“小盘成长”标签正在逐步弱化。单因子及传统多因子策略在较窄创业板指数成分股内受限,难以持续获取超额收益;扩大样本池则面临选股池与基准池错配问题,引入小市值暴露风险,降低策略稳定性。

通过设计和运用“纯因子组合”策略,报告创新性地解决了选股池和基准池错配的痛点,证明基于44个多样化因子构建的多因子组合,采用面向全市场A股的选股池对创业板指作为基准的策略,能够大幅提升年化收益率(最高27.9%)及超额收益(18.5%),信息比率达1.98,显示出强劲的风险调整后表现,明显优于传统因子测试结果。

财务指标(如规模、盈利、成长)和市场行为指标(流动性、换手率、小单流入)在组合构成中各司其职,规模因子为主要收益驱动因子,行业因子贡献收益却带来较大波动。因子收益预期应基于较长历史数据,但规模因子需动态监控调整。限制规模因子暴露可为低风险偏好投资者提供备选方案。

报告中多幅数据图表(如流通市值分布图、PE估值区间、净利润、利润增速、成交额走势及各类因子分组超额收益表现、纯因子组合IR表现等)详实支撑论点,图表与文本相辅相成,逻辑严密、数据翔实、分析深入,为创业板及类似市场多因子投资提供了可操作的策略路径和理论依据。

总体来看,该报告对投资者理解创业板市场特征、处理选股池与基准池错配问题具有重要参考价值,尤其适合寻求通过量化多因子策略实现持续超额收益的专业机构和投资者。[page::0, 3, 7, 14, 20, 25, 29]

---

附:部分关键图表示例
  • 创业板指成分股流通市值增长趋势(图1)



  • 创业板指成分股PE估值波动(图4)



  • 创业板单因子组合收益表现示例(图22)



  • 不同数据期限对因子组合超额收益影响(图30)



  • 允许市值暴露时的纯因子组合回测净值曲线(图33)



  • 纯因子组合整体IR表现(图29)




---

# 总体评述:本报告在创业板市场环境下,深刻剖析了多因子量化投资面临的结构性挑战与解决之道,尤其对选股池错配问题提供了创新且实用的解决方法,数据支撑紧密,研究视角全面,结论具有较强的实操价值和策略指导意义。

报告