创业板股票收益率相关分析——基于因子模型分析
创建于 更新于
摘要
本报告基于创业板市场,以资本资产定价模型和Fama-French三因子模型为工具,实证分析创业板股票收益率的驱动因子,重点讨论市值因子的有效性及创业板指数的代表性。发现创业板指数偏向大市值股票收益,使用等权重全组合可更好反映板块整体表现。模型验证显示,市场因子(创业板指数)解释度高达82.55%,双因子(市场+市值)模型解释度87.91%。市值因子对小市值股票的选股优势具有明显时效性,2016年10月后选股效果减弱,因子作用随时间变化显著[page::0][page::15]。
速读内容
创业板股票市值和数量分布分析 [page::2][page::3]

- 创业板流通市值分布严重不均,约80%的股票为小市值,占流通市值比例仅33.93%。
- 大市值股票虽数量少(11.53%),但占流通市值54.85%,形成“肥尾”分布特点。
- 小市值股票数量占绝对优势,提升了指数构建的代表性挑战。
不同投资组合收益率比较 [page::4]

| 投资组合 | 日均收益率 | 波动率 | 最小收益 | 25%分位 | 50%分位 | 75%分位 | 最大收益率 |
|---------------|------------|--------|---------|---------|---------|---------|------------|
| 流通市值全组合 | 0.02% | 2.09% | -8.93% | 0.87% | 0.05% | 1.05% | 7.06% |
| 等权重全组合 | 0.04% | 2.20% | -8.85% | -0.91% | 0.13% | 1.15% | 7.94% |
| 小市值组合 | 0.06% | 2.30% | -10.22% | 0.87% | 0.18% | 1.19% | 8.66% |
| 大市值组合 | 0.01% | 2.07% | -8.96% | 0.87% | 0.01% | 1.04% | 6.74% |
| 创业板指数 | 0.01% | 2.08% | -8.91% | -0.88% | 0.01% | 1.02% | 7.16% |
- 创业板指数偏向大市值股票收益,不能完全反映小市值股票波动。
- 小市值及等权重组合收益率显著领先,反映小市值股票的强劲表现。
- 指数代表性受限,投资者体验与指数表现存在偏差。
模型拟合优度分析与因子效用验证 [page::7][page::8]
| 模型 | 平均拟合优度(R²) |
|--------------|------------------|
| 单因子MF | 82.55% |
| 单因子SMB | 30.28% |
| 单因子HML | 7.38% |
| 双因子MFSMB| 87.91% |
| 三因子MFSMB_HML | 88.89% |
- 市场因子(MF)为最强解释因子,市值因子(SMB)补充显著,有效提升模型拟合。
- 账面市值比因子(HML)解释能力弱,模型中贡献有限。
- 双因子模型(MF+SMB)在创业板市场适用性较优,三因子模型提升有限。
- 因子系数t检验表明市场因子及市值因子均通过大部分统计显著性检验[page::7][page::8].
创业板指数替代效果分析 [page::9][page::10]
- 使用“等权重全组合”替代创业板指数作为市场因子,其在单因子和双因子模型中拟合优度较高,能更好反映含小市值股票的板块动态。
- 替代指数虽提升整体解释力,但对部分个股解释能力有所损失,反映信息敏感度权衡。
- 指数替代需综合考虑市值因子的影响及模型解释的完整性。
市值因子收益变化与时效分析 [page::11][page::12][page::13][page::14]

- 市值因子收益连续上涨阶段(2013.6-2016.10)中,小市值股票组合表现明显优于大市值。
- 2016年10月后,市值因子累计收益进入震荡,优势不明显,选股策略效果减弱。
- IC信息系数分析确认因子有效性具备明显时段特征,因子的解释能力随市场环境变化显著波动。
- 市值因子长期累计收益可区分不同市场阶段,有利于投资决策中的时效性判断。





深度阅读
创业板股票收益率相关分析报告详尽解读
---
一、元数据与报告概览
报告标题:创业板股票收益率相关分析——基于因子模型分析
分析师及联系方式:郑朝阳,东海证券高级研究员,执业证书编号 S0630518080001
发布时间:2020年11月10日
研究对象:创业板股票及创业板指数,重点关注影响股票收益率的因子模型分析,尤其是市值因子的有效性和创业板指数的代表性。
主要目的:通过定量因子模型(包括CAPM、Fama-French三因子及其变体)对创业板股票收益率影响因素进行实证分析;评估创业板指数作为板块价格代表的有效性;探讨指数替代的可能性。
核心结论摘要:
- 创业板指数成份以大市值股票为主,导致指数收益更反映大市值股票表现,小市值股票虽然数量占比较大,但代表性不足。
- 创业板指数作为市场因子,能解释82.55%的股票组合收益率。
- 使用等权重股票组合替代创业板指数,可更好反映板块整体涨跌,但也会丢失部分板块信息。
- 市值因子和市场因子联合解释能力更强(双因子模型MFSMB解释87.91%)。
- 市值因子累计收益率正时,小市值股票表现强于大市值,而其解释力随时间呈现明显波动和周期性,因子模型的有效性具有时效性。
以上核心信息为全文论证的大纲,彰显报告实证方法严谨且关注因子时效性,力求为投资者揭示更精准的市场风格和指数替代方案。[page::0]
---
二、逐章节深度解读
1. 板块分析
1.1 创业板股票分布
- 关键论点:创业板定位于创业成长型中小市值企业,目前有800多只流通股票。市值分布极不均匀,呈“肥尾”特征,少数大市值股票占据板块绝大部分流通市值。
- 数据分析(见表1):
- 市值>380亿的股票数量仅为2.86%,但占流通市值34.18%。
- 小市值股票(如市值小于80亿者),数量占81.56%,但流通市值占比较低。
- 逻辑解释:中小市值股票数量众多,个股市值小;大市值股票数量少,但市值集中。数量分布与流通市值分布不匹配,表明创业板指数偏向大市值代表性不足。
- 图表对应说明:图1显示数量(左轴)与市值(右轴)两条曲线,数量峰值出现于20-40亿市值区间,而市值集中在最右端“大于380亿”区间的极少数股票。[page::2,3]
1.2 创业板指数分析
- 指数编制规则:
- 首选样本股基于流通市值和成交额占比。
- 以自由流通股本精确权重计算。
- 样本股固定为100只,季度调整。
- 核心推论:流通市值和成交金额对指数权重关键,指数天然偏重大市值股票。
- 投资组合构建与指数比较:
- 构建四类组合:等权重全组合、流通市值全组合、小市值组合、大市值组合。
- 目的在于检验哪种组合更能代表创业板整体股票收益。
- 图表解读(图2、图3):
- 累计收益率显示大市值组合、流通市值全组合与创业板指数走势相近。
- 等权重全组合与小市值组合累计收益明显优于创业板指数。
- 日均收益表格指出,小市值组合日均收益最高(0.06%),创业板指数和大市值组合仅0.01%上下,说明小市值股票在收益表现上具有一定优势,但未被指数充分反映。
- 结论:创业板指数较好代表大市值股票的表现,但因权重偏向主导指数走势,难以反映绝大多数小市值股票的收益与波动,[page::3,4]
2. 使用模型归因分析
2.1 模型概述
- CAPM模型:基础模型,单因子,将投资组合超额收益与市场超额收益线性联系,敏感度用β表示。
- Fama-French三因子模型:扩展模型,引入市值因子(SMB)和账面市值比因子(HML),以线性加权方式解释股票超额收益。
- 本文创新:基于创业板市场实证,检验三因子在中国市场的适用性,特别关注因子解释能力的时变性。
- 专业概念:
- MF为市场超额收益率。
- SMB衡量小市值股票相对大市值股票的收益差异。
- HML衡量高账面市值比股票相对低账面市值比股票收益差异。[page::5]
2.2 模型验证
2.2.1 数据准备
- 取样数据为2015年5月-2020年10月,采用22交易日调仓周期,形成60时间节点。
- 股票池为创业板成份股,剔除停牌和近两个月上市股票。
- 使用流通市值,账面市值比采用市净率倒数。
- 无风险利率采用shibor1年期利率,未计交易成本。
- 按流通市值50%比例分“小”(S)和“大”(B)组,账面市值比分成低、中、高三组,交叉形成6组合(SL, SM, SH, BL, BM, BH),构造SMB、HML因子。
- 投资组合构建为5x5=25组,用于模型回归验证。[page::6]
2.2.2 回归验证
- 对单因子(三个单因子)、双因子(MF
- 关键数据(表3):
- 三因子模型拟合优度最高,平均为88.89%。
- 双因子MFSMB拟合优度87.91%,仅次于三因子。
- 单因子MF拟合优度82.55%,远高于SMB(30.28%)和HML(7.38%)。
- HML在模型中表现较弱,多数组合系数t值不显著,解释能力有限。
- 系数有效性:
- 三因子中MF均通过t检验;SMB通过率76%;HML仅40%。
- 双因子MF_SMB模型有效,特别适合小市值股票。
- 解释:市场因子MF为收益波动主导,市值因子具备较好的补充解释能力,账面市值比影响有限,表明创业板市值大小是收益差异的重要来源。
- 图片说明(图4-7):系数检验表明市场因子及市值因子在统计上显著,多因子模型符合实证预期。[page::7,8,9]
2.3 创业板指数替代
- 由于创业板指数权重偏重大市值,探索使用其他投资组合替代指数成为市场因子。
- 使用“流通市值全组合收益率”、“等权重全组合收益率”、“创业板指数收益率”分别作为市场基准,检验单因子MF模型的拟合优度和系数t检验。
- 结果显示:
- 等权重组合拟合优度最高50.66%,流通市值组合49.26%,创业板指数45.51%。
- 等权重组合和流通市值组合均优于创业板指数。
- 等权重组合在β系数t检验均值最大(8.3)。
- 通过双因子模型检测,替代指数的拟合优度提升有限(约1%),但通过t检验的股票数量下降,表明替代指数信息有所丢失。
- 结论:
- 使用等权重组合作为市场因子可以更好反映板块整体走势,尤其是中小市值股票的价值。
- 替代指数不能完美替代创业板指数,存在信息损失风险。
- 指数替代选取需权衡大市值与小市值股票影响。
- 图表对应数据详见图8-11。[page::9,10]
2.4 市值因子影响
- 单因子SMB模型对25组合的拟合度约30.28%,市值因子系数s接近1且正相关,显示股票组合收益率与市值因子呈正比例关系。
- 市值因子收益率定义为小市值组合收益率减去大市值组合收益率,其累计值的走势表现小市值选股优势或弱势。
- 观察市值因子收益变化(图12)可见,2016年10月以后累计收益趋于震荡,优势减弱。
- 进一步分层分析(10组分层)显示2016年10月之前,小市值组合明显跑赢大市值组合(图13),而之后区别较小甚至被大市值反超(图14)。
- 使用信息系数(IC)分析因子与收益相关性(图15),2016年10月之前IC多为负值(小市值优于大市值),之后IC震荡,反映市值因子解释力时变大。
- 这揭示市值因子的选股有效期具有明显时效及周期波动特征。
- 通过延长周期数据(2010-2020,图17)发现市值因子累计收益分为盘整期、上涨期、又盘整期三个阶段,代表因子表现的周期性。
- 验证2016年10月后的回归(表4、图16)显示各因子拟合优度下降,市值因子解释能力大幅减弱至5.9%。
- 整体说明因子解释能力受市场结构、环境影响显著,投资者需关注因子活跃期。[page::11-14]
3. 总结
报告最后总结了主要发现:
- 创业板指数偏向代表大市值股票,小市值股票数量多但权重小,代表性不足。
- 三因子模型验证创业板市场收益结构,市场因子最重要,市值因子次之,账面市值比影响较弱。
- 使用“等权重全组合”替代创业板指数,提高板块整体收益解释度,更好反映小市值股票走势,但同时牺牲了部分市值信息。
- 市值因子收益率与组合收益率成正向线性关系,市值因子选股优势有明显时段性。
- 模型和因子作用具有显著时间依赖性及阶段性变化,建模需充分关注时效。
总的来说,该报告通过系统量化实证分析,揭示创业板指数与市值因子对股票收益率的作用机理及其局限性,为指数替代和量化投资策略提供理论和实证支持。[page::0,15]
---
三、图表深度解读
- 表1 创业板股票流通市值分布表(2019年数据)展示市值分段股票的占比差异,明显显示小市值股票数量多但市值占比较低,大市值少但占比大,支持指数偏向大市值的论点。
- 图1 创业板市值数量分布折线柱状图直观反映数量和市值的“肥尾”特征。
- 图2 累计收益对比表明大市值组合收益及指数走势相近,等权重及小市值组合则表现更优,间接说明市值权重调节对收益波动的影响。
- 图3 日均收益统计量表显示小市值组合平均收益最高,波动稍大。
- 表3 各模型拟合优度揭示三因子模型最高拟合能力,SMB因子解释力远大于HML,暗示市值重要性。
- 图4-7 系数t检验逻辑验证因子有效性,市场因子与市值因子普遍显著,账面市值比因子弱。
- 图8-11 市场基准替代拟合优度与t检验显示等权重组合替代创业板指数更合适,但双因子模型中信息有部分损失。
- 图12-15 市值因子收益及累积变化与IC走势表明市值因子的强弱随时间存在显著波动,小市值优势呈周期性。
- 图16 2016年10月后组合收益曲线趋向平缓,表明市值因子解释力减弱。
- 图17 长期(2010-2020)市值因子累计收益变化清晰分为多个阶段,体现市值因子周期性。
- 图18-19 替代指数拟合优度和检验通过率确认“等权重全组合”较创业板指数具有一定优势但无法完全替代。
所有图表精准支持论文核心论点,通过量化和统计指标为因子有效性和指数代表性提供严谨的实证基础。[page::2,3,4,7,8,9,10,11,12,13,14]
---
四、估值分析
本报告不涉及具体企业估值定价,而是通过因子模型对创业板指数及股票组合的收益率进行定量归因分析,主要采用CAPM及Fama-French三因子模型,结合回归拟合优度(R²)和系数统计显著性(t检验)评价模型解释能力。
- CAPM模型使用市场超额收益为单因子,评价β系数作为敏感度。
- Fama-French三因子模型基于市场因子加市值因子(SMB)和账面市值比因子(HML)构建多因子线性回归。
- 报告特别关注指标R²、系数的均值、标准差、最小最大值、显著性通过率等统计数据,对比单、双、三因子模型的解释效率。
- 无传统DCF或相对估值方法,因本报告聚焦因子对股票价格变动的统计解释。
在替代创业板指数的部分,报告通过回归拟合优度分析替代指数与板块股票收益率关联度,评估替代指数代表性与信息损失权衡。[page::5-10,14]
---
五、风险因素评估
报告最后以“附注”和“免责声明”部分提到风险提示,主要包括:
- 市场风险:株市波动风险,指数及组合收益的不可预测性。
- 模型假设风险:因子模型的时效性,因子解释力随市场环境变化而波动,模型可能失效。
- 指数代表性不足风险:创业板指数对小市值股票代表性不足,导致投资者可能面临信息不完整风险。
- 投资组合替代风险:等权重组合替代创业板指数虽有优势,但可能遗漏部分市值相关信息导致解释力下降。
- 合规和免责声明:本报告仅供参考,不构成投资建议,建议投资者咨询独立顾问。
风险提示客观提醒投资者量化因子模型依赖市场环境,指数代表性与替代方案选择应谨慎处理。报告未对风险缓解具体策略深入展开。[page::16]
---
六、批判性视角与细微差别
- 报告全面系统,但存在一些理应注意的细节和潜在限制:
1. 因子时效性强调强,但未具体明确有效因子作用周期的判定标准,仅以历史数据视觉判断为主。
2. HML因子弱势,是否与创业板成长性较强、账面价值波动大关系未深入讨论。
3. 指数替代结论虽然提升拟合度,但双因子下模型通过股票数明显下降,报告说明为“部分信息损失”,但未进一步量化该信息损失对投资决策的影响。
4. 流通市值和成交额绝对影响权重,可能导致小市值股票流动性风险未充分考虑,小市值组合尽管收益高但波动和交易成本未纳入模型。
5. 模型构建及投资组合重新平衡周期固定为22个交易日,未对调整频率敏感性做检验。
6. 报告强调创业板指数代表性不佳,但未提出具体优化指数选样或权重方案供参考。
7. 图表中IC指标计算方法相对简单,未深入探讨其它因子相关指标。
整体而言,报告论点稳健,数据充分,但仍可在细节层面加强对因子机制、模型稳定性、应用局限的解释深度。报告基于过去数据实证,未来预测风险仍需警惕模型过拟合及市场结构变化。
---
七、结论性综合
东海证券郑朝阳研究员发布的《创业板股票收益率相关分析》报告,基于2015年至2020年创业板市场数据,运用CAPM及Fama-French三因子模型实证分析,深入揭示创业板股票收益率的驱动因素和创业板指数的代表性不足:
- 创业板市场呈明显大市值股票集中流通市值、小市值股票数量多但权重小分布特征。该结构决定了创业板指数在选样和权重设计上偏重大市值,难以全面代表整体板块涨跌。
- 采用多因子模型验证显示,市场超额收益(MF)为主要解释因子,市值因子(SMB)具较强解释力,账面市值比因子(HML)贡献有限。
- 三因子模型拟合优度近89%,优于单因子和双因子,验证市场因子和市值因子对收益波动贡献最大。
- 指数替代方案中,等权重全组合因其增加小市值权重,在单因子模型下比创业板指数拟合度提升5%以上,更能反映中小市值股票表现。
- 市值因子的解释力具时效性,2016年10月后趋于震荡盘整,小市值股票未显示持续优势。因子收益与IC值指标同步验证了因子的周期性特征。
- 报告强调,因子模型在实际应用中须注意时间窗口选择,市场状态变动影响因子有效性,简单复制建模风险较大。
- 本报告为投资者及机构提供了创业板市场结构和收益驱动深刻理解,指数选样权重优化及量化投资策略设计提供依据和警示。
图表(表1、图1-19)数据直观而翔实地支持以上结论,特别是市值因子收益率曲线及指数与投资组合收益对比图,增强实证说服力。
综上,报告论断清晰、数据充实、方法严谨,对创业板市场特别关注了市值因子的作用及指数代表局限,提出了实际有价值的指数替代建议,同时提醒市场环境变化对模型应用的影响。该研究对量化投资研究实务和市场指数策略设计具有良好的借鉴意义。[page::0-15]
---
参考图片示例







---
以上为对《创业板股票收益率相关分析》报告的全面详尽剖析,涵盖报告内容结构、关键数据解读、模型方法评述、图表洞察及潜在风险因素,适用于金融研究、量化策略开发与市场指数分析的高级读者。