非线性规模因子:A 股市场存在中市值效应吗?“拾穗”多因子系列报告(第 8 期)
创建于 更新于
摘要
本报告系统分析了非线性规模因子的三种计算方法及其有效性,通过纯因子组合、分组法和Fama-Macbeth检验验证非线性规模因子在A股市场的表现。实证显示非线性规模因子主要表现为负收益且波动较低,中市值股票普遍跑输大小市值股票。基于分组法构建的多空组合年化收益达22.16%,信息比率为2.71,且该因子的风险溢价不被其他因子所解释。报告指出中证1000指数并不代表市场最小市值股票,因此非线性规模因子在不同中小市值指数上的暴露相近合理。[page::0][page::6][page::9][page::12]
速读内容
非线性规模因子的定义与计算方法 [page::3][page::4][page::5]
- 主要包含三种计算方法:回归法(对数市值三次方回归),平方法(对数市值标准化后平方),及其结合版,实质上计算结果高度相关(相关系数0.87),无本质区别。
- 加截距项的回归残差能较好体现中市值效应的因子特征(呈抛物线形状),同时平方法简便且稳定。
非线性规模因子效能实证分析 [page::6][page::7][page::8]

- 通过纯因子组合法回测(2009-2019年),非线性规模纯因子组合净值走势为负,表明中市值股票常跑输大小市值。
- 分组法测试中,月均超额收益显示因子有效,因子多空组合月均收益1.58%,胜率72%。

| 指标 | IC | rankIC | 多头月均超额 | 空头月均超额 | 多空收益差 |
|----------------|--------|---------|--------------|--------------|------------|
| 均值 | -2.90% | -5.38% | 0.96% | -0.68% | 1.58% |
| 月胜率 | 35% | 29% | 73% | 32% | 72% |
| t值 | -5.55 | -6.00 | 6.35 | -4.29 | 6.52 |
- 多空对冲组合年化收益22.16%,年化波动8.17%,年化信息比率2.71,最大回撤21.2%。

非线性规模因子与其他风格因子的相关性及风险溢价 [page::9]

- 尽管做了中性化处理,非线性规模因子与市值和换手率仍存在明显暴露相关性。
- Fama-Macbeth回归中引入非线性规模因子后,因子风险溢价显著为负,t值-4.99,表明其溢价能力不可被现有因子解释。
| 因子 | 截距项 | SizeNL | BP | Turnover21 | Ret21 | Size | Vol21 | R平方 |
|----------------|-------|---------|---------|------------|---------|---------|--------|--------|
| 因子系数 | 2.00% | -0.30% | 0.10% | -0.79% | -0.45% | -0.67% | -0.03% | 9.78% |
| t值 | 2.38 | -4.99 | 0.91 | -7.02 | -3.98 | -3.95 | -0.44 | |
不同指数在非线性规模因子上的暴露及市场解读 [page::10][page::11]

- 大市值指数非线性规模因子为负,中市值指数(中证500)显示正暴露。
- 中证1000作为小市值指数,其非线性规模因子暴露较大,接近中证500。

- 中证1000并非市场最小市值股票的代表,成分股市值分布与中证500接近。
- 非线性规模因子形状近似抛物线但不对称,偏大市值一侧下降更快。
- 结论提醒投资者谨慎使用非线性规模因子捕捉中市值效应。[page::11]
一周行情回顾及市场风格解析 [page::13][page::14][page::15]

- 中小盘指数表现优于大盘,中证500价值指数和380价值指数涨幅领先。
- 行业板块中基础化工和建材涨幅领先,食品饮料和医药行业涨幅靠后。
- 上周市场更倾向于中小市值和高Beta股票,高规模因子股票表现相对弱势。

指数风险预测与成分归因 [page::16][page::17][page::18]

- 未来一个月样本指数波动年化预期区间22%-31%,市场维持相对稳定波动,投资者需注意风险。

- 表现在前列的中小盘指数在非线性规模因子上的正暴露显著,表现较差的指数则偏大规模股票,表现不佳。
深度阅读
报告名称与概览
- 报告标题:《非线性规模因子:A股市场存在中市值效应吗?》(“拾穗”多因子系列报告第8期)
- 作者与机构:陶勤英分析师、张宇研究助理,财通证券股份有限公司,2019年4月9日发布
- 报告主题:围绕非线性规模因子探讨A股市场是否存在中市值效应,涉及因子构建方法、资产定价有效性测试、指数风格解析与风险预测。
- 核心论点与结论:
- 非线性规模因子的两种计算方法(回归法和平方法)本质等同。
- 非线性规模因子收益呈现为负,表明中市值股票整体不能跑赢大小市值股票。
- 构建的非线性规模多空对冲组合表现优异,年化收益22.16%、波动率8.17%、信息比率2.71,显示强风险调整收益。
- Fama-Macbeth实证显示非线性规模因子具有独立溢价,能够解释横截面收益且不可被其他因子替代。
- 中证1000指数不完全代表市场上最小市值股票,其非线性规模暴露与中证500指数接近,因而“中市值”定义需谨慎。
- 报告侧重于量化多因子模型构建与市场行为解析,具有实务意义。[page::0,2,12]
分章详解
1. 非线性规模因子:A股市场存在中市值效应吗?
1.1 非线性规模因子的计算方法
- 定义背景:Barra USE3模型中非线性规模因子定义为对数市值的三次方;Barra CNE5模型以三次方对对数市值进行加权回归,回归残差作为非线性规模因子的代理。核心目的是捕捉中间市值股票的特殊表现,即中市值股票因子暴露最大,两端市值股票因子值较低。
- 三种计算方法详解:
1. 回归法(带截距项):将对数市值三次方对对数市值做带截距项加权最小二乘回归,取残差相反数作为因子值,使中市值股票因子值更大。图3(不带截距)展示回归残差未形成明显抛物线结构;图4(带截距)残差呈开口向下抛物线,符合中市值特性。
2. 平方法(平方项法):先对对数市值标准化,再取平方的相反数,得到的因子值与回归残差法高度一致(图5)。
3. 标准化三次方回归法:先对对数市值标准化,再对其三次方对标准化市值做回归,残差作为因子。此法实质结合前两法,结果无差异。
- 方法比较:三种方法在本质上无差异,回归法产生更宽的因子值跨度,平方法标准差较小(图6)。图7示意了不同处理方法产生的非线性规模暴露曲线,与中市值形成高度契合。
1.2 非线性规模因子的有效性检验
- 测试方法:报告采用纯因子组合法、分组法和Fama-Macbeth回归三种实证检验方法。
- 纯因子组合法实证:
- 图9显示2009-2019年规模纯因子与非线性规模纯因子组合均收获负收益,非线性规模组合波动性较低。
- 图10历年收益对比,规模因子在2008-2016年持续为负(小市值赢),2017年反转成为正收益;非线性规模因子多年均为负,波动性低于规模因子。
- 分组法:
- 将股票按非线性规模因子值排序,分10组构建多空组合(低因子值多头,高因子值空头);
- 图11显示,低因子值组月均超额收益达0.96%,高因子值组为-0.68%,因子排名相关性(-rankIC)为-5.38%,月胜率29%,多空组合月均收益1.58%,胜率72%,统计显著性强(表1);
- 多空对冲组合历史净值(图12)显示该组合自2017年回撤后2018年起持续上行,年化收益22.16%,年化波动率8.17%,信息比率2.71,最大回撤21.2%。
- 因子相关性分析:
- 图13显示分组后各组在其他因子如市值、换手率等的暴露均值,非线性规模因子虽做了中性化处理,但仍与市值存在明显关联。空头组合换手率高,负向收益受换手率因子强化。
- Fama-Macbeth检验:
- 同时对股票收益率用已知因子(市值、BP、换手率、反转、波动率)及加入非线性规模因子做多元线性回归(详见公式),推断各因子的风险溢价。
- 表2显示非线性规模因子的风险溢价显著为负(t值-4.99),且加入该因子后其他因子系数稳定,说明其为独立有效因子。图14显示非线性规模因子月度溢价持续为负。
- 结论:非线性规模因子显著有效,尽管收益为负,代表中市值效应在A股无获利优势,反而中市值因子越大股票未来收益越低。[page::3-10]
1.3 不同指数在非线性规模因子上的暴露
- 指数构成简介:
- 沪深300:市值大、流动性好股票300只;
- 中证500:剔除沪深300及总市值前300名股票后,总市值排名靠前的500只股票;
- 中证1000:剔除中证800成分股(沪深300+中证500)后,规模偏小且流动性较好的1000只股票。
- 非线性规模因子暴露:
- 图15显示大市值指数(上证50、沪深300等)非线性规模暴露为负;中市值指数(中证500)非线性规模暴露明显正;小市值代表中证1000非线性暴露同样偏高。
- 理论上,代表市场最小部分市值股票的中证1000应当非线性规模因子为负,与超大盘类似。但实际不符。
- 指数成分股市值分布差异:
- 图16展示三指数成分股对数市值及非线性规模因子值:
- 沪深300成分股分布于高市值区间;
- 中证500和中证1000成份股市值区间接近,且无交叉;
- 表明中证1000并非市值最小的全部股票,而是剔除了更小市值股票(极小市值股票或流动性差股票),所以其非线性规模暴露值和中证500类似。
- 非线性规模因子曲线两边非对称,偏大市值端因子值急剧下滑,偏小市值端下降较缓慢,暗示该因子不完全体现严格的抛物线结构。
- 总结:中证1000指数不代表市场市值最低端的股票,非线性规模因子在该指数暴露较高的现象合理,非线性规模因子是否精准代表中市值属性仍需商榷。[page::10-11]
1.4 小结
- 非线性规模因子计算方法多样但本质统一。
- 非线性规模因子组合收益为负,波动较小,中市值多头无超额收益。
- 对冲组合表现优异,风险调整收益高。
- Fama-Macbeth回归确认非线性规模因子独立有效。
- 中证1000指数非完全代表小市值股票,其非线性规模暴露同中证500相近合情合理。
- 提醒投资者关注指数成分构成差异带来的影响。[page::12]
2. 一周行情回顾(2019.3.29-2019.4.4)
- 上周A股稳中向好,4个交易日均正收益,中小盘指数强于大盘指数。
- 中证500价值指数涨7.48%,380价值指数涨7.47%,排名靠前,上证50和超大盘涨幅为4.00%、4.07%,表现较弱(图17)。
- 行业角度,基础化工和建材涨幅领先(约9%),食品饮料和医药表现较弱,涨幅在2-3%左右(图18)。[page::13]
3. 市场风格解析及指数风险预测
3.1 市场风格解析
- 基于Barra模型,选取Beta、规模、动量、波动率、非线性规模、BP、市值、流动性、盈利、成长、杠杆等因子进行收益-风险拆解。
- 上周风格组合收益日度和周度计算方法均得到类似结果(表3,图19),显示Beta因子表现强势,非线性规模因子略有反弹,动量因子承压回撤,市场偏好中小市值股票。
- 近一月风格净值及累计收益(图20-21)显示高Beta、前期涨幅大股票收益领先;大规模、高换手率、高波动率股票后续回撤明显。
3.2 指数风险预测
- 利用多因子模型将风险拆分为共同因子风险和特质风险,结合Wind权重数据计算未来一月指数波动率(年化)。
- 图22显示样本指数未来月度年化波动率范围22%-31%,整体波动与上周持平,中小板和成长类指数波动较大,大盘价值类波动较低。
- 图23显示各指数纳入模型的成份股数量及权重占比分别均在93%以上,模型拟合质量较好。[page::14-17]
4. 指数成分收益归因
- 对比上周表现最好三指数(如中证500价值、380价值、中小价值)与最差三指数(如超大盘、上证50等)因子暴露(图24、25)。
- 表4显示表现优异指数更依赖中小盘和非线性规模因子暴露,表现落后指数多暴露于规模因子,规模因子对收益产生拖累作用。
- 归因分析呼应市场风格解析结果,印证非线性规模因子与市场收益呈现显著联系。[page::17-18]
5. 附录
- 财通金工报告所用指数池详细列表(沪深及中证系各大指数)。
- 因子定义及计算方法详细说明,包括因子数据选取、加权方式和正交处理说明。
- 报告同时包括分析师承诺、公司资质、评级体系、免责声明等规范内容。[page::18-20]
图表深度解读
- 图1(主要指数近两周涨跌幅)
- 显示上周五个主要指数表现,中证500涨幅最高约9.6%,超过沪深300和中证1000,强调中市值指数临时走强。
- 支撑非线性规模因子研究需求与市场行为之间联系。[page::2]

- 图2(主要指数的年度涨跌幅2008-2019)
- 展示沪深300、中证500、中证1000历年涨跌幅变化,长期来看中证500走势居中,较沪深300、中证1000表现平庸。
- 反映中市值效应复杂且无压倒优势趋势。[page::3]

- 图3-4(回归残差+退截距项)
- 图3不带截距项残差与对数市值无抛物线;图4带截距项残差呈现中市值最大、两端市值较小的抛物线,符合预期。
- 说明回归模型时应包含截距项以确保因子合理性。[page::4]


- 图5(平方项法非线性规模因子与对数市值散点)
- 二次函数曲线,呈现开口向下型抛物线,与带截距回归残差图4极为相似,验证数学方法的等效性。
- 展示计算简便方法效果。[page::4]

- 图6(回归残差项与标准化后平方项散点)
- 两种方法因子值高度相关,相关系数0.87,分布稍有分段。
- 支持方法选择灵活性,便于模型构建。

- 图7(非线性规模因子处理示意图)
- 展示不同处理后规模因子暴露的对比,含回归残差(NLS)、标准化三次方(Size³)与标准化市值(Size)。
- 形象体现线性及非线性规模因子的差异。

- 图9(纯因子组合净值走势)
- 规模因子(蓝线)与非线性规模因子(红线)组合均见下滑,表明对应多头策略无正收益。
- 非线性规模因子表现较为稳健,波动率较低。

- 图10(历年收益对比)
- 规模因子在2017年后正向反转,非线性规模因子持续负收益。
- 体现两因子经济含义差异。

- 图11(分组法下每组超额收益)
- 明显的收益梯度,多头(低因子值)收益最高,空头最低,因子价差显著。

- 图12(多空对冲组合净值)
- 多空组合自2006年以来持续增长除2017年调整外,年化收益22.16%,风险适中。

- 图13(分组对其他因子得分)
- 非线性规模因子组间市值分布仍显著,高因子值组市值较大,高换手率组收益偏负。

- 图14(月度溢价及净值)
- 非线性规模月度溢价长期为负,累计净值下滑,支持因子负向溢价论断。

- 图15(各指数非线性规模因子暴露)
- 大盘指数非线性规模因子负暴露,中证500正暴露,中证1000暴露水平亦较高,明显偏离理论预期。

- 图16(指数成分股市值及非线性规模因子)
- 指数成分股市值分布及对应非线性规模因子展示,中证500与中证1000成分股市值分布近似但不重叠。
- 表明指数构成差异是暴露差异原因。

- 图17-18(上周指数与行业收益)
- 中小盘指数涨幅领先,基础化工、建材行业领涨,消费医药表现落后。


- 图19-21(风格因子收益及净值)
- Beta因子较强,动量回撤,规模高净值下跌,非线性规模略有反弹。
- 高Beta和过去涨幅股票相对占优,规模因子负收益明显。



- 图22(指数未来波动预测)
- 未来1个月指数年化波动22%-31%,中小板和成长类指数风险更大,大盘价值风险较低。

- 图23(回归样本占比)
- 各大指数用于回归的成分股数量及权重占比均超93%,保证样本完整性。

- 图24-25(表现最好与最差指数因子暴露)
- 表现最佳指数偏中小市值,非线性规模因子暴露高;表现最差指数规模因子暴露大,拖累收益。


估值分析
报告未涉及具体公司的估值或目标价,并无传统估值方法(如DCF、市盈率等)讨论,主要关注量化因子构建与回测有效性分析。
风险因素评估
- 报告明确提示统计结果基于历史数据,过去表现不代表未来,市场风格变化可能导致模型失效。
- 组合回测中观察到2017年明显回撤,揭示非线性规模因子短期表现可能波动较大。
- 风险预测部分说明尽管模型覆盖率高,但成分股剔除仍存在风险。
- 未详述缓解策略,主张保持谨慎乐观态度,密切关注市场波动。[page::0,8,12,16]
批判性视角与细微差别
- 报告在计算非线性规模因子时,强调回归模型中截距项重要性,展现的方法学严谨。
- 非线性规模因子虽有效,但组合收益为显著负收益,挑战市场上对中市值正溢价的普遍认知。
- 指数成分股构成差异对非线性规模暴露影响显著,中证1000不完全代表最小市值,使用时需警惕此性质变化。
- Fama-Macbeth回归显示非线性规模因子为独立因子,但负溢价的经济解释尚未深入,存在学术与实务待解难点。
- 分组测试显示因子与市值、换手率存在较强关联,可能引发多重共线性问题,报告建议关注多因子正交处理。
- 报告内部逻辑连贯,结构严谨,数据详实,但未对非线性规模因子的经济机理做深入讨论,若能补足该点将更全面。
结论性综合
本报告聚焦A股市场非线性规模因子的计算与有效性验证,系统展示了采用回归法与平方法两种数学方法均能有效捕捉中市值特征。实证结果表明,虽然非线性规模因子能够作为独立有效因子存在,且多空对冲组合实现高风险调整收益,但该因子对应的中市值股票在历史上整体获得负收益,未能跑赢大小市值股票,反映中市值效应在A股表现为负溢价。
特别是,报告深入探讨了代表小市值股票的中证1000指数,结论显示它并非真正的最小市值股票集合,而是规模及流动性偏小股票的子集,与中证500指数成分股市值分布相近,这解释了两指数非线性规模因子暴露值接近的现象。指数构成差异提示投资者在横向比较因子暴露时需审慎理解指数的成分定义。
市场风格解析部分展示近期市场风格偏向中小市值及高Beta股票,动量因子则表现较弱。指数风险预测表明当前波动保持相对稳定,未来一个月年化波动率介于22%-31%,其中中小板及成长板块风险较高。
收益归因分析凸显中小盘指数及中证500价值等指数因非线性规模因子暴露较高、表现领先,而大盘指数因规模因子暴露偏大收益受拖累,印证因子与市场表现的内在联系。
报告方法详尽、数据详实,展示了非线性规模因子在A股的统计及经济特征,为量化投资者理解中市值效应提供有益参考,同时提醒因子投资者关注指数成分构成及因子经济内涵的重要性,兼具理论探讨与实践指导价值。[page::0-20]
---
以上为该报告的详尽分析,涵盖主要论点、方法解析、数据图表解读、实证结论、风险提示及研究潜在局限,严格依据原文内容并标明页码。