`

恼人的显著性检验:多因子模型中 T 值的计算

创建于 更新于

摘要

本报告系统介绍了多因子模型中普通最小二乘(OLS)、加权最小二乘(WLS)、带约束普通最小二乘(ROLS)及带约束加权最小二乘(RWLS)四类模型中回归系数的拟合值和t值计算方法,特别强调了剥离市场因子对行业因子t值显著性的影响。同时,报告剖析了A股市场风格因子的表现与指数风险预测,并展示了相关因子暴露度和指数收益归因的实证结果,为量化因子研究提供理论与实证支持[page::0][page::2][page::9][page::12][page::14][page::15][page::16].

速读内容


多因子模型中t值计算方法总结 [page::4][page::5][page::6][page::7][page::8][page::10]

  • 普通最小二乘(OLS):拟合系数为 $\hat{\beta}=(X'X)^{-1}X'Y$,t值计算基于系数方差 $\hat{\sigma}^2 (X'X)^{-1}$,自由度为T-K。

- 加权最小二乘(WLS):考虑异方差性,拟合系数为 $\hat{\beta}=(X'WX)^{-1}X'WY$,t值计算将残差平方和替换为加权残差平方和 $e'We$。
  • 带约束普通最小二乘(ROLS)和带约束加权最小二乘(RWLS):通过拉格朗日乘子法引入约束,系数拟合和方差通过增广矩阵的逆矩阵分块 $C_{11}$计算,t值公式类似。

- 图1显示股票市值平方根倒数权重与其特质收益波动率正相关,支持WLS中加权设置的合理性。



行业因子显著性检验实证分析 [page::9]


| 因子名称 | 带截距项t值显著比例 | 带截距项t值绝对值平均 | 不带截距项t值显著比例 | 不带截距项t值绝对值平均 |
|---------|--------------------|---------------------|----------------------|------------------------|
| 交通运输 | 37.50% | 1.93 | 72.92% | 6.16 |
| 传媒 | 36.81% | 2.13 | 70.14% | 4.28 |
| 医药 | 48.61% | 2.90 | 84.03% | 4.74 |
| 商贸零售 | 34.03% | 1.79 | 79.17% | 6.99 |
| … | … | … | … | … |
  • 剥离了市场收益后,行业因子的显著性明显降低,风格因子不受影响,提示行业分类需要进一步优化。


A股市场风格因子表现及指数风险预测 [page::11][page::12][page::13][page::14]

  • 上周沪深300成长和创业板综指数涨幅居前,价值指数表现相对落后。

- 主要风格因子Beta维持强势,规模、波动率等因子表现偏弱。
  • 图4和表2显示过去两周与上周纯风格因子收益存在一致性,Beta因子表现最佳。



  • 指数未来一个月年化波动率区间为19%-31%,中小板和成长类指数风险较大。




指数成分收益与因子暴露度归因分析 [page::15][page::16]

  • 表3显示上证50、沪深300成长和创业板指收益较好,暴露出较强的成长和Beta因子。

- 价值指数表现较弱,暴露度体现了风格分化,但整体市场风格尚不明朗。

量化因子构建及定义 [page::17]

  • 因子涵盖Beta、规模、动量、波动率、非线性规模、BP、市值流动性等,使用流通市值加权,数据预处理细致。

- 说明了因子计算期间的加权方式、缺失值处理及正交化方法,保证数据质量。

深度阅读

报告详尽分析——《恼人的显著性检验:多因子模型中 T 值的计算》



---

1. 元数据与概览



报告标题:恼人的显著性检验:多因子模型中 T 值的计算
作者:陶勤英(分析师),张宇(研究助理)
发布日期:2019年6月25日
发布机构:财通证券股份有限公司研究所
主题:多因子模型中回归系数的显著性检验,特别是带约束和加权最小二乘情况下的 t 值计算方法;同时涉及A股市场指数风险预测及风格解析。

核心论点聚焦于多因子模型中如何准确计算与解释回归系数的 t 值,避免因含市场收益的行业因子导致的显著性高估。报告系统地推导了传统OLS、加权最小二乘WLS、带约束OLS(ROLS)和加权带约束WLS(RWLS)回归模型中拟合系数的估计及其 t 检验方法,解决了多因子收益分解中自变量共线性及异方差的计量难题。此外,报告结合实证数据,揭示剥离市场收益对行业因子显著性的影响,提出行业分类优化的必要性。后半部分附带详细的A股市场风格因子表现及指数风险预测,逻辑严谨,内容详实。[page::0,2,4]

---

2. 逐节深度解读



2.1 恼人的显著性检验:多因子模型中 T 值的计算



2.1.1 古典回归模型基本假设(1.1节)


  • 线性假定、严格外生性、无完全共线、自变量间无自相关、同方差假定及残差正态分布构成了线性回归模型的基础。

- 报告强调带截距项与不带截距项的差异,特别提醒不带截距项模型的残差与自变量不一定正交,可能导致R²的异常表现。
  • 这些经典假设为OLS模型系数的无偏性及统计推断提供理论支撑。[page::2,3]


2.1.2 OLS模型系数估计与 t 值计算方法(1.2节)


  • 明确了OLS估计的解析解公式 \(\hat{\beta} = (X'X)^{-1}X'Y\),并推导出其无偏性与方差表达式 \(\sigma^2 (X'X)^{-1}\)。

- 由于总体扰动方差 \(\sigma^2\) 不可观测,通过样本残差平方和SSR调整自由度得到无偏方差估计 \(\hat{\sigma}^2 = \frac{e'e}{T-K}\)。
  • 由此构造 t 统计量,利用 t 分布自由度为 \(T-K\),支持对单一系数进行显著性检验。

- 该节对 t 统计量生成机理配合分布假定,阐明了统计检验的基础逻辑。 [page::4]

2.1.3 加权最小二乘WLS模型系数与 t 值计算(1.3节)


  • 异方差问题:针对大市值股票与小市值股票残差波动不齐的现象,引入权重矩阵 \(W\),构造加权最小二乘估计。

- 誉方差矩阵采用 \(\sigma^2 W^{-1}\) 形式,不同股票误差方差异质但无自相关。
  • 拟合系数估计表达为 \(\hat{\beta} = (X'WX)^{-1}X'WY\),估计方差为 \(\hat{\sigma}^2 (X'WX)^{-1}\)。

- 残差平方和SSR定义为加权形式 \(e'We\),保证估计符号准确及权重调整。
  • 图1清晰展示了市值平方根倒数权重与特质收益波动的正相关关系,说明WLS加权的合理依据。

- 该部分为实际量化模型中的异方差处理提供理论工具。 [page::5,6]

图1:股票市值平方根倒数权重与其特质收益波动率之间的关系

2.1.4 带约束的普通最小二乘ROLS模型(1.4节)


  • 完全共线性问题:行业因子与截距项完全相关,导致 \(X\) 矩阵不可逆,无法使用普通解析解。

- 利用拉格朗日乘子法带入线性约束 \(R \beta = r\) 转化优化问题,构造K+q维矩阵 \(C\) 求逆求解。
  • 系数的方差矩阵改写为 \(\sigma^2 C{11}\),其中 \(C{11}\) 是复合矩阵逆的左上角分块。

- 最终构建约束条件下的 t 值统计量,残差自由度调整保持不变。
  • 该方法为复杂多因子模型中处理约束问题提供实用数学框架。 [page::6,7]


2.1.5 带约束的加权最小二乘RWLS模型(1.5节)


  • 基于ROLS框架,进一步引入权重矩阵 \(W\),结合异方差性和线性约束的双重影响。

- 推导一致,系数估计 \(\hat{\beta}\)、方差矩阵形式延续ROLS结构,但带权重调整。
  • t 检验统计量同样基于矩阵 \(C^{-1}\) 分块且带权残差平方和评价。

- 理论完善了多因子模型在真实市场数据特征下的适用性。 [page::7,8]

2.1.6 实证分析与显著性检验(1.6节及1.9节)


  • 通过实证比较带截距项和不带截距项回归中行业及风格因子 t 值平均绝对值和显著比例。

- 结果表明剥离市场收益后,行业因子显著性明显下降,但风格因子显著性稳定。
  • 具体表现为不带截距模型中行业因子 t 值整体高出许多,存在高估误导风险。

- 数据提示行业分类可能存在偏差或不足,推动进一步细化研究提高行业因子解释力。
  • 实证部分为模型定性假设提供了强有力的现实验证支持。

- 相关详细数据见表1。 [page::9]

2.1.7 小结(1.7节)


  • 系统总结四种模型中系数及 t 值的解析表达式,列明残差平方和计算、方差估计等关键步骤。

- 明确计算流程、估计调整和显著性检验步骤,为用户提供明确操作指引。
  • 强调财通金工提供相关接口函数,便于实际模型构建与分析。 [page::10]


---

2.2 一周行情回顾(2节)


  • 受中美贸易缓和利好,上周沪深300成长指数涨5.74%,创业板综合指数涨5.66%,表现领先。

- 380价值指数与180价值指数涨幅3.47%、3.67%,相对落后。
  • 行业方面非银金融与计算机板块领先,农林牧渔、有色金属相对弱势。

- 图2和图3形象展示了指数和行业板块的周收益结构。 [page::11]

图2:上周主要指数收益(2019.6.14-2019.6.21)
图3:上周中信一级行业指数收益(2019.6.14-2019.6.21)

---

2.3 市场风格解析及指数风险预测(3节)



2.3.1 市场风格解析(3.1节)


  • 通过Beta、规模、动量、波动率、非线性规模、BP、流动性、盈利、成长、杠杆率等十大因子构建风格归因模型。

- 表2与图4分别展示过去两周及上周风格因子收益,发现Beta因子保持强势,其他因子表现平淡甚至负收益。
  • 图5与图6揭示了过去一个月风格因子的净值走势及累计收益,高Beta及长期动量表现较好,波动率因子则回撤显著。

- 这些动态说明市场短期风格偏好不均,Beta风险溢价依旧存在,但其余风格尚处于调整期。 [page::12,13]

图4:近两周纯风格因子收益比较(2019.6.6-2019.6.21)
图5:最近一个月风格因子净值走势(2019.5.21-2019.6.21)
图6:最近一个月风格因子累计收益(2019.5.21-2019.6.21)

2.3.2 指数风险预测(3.2节)


  • 利用多因子模型分解指数风险,包含共同因子风险及特质风险,基于Wind真实成分股权重估计未来一月市场指数的年化波动率。

- 图7揭示创业板及成长类指数风险偏高,偏大盘和价值指数风险较小,整体波动区间19%至31%,较上周明显缓解,市场趋于震荡格局。
  • 图8对各指数样本构成的覆盖比例做出详尽展示,样本覆盖率超过92%,保障风险测算的可靠性。

- 该预测对投资者风险管理与组合调整具有重要指导意义。 [page::14,15]

图7:财通金工样本指数未来一月波动预测(年化)(2019.6.21-2019.7.19)
图8:收益回归/风险预测样本股票占指数成分股比率

---

2.4 指数成分收益归因分析(4节)


  • 选取上周表现最好的沪深300成长、创业板综和上证50指数及表现最差的中证500价值、180价值、380价值指数进行因子暴露对比。

- 图9和图10的雷达图清晰说明,强势指数暴露于Beta、成长、动量因子较多,而落后指数则偏向价值因子。
  • 表3详细列示各指数在各类风格因子上的暴露度数值,辅助理解风格对收益的影响。

- 结果表明市场风格表现分化,同时也指出目前市场整体风格并不明朗,受消息面影响较大。 [page::15,16]

图9:上周表现最好三指数因子暴露度
图10:上周表现最差三指数因子暴露度

---

2.5 附录及因子定义(5节附录)


  • 对10类风格因子(Beta、规模、动量、波动率、非线性规模、估值流动性、盈利、成长、杠杆等)详细定义与计算方法进行了说明,包括半衰指数加权回归、各种窗口期及加权方案等。

- 质量控制措施如缺失值剔除及因子权重归一化也被严格执行,保证数据的准确性与代表性。
  • 因子构造的严谨性为报告前述回归估计提供了坚实基础。 [page::17]


---

3. 图表深度解读



3.1 图1:股票市值平方根倒数权重与其特质收益波动率的关系


  • 散点图显示随着市值平方根倒数权重的增加,特质收益波动率有明显上升趋势,验证了用市值作为残差波动的权重依据。

- 该统计关系是WLS加权权重确定的理论基础之一。

3.2 图2、图3:指数及行业周度收益表现柱状图


  • 图2展示沪深各指数涨幅排序,成长指数领跑,价值指数落后,显示市场资金偏好成长风格。

- 图3行业表现差异显著,非银金融和计算机板块涨幅居前,反映资金集中于金融与科技领域。

3.3 图4-6:风格因子收益与净值走势


  • 风格因子收益大致稳定,Beta因子表现最强,波动率、非线性规模等弱势。波动率因子在过去一月表现退潮明显。

- 净值走势图揭示因子表现的时间动态,具备较强的时间连续性分析价值。

3.4 图7:未来一月样本指数年化波动预测


  • 风险预期整体收窄,创业板等成长型指数的波动显著高于大盘,风险偏好分层明显。

- 该信息一方面可指导投资组合的风险管理,另一方面反映市场对未来波动的预期分布。

3.5 图8:样本覆盖率图


  • 大部分指数样本覆盖率超过92%以上,说明风格及风险模型估计的可靠性和代表性良好。


3.6 图9、图10:最佳与最差指数因子暴露雷达图


  • 呈现得分最高的成长与Beta组合与表现最差的价值股组合极大差异,形象说明了风格因子主导下的市场分化。


---

4. 估值分析


  • 本报告主要聚焦多因子回归和显著性统计方法,未进行传统意义上的企业估值,如DCF或P/E估值。

- 报告中的“估值”更贴近多因子风险收益模型的计量估计,即系数估计及方差的估计,和统计显著性检验。
  • 所以无传统估值内容。


---

5. 风险因素评估


  • 主要风险包括:

- 多因子模型中变量共线性导致参数无法估计;
- 异方差性影响回归系数估计的效率及显著性检验有效性;
- 行业因子显著性的高估问题,尤其是不剥离市场收益时;
- 因子分类存在的缺陷影响行业因子效能;
- 数据缺失或样本代表性不足问题可能干扰模型推断的准确性。
  • 报告通过带约束回归和加权最小二乘等数学工具降低了上述风险,且实证结果支持其有效性,并提醒关注行业划分优化。

- 风险提示中也明确历史表现不预示未来,且市场风格不确定可能导致模型失效。[page::0,9,14]

---

6. 批判性视角与细微差别


  • 报告在处理行业因子显著性高估问题时,逻辑严谨并有实证支持,展现了学术严谨态度。

- 但行业因子分类仍较粗糙,提示模型优化空间;需要进一步细化行业分类体系。
  • 报告未广泛讨论模型在极端行情下的稳健性,相关假设对市场震荡和极端波动可能影响有待深究。

- 报告依赖Wind等第三方数据,若数据质量出现异常,估计和推断可能受影响。
  • 多数公式推导未全详细证明,需用户具备一定统计背景方能完全理解。

- 报告自有接口函数尚未完全公开,限制了用户自助验证和应用范围。

总体来说,报告兼顾理论与实证,内容细致,但专业门槛较高,适合具备量化背景的专业投资研究人员。

---

7. 结论性综合



本报告以“烦人的显著性检验”为核心,针对多因子模型中系数及其 t 值的准确计算提供了极为详尽的理论与实证框架。通过比较普通最小二乘、加权最小二乘及其带约束版本,明确了在多重共线性与异方差条件下的参数估计与显著性检验方法。实证显示剥离市场收益后,行业因子显著性明显下降,但风格因子稳定,这对多因子模型的优化设计和解释能力提升有重要启示。

报告通过丰富的图表阐释了市值加权异方差的合理性,基于最新市场行情和指数走势进行了风险预测和市场风格分析,综合反映当前A股市场风格分化和风险结构。指数收益风格因子暴露的差异,尤其成长和价值板块的截然不同表现,进一步佐证了多因子模型的有效性与实用价值。

此外,报告附录详述因子构建方法和风险提示,保障研究的严谨性和投资应用的透明性。财通金工持续提供相关接口工具,方便研究者实际应用本系列方法。

综上,该研究深刻揭示了多因子统计显著性检验中的技术难题与解决方案,为定量投资者提供了一套切实可行的多因子模型系数显著性评估框架,具有重要的理论价值和实践意义。其对A股市场的近期风格演变及风险趋势具备权威解读功能,值得投资研究者和风险管理人员重点关注和借鉴。[page::0-17]

---

附件关键引用:


  • 表1:带截距项和不带截距项模型中行业及风格因子 t 值显著比例变化(见第9页)

- 图1(第6页):市值平方根倒数权重与特质收益波动率正相关
  • 图2、3(第11页):主要指数和行业板块周度收益排行

- 表2、图4(第12页):风格因子短期收益表现
  • 图5、6(第13页):风格因子净值走势和累计收益

- 图7(第14页):指数未来一月年化波动预测
  • 图8、9、10、表3(第15-16页):样本覆盖及指数因子暴露与收益归因信息

- 附录因子定义(第17页)

---

免责声明



本报告严格依据财通证券关于研究报告的合规标准编制,数据来自公开渠道,且附带明确风险提示。报告内容仅供参考,不构成具体投资建议,投资人应结合自身情况谨慎决策。 [page::18]

---

以上分析结构清晰,覆盖报告所有主要章节及图表,揭示报告核心逻辑与实证结论,适合量化研究人员与投资决策者深入理解和实际应用。

报告