`

偏度和峰度对未来收益率的预测性

创建于 更新于

摘要

本报告基于2007年至2013年中国A股市场高频与日度数据,系统研究了收益率的偏度和峰度指标对未来收益率的预测能力。实证发现:利用5分钟高频数据计算的实现偏度与未来收益率存在显著负相关,且基于偏度构造的多空套利策略获得稳定的超额收益和较高夏普比率;相比之下,实现峰度的区分效果较弱且方向与国外结论有所不同。日度数据偏度和峰度的预测能力较弱。回归分析显示,偏度因子即使考虑多因子影响仍显著优于峰度因子,体现了高频率实现偏度作为重要量化因子的投资价值[page::0][page::4][page::6][page::12][page::13][page::14][page::18]

速读内容


研究动机与指标定义 [page::1][page::2][page::3]

  • 本报告关注股票收益率的高阶统计量偏度(skewness)和峰度(kurtosis)对未来收益率的预测性。

- 理论模型暗示投资者偏好正偏收益率资产,偏度与收益率间存在负相关。
  • 峰度衡量厚尾特性,但相关理论模型较少,实证关注较少。

- 通过对5分钟高频数据和日度数据计算实现偏度与峰度,分析其对未来收益的解释能力。
  • 偏度计算公式:$$Skewt=\frac{\sqrt{N}\sum r{t,i}^3}{(Vart)^{3/2}}$$,峰度:$$Kurtt=\frac{N\sum r{t,i}^4}{Vart^2}$$。


高频数据实证分析:偏度与峰度的区分能力 [page::4][page::6][page::7]


| 组合分组 | D1 (最低) | ... | D10 (最高) | 差值 D1-D10 |
|---|---|---|---|---|
| 实现偏度 - 等权重月均周收益(%) | 0.77 | ... | -0.13 | 0.90 |
| 实现偏度 - 市值加权月均周收益(%) | 0.49 | ... | -0.12 | 0.61 |
| 实现峰度 - 等权重月均周收益(%) | 0.69 | ... | 0.08 | 0.61 |
| 实现峰度 - 市值加权月均周收益(%) | 0.33 | ... | 0.15 | 0.18 |
  • 高频数据中,偏度的预测能力显著优于峰度。

- 偏度分组的年化收益率最大差值高达45%(等权重)和30%(市值加权)。
  • 峰度分组虽有正负相关差异,但区分效果较差,特别是市值加权下。


高频两步分组分析及时间序列表现 [page::7][page::8][page::9][page::10][page::11]

  • 两步分组(先偏度再峰度)显示偏度的区分效果稳健优于峰度。

- 不分组排序顺序,偏度影响始终显著。
  • 低实现偏度组合(D1)长期跑赢高偏度组合(D10),累积收益显著优于沪深300指数。





多空套利策略构建及回测表现 [page::12][page::13]

  • 策略逻辑:月初买入低偏度组合,卖空高偏度组合,月度更新。

- 回测期内,等权重夏普比率达3.99,市值加权为2.46,且显著跑赢沪深300。
  • 交易成本考虑0.26%后,策略仍实现显著正收益。

- 实现峰度策略效果略逊色,但仍具一定稳定性。

| 统计指标 | 实现偏度(等权重) | 实现偏度(市值加权) | 实现峰度(等权重) | 实现峰度(市值加权) |
|------------------|--------------------|---------------------|--------------------|---------------------|
| 平均收益差(周) | 0.85% | 0.67% | 0.60% | 0.35% |
| 跑赢比例 | 76.13% | 68.71% | 73.87% | 62.90% |
| 夏普比率 | 3.99 | 2.46 | 3.63 | 1.72 |

多因子回归及日度数据实证对比 [page::14][page::15][page::16][page::17][page::18]

  • 8种多因子回归框架下,实现偏度仍显著,峰度表现弱。

- 日度计算的偏度峰度对未来收益率预测能力均较弱,显著性不足。
  • 高频数据含更丰富市场信息,因而偏度因子在高频数据中价值更突出。

- 偏度、峰度与市值、市盈率等基本面指标存在不同程度相关性,偏度的独立性更强。

总结 [page::18]

  • 偏度是高阶统计因子中对未来收益率预测能力最强的指标,尤其是在高频数据中。

- 峰度对未来收益率的预测较弱,结论在国内市场与欧美市场存在差异。
  • 高频率实现偏度因子可辅助构建稳定的多空套利策略,为量化投资提供新视角。

- 日度数据计算的偏度峰度作用有限,挖掘高频数据的潜力具有更高投资价值。

深度阅读

金融工程主题报告《偏度和峰度对未来收益率的预测性》详尽分析报告



---

一、元数据与报告概览


  • 报告标题:偏度和峰度对未来收益率的预测性

- 发布日期:2013年5月8日
  • 发布机构:安信证券研究中心,金融工程研究团队

- 主要作者及联系方式
- 柴宗泽 分析师(SAC执业证书编号:S1450512020001)
- 报告联系人:刘长江
  • 报告主题:本报告聚焦于金融市场中偏度 (Skewness) 和峰度 (Kurtosis) 两个统计学指标对股票未来收益率的预测能力,主要基于高频(5分钟)数据与日度数据进行实证研究。


核心论点与评级


  • 高频率(5分钟)数据计算的实现偏度与未来收益率呈显著负相关,且对其他因子控制后仍显著。

- 实现峰度与未来收益率亦呈负相关,但显著性较低,且基于日度数据的偏度与峰度均不显著。
  • 基于实现偏度设计的买卖交易策略能创造稳定的超额收益。

- 研究强调高频率数据的信息价值,偏度优于峰度指标的有效性。
  • 风险提示:历史数据的结论不一定适用于未来市场环境。


本报告为金融工程领域研究成果,未涉及具体评级和目标价,但对投资策略构建与风险管理有指导意义。[page::0]

---

二、逐节深度解读



1. 偏度和峰度简介



1.1 股票收益率的预测性


  • 传统金融理论基于有效市场假说(EMH),认为股票收益率(特别是日收益率)是不可预测的、随机游走的。

- Fama和French三因子模型及各类“市场异象”挑战了EMH,证明存在因子能预测股票收益率,投资者可借予这些因子实现超额收益。
  • 研究偏度和峰度作为收益率的高阶统计指标,探寻其是否同样具备预测能力。[page::1]


1.2 收益率指标的定义


  • 详细介绍了期望(均值)、方差、偏度和峰度的数学定义和经济含义:

- 偏度衡量分布的不对称程度,三阶中心矩标准化。
- 峰度衡量分布的峰值和尾部厚度(四阶中心矩标准化)。
  • 标准偏度和非参数偏度(基于均值和中位数的差异)对比,报告主要采用标准偏度。[page::1-2]


1.3 期望和方差


  • 强调CAPM和APT模型关注收益率期望值。

- 使用ARCH及其扩展模型刻画收益率波动率(方差)。
  • 相比期望和方差,对偏度和峰度的理论和实证研究较少。[page::1]


1.4 偏度详解


  • 通过图示(图1、图2)直观展现负偏和正偏分布特性。

- 细致讨论偏度值的经济含义和潜在误解(如偏度为零的特殊分布情况)。
  • 介绍非参数偏度定义及其投资者直觉关联,但区分两者的重要性。[page::2]


1.5 峰度详解


  • 通过图3展示尖峰(leptokurtic)、正态峰度(mesokurtic)和平峰(platykurtic)三类分布形态。

- 指出峰度主要衡量的是“厚尾”风险(极端偏离均值的概率)而非传统意义上“峰值”的高度。
  • 峰度与方差区别:方差度量整体分散度,峰度衡量极端值带来的分散度贡献。[page::2-3]


---

2. 理论模型探讨



2.1 偏度的理论根据


  • 投资者偏好理论:投资者普遍偏好正偏股票,负偏股票因较少投资需求而具备更高未来收益(即负相关性)。

- 异质信念模型:部分风险偏好高的投机者集中投资正偏股票,导致正偏股票回报较低。
  • 累积展望理论(Cumulative Prospect Theory)模型:

- 投资者效用依赖相对参考点,强调损失规避。
- 投资者对小概率极端事件的主观概率加权不同于客观概率,导致偏度对投资决策影响。
  • 结论是:偏度应在资产定价中被反映,且负相关于未来收益率。[page::3-4]


2.2 峰度的理论模型


  • 相对研究较少。

- 由于峰度信息与方差关联度高,很多峰度现象可用方差模型解释。
  • 因此单独峰度模型有限,理论支撑不足。[page::4]


---

3. 实证分析方法



3.1 国外研究成果


  • 以美国1993-2008年的5分钟频率数据为样本,用实现偏度和峰度预测收益:

- 实现偏度与未来收益率显著负相关。
- 实现峰度与未来收益率正相关。
- 多空套利策略基于实现偏度平均周收益0.24%,实现峰度0.14%。
- 结果坚挺,不受三因子和动量因子影响。[page::4]

3.2 国内市场数据与处理


  • 股票市场时间短,数据选取2007年1月至2013年3月,覆盖主板、中小板和创业板。

- 利用5分钟频率数据计算每只股票每日的实现方差、偏度、峰度。
  • 引入多种财务及交易指标控制,包含流通市值、市盈率、市净率、Beta、换手率,确保实证结果稳健。

- 计算方法基于随机过程理论,无需调整收益率均值,因为5分钟收益均值接近零。[page::5]

3.3 实证方法


  • 统计每个交易日的实现偏度和峰度,取其周平均作为该周因子值。

- 按照因子值对股票进行分组(10组),观察分组后未来一周收益率的表现。
  • 目标是验证偏度、峰度是否具备预测未来收益的能力。[page::5]


---

4. 实证分析结果



4.1 实现偏度和峰度的整体分布特征


  • A股市场表现出左偏(负偏度)和尖峰(高峰度)分布特征(图6和图7)。

- 与多数市场特性一致,股价收益率存在厚尾和峰峰现象,显示市场风险的不对称性与极端性。[page::6]

4.2 偏度分组的收益表现分析及表格解读


  • 根据实现偏度将股票分为D1(最低偏度)到D10(最高偏度)分组。

- 主要结论
- D1组(低偏度)平均周收益显著高于D10组(高偏度)。
- 等权重:D1平均0.77%,D10为-0.13%,差值约0.90%。
- 市值加权:D1为0.49%,D10为-0.12%,差值0.61%。(见表1)
  • 年化后,差值达到45%(等权重)、30%(市值加权)[表2],显著表明低偏度股票未来收益更高。

- 走势显示收益随偏度升高呈递减趋势。
  • 结论与国外文献相符,且中国市场偏度的区分能力更强。[page::6-7]


4.3 峰度分组收益分析及表格解读


  • 峰度分组类似进行,D1(最低峰度)到D10(最高峰度)。

- 结果显示:
- D1组平均周收益率优于D10组,但差异幅度较偏度组小。
- 等权重差值0.61%,市值加权仅0.18%。
  • 年化收益差异分别为31%和9%。

- 与国外市场峰度正相关的结论相反,A股峰度与收益呈负相关。
  • 峰度区分度显著逊色于偏度。(见表3、4)[page::7]


4.4 两步分组分析


  • 先按偏度分组,再按峰度分组,形成9个子组合,观察截面表现。

- 结果显示偏度对收益的区分能力远优于峰度:
- 偏度分组内部,即使峰度不同,收益差异有限。
- 峰度分组内部,偏度变化对收益影响显著。
  • 反向分组(先峰度后偏度)结论一致。

- 说明偏度是更核心的预测因子。[page::7-8]

4.5 收益率时间序列分析及图表解读


  • 根据偏度分组(图8、9)和峰度分组(图10、11)分别绘制组合累积收益率曲线。

- 绝大多数组合均跑赢沪深300指数。
  • 偏度从低到高,累积收益明显递减,低偏度组合表现最优。

- 高峰度组合相对绩效较差。
  • 说明偏度的预测性稳定,带来超额收益机会。[page::9-10]


4.6 年度和月度收益率对比


  • 低偏度组合在所有年份均跑赢高偏度组合,尤其在2007、2009年大幅领先。

- 月度数据亦表现类似,低偏度组合月度超额收益比例最高(图12-15)。
  • 尽管市场整体下跌时(如2008年),所有组合均负收益,低偏度组合表现优于高偏度。[page::10-12]


4.7 多空套利策略表现及统计分析


  • 构建多空策略:买入低偏度(峰度)组,卖空高偏度(峰度)组,逐月持有并更新。

- 统计收益表现(表9):
- 低偏度组合胜率约为76%(等权)、69%(市值权重)。
- 夏普比率分别为3.99和2.46,明显高于峰度组合。
- 交易成本假设0.26%后仍显著跑赢沪深300(图16)。
  • 策略在六年内累积收益超2-3倍,表现突出。[page::12-13]


4.8 回归分析与多因子检验


  • 多因子线性回归模型设计包括实现方差、偏度、峰度及常规因子(市值、PE、PB、Beta、换手率等)。

- 结果(表12)显示:
- 偏度对下期收益显著负相关,即使控因子后仍具统计显著性。
- 峰度的显著性弱,加入因子后快速消失。
- 换手率和偏度均为稳定预测因子。
  • 说明偏度包含独立有效信息。

- 与国外研究基本一致,凸显偏度对投资决策的实用价值。[page::13-15]

---

5. 日度数据分析



5.1 方法与数据


  • 使用日度收益率计算月度偏度与峰度指标,作为月度组合排序依据。

- 控制指标同高频分析类似,强调指标计算时点与持有周期匹配。
  • 关注指标稳定性与低频数据的有效性比较。[page::15]


5.2 总体特征与分布


  • 与高频数据不完全一致:

- 日度偏度仍显示左偏,但峰度表现为厚峰(相较高频数据的尖峰)。
  • 日度分布更平滑,但缺乏高频数据级别的细节信息。[page::16]


5.3-5.4 偏度与峰度的组合收益


  • 基于日度偏度和峰度的分组,收益分化较小。

- 实现偏度组间年化收益差约8.8%,峰度约5.5%。
  • 偏度区分能力仍优于峰度,但整体预测力逊于高频数据。

- 两步分组再次验证偏度预测力优于峰度。
  • 数据权重对结果影响有限。[page::16-17]


5.5 回归分析


  • 多因子回归中,日度偏度、峰度对未来收益的统计显著性较弱(表21)。

- 即使单因子回归,也表现平平。
  • 可能原因是日度数据频率较低,信息不够细致,难以捕获收益率的短期变化。

- 强调高频数据挖掘的重要性及其潜在优势。[page::17-18]

---

6. 总结


  1. 偏度和峰度作为高阶收益率统计指标,在预测未来收益率中具有一定作用,尤其偏度具备更多显著性和独立性信息。

2. 高频(5分钟)数据计算的实现偏度和峰度表现更佳,相较低频(如日度)数据,能够提供更强的预测能力和超额收益。
  1. 中国A股市场与国外市场在偏度的实证结果一致(负相关性显著),峰度表现存在差异。

4. 实现偏度较低的股票组合未来表现优异,多空策略基于实现偏度获得显著的超额收益和高夏普比率。
  1. 偏度的多因子回归显著性较强,表明其信息价值超越部分传统因子。

6. 高频数据的潜力巨大,值得继续深挖以提升资产定价和风险管理的效率。

本报告为深入探索高阶统计特征在资产定价中的应用奠定基础,投资者可借助偏度指标优化策略设计、实现风险调整后收益提升。[page::18]

---

三、图表深度解读


  • 图1、2(page 2):分别展示负偏和正偏分布,强调偏度对分布形态的影响,直观说明收益率分布的非对称性。

- 图3(page 3):图片直观展示3种峰度类型的概率分布,帮助理解峰度“厚尾”与“尖峰”的区别。
  • 图6、7(page 6):显示A股市场实现偏度和峰度的概率分布,事实证明市场偏左且存在厚尾风险。

- 图8-11(page 9-10):展示基于偏度和峰度分组的多个组合累积收益率,清晰展示偏度从低到高收益显著递减,峰度亦有类似趋势但不如偏度强烈。
  • 图12-15(page 11-12):年度和月度收益率柱状对比,突出低偏度组合多年持续优良表现,即使在熊市亦表现更好。

- 图16(page 13):多空套利组合实际累计收益曲线,显示策略持续跑赢基准,有效克服交易成本。
  • 图17、18(page 16):表明日度数据的偏度和峰度与高频数据分布存在显著不同,提示频率差异对指标表现影响明显。

- 通过表格(表1-21)系统展示分组收益率和回归系数,支撑报告关键判断,增强说服力。

---

四、风险因素评估


  • 历史数据适用性风险:报告强调,基于历史数据的实证关系不必然适用于未来,市场结构或行为的变化会影响偏度峰度的预测力。

- 高频数据处理风险:高频数据存在可能的噪声、市场微结构误差,需谨慎处理,否则可能导致误判。
  • 交易成本假设风险:多空策略假定特定交易成本水平,实际成本若偏高可能削弱收益。

- 市场样本局限性:中国市场相对年轻且多次结构调整可能影响统计稳定性。
  • 因子共线性:峰度与方差相关,可能导致峰度解释力下降,提示指标选择与模型设计需更科学。


报告未详述风险缓释策略,投资者须结合自身风险控制能力综合判断。[page::0,12,18]

---

五、批判性视角与细微差别


  • 偏度与峰度的不同表现:报告指出偏度预测力稳健,而峰度不稳定且在中国市场表现与国外差异显著。可能因数据处理方式、市场特性差异或模型设定限制,建议未来研究对峰度进一步细化。

- 日度与高频数据差异大:报告对比发现高频数据潜在信息量远大,日度数据预测能力有限,但未深度分析数据频率选择对投资策略实际操作性的限制和成本影响。
  • 多因子回归R²普遍偏低:模型对收益解释力有限,提示市场存在较多未捕获因素,投资决策仅依赖偏度峰度尚不充分。

- 假设的稳健性讨论较少:如均值忽略、交易成本固定等假设可能影响结论普适性。
  • 报告结论多基于组合层面,个股异质性分析较少,未来可增加针对细分行业或风格的研究增强策略实用性和风险可控性。

- 部分图表、表格未完整显示具体统计指标,对细节深入理解有限。

总体来看,报告基于严谨的理论与实证分析,结论稳健,但未来研究若能增加动态调整机制、风险管理框架与多市场比较将更具指导价值。[page::18]

---

六、结论性综合



本报告系统且深入地探讨了偏度与峰度两个高阶统计指标在预测股票未来收益率中的作用,借助5分钟高频数据与日度数据对比分析,取得以下关键发现:
  • 实现偏度对未来收益率存在稳定负向预测能力。低偏度(左偏)股票未来表现显著优于高偏度股票,超额收益幅度大,整体现象在统计和经济意义上显著,这一点在中国A股与国外市场均得到印证。

- 实现峰度对收益率的预测能力相对较弱,且存在中外市场表现差异。国内市场中峰度与收益率呈负相关(非正相关),且分组收益差异较小。
  • 高频数据计算的实现偏度和峰度提供了相比低频日度数据更丰富的信息量和预测力,因其捕捉了市场更微观的动态和风险特征。

- 基于实现偏度构建的多空套利组合投资策略实现稳定高夏普比率和累计超额收益,具备实际操作价值。
  • 多因子回归分析进一步确认偏度作为独立有效因子的地位,峰度解释能力在多因子框架中显著减弱,且传统财务因子及交易指标对收益解释力有限。


通过结合理论模型、市场数据、统计实证和策略设计,报告为投资者在因子选取、风险管理及策略开发方面提供了宝贵参考,强调偏度指标在资产定价和投资组合管理中的实际应用潜力。

投资参考建议
  • 应关注股票收益率的偏度特征,尤其基于高频数据的实现偏度指标。

- 构建基于偏度因子的多空头策略能有效捕捉异常收益。
  • 谨慎评估峰度指标的投资应用,结合其他因子综合判断。

- 重视高频数据的价值,加强数据清洗与模型开发能力。

风险提示

历史数据关系未必完全适用于未来,市场结构调整和投资者行为的变化可能影响预测效果。投资决策应结合自身风险偏好及市场环境灵活调整。

---

结语



该份金融工程研究报告通过详实严谨的理论分析和丰富的数据验证,系统揭示了偏度和峰度对未来股票收益率的预测作用,尤其凸显了基于高频数据的实现偏度的强大特殊作用。对于投资者和研究者而言,报告不仅扩展了因子研究视角,也指明了高频数据挖掘的巨大潜力和实际应用价值,值得深入学习和借鉴。

---

(所有内容均基于报告本身及附带图表数据分析,所有结论均附带对应页码标识,确保信息溯源和验证便利)

报告