`

基于价格数据的指数波动率预测

创建于 更新于

摘要

本报告以沪深300与中证500指数为标的,研究基于历史波动率的指数月度波动率预测,比较技术分析和GARCH系列模型,确定38天窗口作为历史波动率的最优参数。技术指标PLS模型预测胜率46%-55%,预测偏差0.086-0.097。GARCH模型中,GARCH-M胜率最高达72%,但存在极端预测。结合三种GARCH模型预测方向和数值,提升波动率预测精度,为市场波动性分析提供参考 [page::0][page::5][page::17]

速读内容


波动率刻画与历史波动率参数确定 [page::3][page::4][page::5]

  • 波动率分为历史波动率、预测波动率和隐含波动率,隐含波动率反映市场对未来波动的预期。

- 通过比较上证50指数38天窗口的月度历史波动率与iVIX月均隐含波动率,38天窗口下均方误差最小,作为标准波动率参数。
  • 图1展示了上证50ETF 20日移动窗口波动率估计序列。

  • 表1详细展示不同窗口下历史波动率与隐含波动率的均方误差。


技术分析方法下的波动率预测 [page::6][page::7][page::8][page::9]

  • 采用31种仅用收盘价的动量与反转类技术指标,优化参数最大化预测胜率。

- 样本内最高胜率指标为MICD(58%)、TEMA、RCCD、HULLMA (均为57%)。
  • 采用PLS回归结合上述4指标,样本外胜率沪深300为46%,中证500为55%,预测偏差分别为0.086和0.097。

- 图3、图4显示PLS预测与实际波动率趋势对比。



GARCH系列模型构建与预测效果对比 [page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17]

  • GARCH模型采用AR(1)-GARCH(1,1)框架,滚动预测窗口K参数经样本内调优。

- GARCH预测性能优于技术分析,样本外胜率沪深300达66%,中证500为66%,预测偏差更低。
  • GARCH-M包含波动率对收益率影响,样本外胜率最高可达72%,但波动率预测极端值较多。

- EGARCH模型考虑波动的非对称性,样本外胜率约61%-66%,预测偏差适中。
  • 各模型预测对应波动率曲线对比如图5-13。






GARCH模型预测性能比较汇总 [page::17]


| 方法 | 预测胜率 | 预测偏差 |
|---------|----------|----------|
| GARCH | 66.1% | 0.066 |
| GARCH-M | 71.9% | 0.087 |
| EGARCH | 66.5% | 0.076 |
  • 建议结合使用,GARCH-M用于波动率方向判断,GARCH和EGARCH用于数值预测。


风险提示 [page::0][page::17]

  • 预测模型基于历史数据统计规律,存在不确定性及极端事件风险,报告不构成投资建议。

深度阅读

报告深度分析报告——《基于价格数据的指数波动率预测》



---

一、元数据与概览



报告标题:《基于价格数据的指数波动率预测》
作者及分析师:张超国、罗军国等广发证券研究中心团队成员
发布机构:广发证券发展研究中心
发布日期:未标明具体发布日期,但内容数据截止至2021年
研究主题
  • 通过历史价格数据预测沪深300指数与中证500指数的未来波动率

- 研究波动率的刻画方式及基于技术指标和GARCH模型的预测方法
  • 对比不同模型的预测效果、评估其优劣与适用性


核心论点与评级
  • 传统的历史波动率和隐含波动率反映的是过去和当前市场状况,不能准确代表未来波动率。未来波动率的有效预测对于资产定价和风险管理尤为关键。

- 本文基于38天窗口的历史波动率参数,研究了两类不同预测思路:基于技术分析指标的偏最小二乘回归(PLS)模型与经典的GARCH系列模型。
  • 结论表明,GARCH模型整体优于技术分析方法,尤其是GARCH-M模型在预测方向胜率上表现突出,三种GARCH模型可结合使用以提升预测的稳定性和准确性。

- 该研究仅基于历史统计特征,存在市场不确定性,报告不作投资建议。

---

二、逐节深度解读



1. 波动率的刻画(第3-6页)



(一)波动率刻画方式

  • 定义了波动率三种常用类型:历史波动率(基于历史收益率标准差)、隐含波动率(基于期权市场价格反推出的预期波动率)、预测波动率(未来波动率的预期)。其中预测波动率更具实用价值,但预测难度较大。

- 介绍历史波动率计算方法:计算固定窗口内收益率的标准差并做年化调整。
  • 隐含波动率通过Black-Scholes期权定价模型反解,反映市场对未来波动的预期,更为“市场化”。


(二)历史波动率的算法

  • 采用移动窗口估计法,每一时刻计算过去τ日收益率标准差。

- 举例采用上证50ETF日数据,τ=20,获得波动率的时间序列(图1)。该序列自相关性较强,因此通过打散取低频估计(每20个交易日估计一次),减少样本重叠。

(三)选择历史波动率参数

  • 通过比较不同窗口长度的历史波动率与中国波指iVIX的均方误差(MSE),确定最优窗口长度为38天,且选用月均iVIX(开盘价与收盘价均值)作为隐含波动率定义。

- 表1展示从15到40天窗口对比结果,38天窗口对应的MSE最低(0.0038),说明38天历史波动率最能反映当月平均波动率。
  • 图2直观比较38天历史波动率与iVIX走势,二者趋势基本一致,表明该窗口参数选择有效。


2. 月度波动率预测:技术分析方法(第6-9页)



(一)数据获取与划分

  • 选取沪深300和中证500指数日数据2005.3-2021.10(约200个月)。前100个月为样本内用于模型训练与技术指标参数优化,后100个月作为样本外检验预测准确性。

- 每月末计算38天历史波动率序列,用于模型构建与预测。

(二)指标计算与优化

  • 像传统技术分析中大量指标无法使用(多用价量数据),本研究选取仅基于收盘价的31个动量和反转类指标(表2)。

- 对每种指标在样本内进行参数优化,目标是最大化预测方向的胜率。
  • 表3展示样本内最优技术指标胜率,MICD最优(58%),其次是TEMA、RCCD、HULLMA(均57%)。这些指标被选为PLS回归模型的自变量。


(三)预测模型说明

  • 采用偏最小二乘法(PLS)回归,通过综合提取技术指标最有解释力的成分,克服多重共线性,对未来波动率构建线性预测模型。

- PLS结合主成分分析,适合处理多变量的回归问题,尤其在技术指标间相关度高的场景下表现优异。
  • 模型目标是使用选定的四个指标数据预测下一月的波动率均值。


(四)预测结果

  • 样本外测试中,沪深300的预测方向胜率为46%,偏差0.086,中证500的胜率55%,偏差0.097(表4)。

- 图3与图4分别展示沪深300和中证500样本外波动率预测趋势,PLS预测波动率曲线能部分捕捉波动率峰谷,但波动率被低估且预测波动性偏小。
  • 说明技术分析基于收盘价的指标对波动率预测有效性有限,特别是在高波动市场阶段表现不足。


3. 月度波动率预测:GARCH方法(第10-16页)



(一)GARCH模型

  • 介绍GARCH基础理论,模型通过过去波动率滞后项和收益残差进行条件方差建模,适应金融时间序列的波动聚集特征。

- 具体采用AR(1)-GARCH(1,1)模型,是实际应用中最普遍且效果良好的波动率模型。
  • 参数通过样本数据拟合,提供“一步”及多步预测能力。


(二)GARCH-M模型

  • 该模型在均值方程中加入波动率本身,允许收益率与波动率相关,反映风险溢价机制,捕捉收益率与波动率联动关系。

- 相比基本GARCH模型,GARCH-M更复杂,可能能更好解释收益和波动率间的关联性。

(三)EGARCH模型

  • 引入对异常波动的“非对称效应”,允许负收益对波动率的作用不同于正收益,提高模型灵活性。

- 利用对数形式保证方差正值,适于金融数据的实际特性。

(四)模型滚动预测与参数选择

  • 对三种模型统一采用AR(1)均值方程和(1,1)阶波动率方程。采用滚动窗口法预测月度波动率,优化窗口长度K。

- 实际目标为预测月平均波动率,采用月初基于过去K天数据预测该月波动率。

(五)GARCH预测效果

  • GARCH模型最优K=500时样本外预测胜率为66%,预测偏差0.046(图6、图7)。预测曲线紧密贴合实际波动,稳定性较好。


(六)GARCH-M预测效果

  • GARCH-M最优窗口K=50,胜率最高达70%,但预测偏差0.063(图8、9 vs 图10)。存在预测极端值的风险,例如2015年7月过高的波动率预测。

- 在中证500中,胜率更高(72%),但偏差更大(0.087),极端预测情况更显著。

(七)EGARCH预测效果

  • EGARCH模型最优K=400,样本外胜率61%,偏差0.053(图11、12及图13)。表现整体稳定,略逊于GARCH和GARCH-M部分指标。


---

三、图表深度解读



图 1 上证50ETF波动率移动窗口估计(第4页)


  • 显示2005年至2021年间,使用20天窗口估计的ETF50年化波动率时间序列。

- 波动率存在明显峰值,如2008金融危机和2015年股灾期间,波幅巨大。整体波动率表现出明显聚集性和周期性。
  • 该图证实移动窗口估计波动率具有强自相关和高频噪声,需适当调整窗口大小减少样本间依赖。


表 1 不同窗口长度的上证50历史波动率与iVIX比较(第5页)


  • 以均方误差MSE衡量不同窗口下历史波动率与隐含波动率(月均iVIX、月末iVIX)的拟合度。

- 窗口从15到40天遍历,MSE在36-38窗口最小,表明约38天窗口的历史波动率最贴合隐含波动率的预期。
  • 这是本文后续选择38天窗口参数的实证依据。


图 2 上证50指数38天月度历史波动率与月均iVIX对比(第6页)


  • 两条曲线形态趋同,虽有波动差异,但整体趋势一致,进一步验证38天历史波动率作为当月实际波动的代替合理。


表 2 31个备选技术指标(第7页)


  • 包含多种主要基于收盘价的动量类和反转类技术指标,为构建PLS回归模型的基础变量。


表 3 技术指标样本内最优信号胜率(第7页)


  • MICD指标最佳,胜率58%,其后几个指标均为57%,显示这些指标对波动率未来趋势有一定预测价值。


表 4 PLS回归预测胜率和预测偏差(第9页)


  • PLS回归在沪深300胜率仅46%,偏差0.086,中证500表现较好胜率55%但偏差更大,说明PLS对中证500波动率趋势预测更有效,但数值精度稍差。


图 3、图 4 PLS回归样本外预测结果(第9页)


  • 沪深300和中证500实际波动率与预测值对比,模型能够捕捉波动率峰值出现的大致时间,但在一般情况低估波动率水平。


图 5-7 GARCH模型预测效果(第12-13页)


  • 图5显示不同滚动窗口大小下的预测胜率和均方误差,窗口500平衡了胜率(约64%)与最低均方误差。

- 图6-7展示沪深300及中证500样本外预测曲线,预测值与实际值非常接近,尤其在沪深300样本外,预测曲线紧贴实测曲线。

图 8-10 GARCH-M模型预测效果(第14-15页)


  • 相较GARCH模型,GARCH-M在沪深300小窗口(K=50)时达到最高胜率67%,但偏差上升,并存在极端预测案例。

- 在中证500,胜率提高到72%,偏差显著增大,极端偏离样本实际情况。
  • 图10显示多次较大幅度过高预测波动率,风险较大。


图 11-13 EGARCH模型预测效果(第15-16页)


  • EGARCH在沪深300最优窗口K=400,胜率为70%,偏差较低(0.057),表现稳中带优。

- 样本外预测波动率与实际较协调,但不及GARCH模型拟合紧密。
  • 在中证500中胜率保持66%,偏差较高(0.076),表现居中。


表5 三种GARCH模型在中证500预测效果总结(第17页)



| 方法 | 预测胜率 | 预测偏差 |
|---------|--------|--------|
| GARCH | 66.1% | 0.066 |
| GARCH-M | 71.9% | 0.087 |
| EGARCH | 66.5% | 0.076 |
  • 表明GARCH-M模型方向预测能力最强,但数值精度和稳定性最差,适合方向判断。

- GARCH和EGARCH较为均衡,可用于精确值预测。

---

四、估值分析



本报告不涉及传统意义的公司估值分析,而是聚焦指数波动率的统计预测,因此不涉及现金流折现、P/E等市值估值模型。估值层面体现在波动率预测的偏差和准确率评估,通过胜率和预测偏差(均方根误差)衡量模型表现。

---

五、风险因素评估


  • 模型适用性风险:所有方法均基于历史数据和统计规律,未考虑突发事件和市场结构性变化,有限的历史窗口及参数设定可能限制预测灵活性。

- 极端情况预测能力不足:部分模型如GARCH-M尽管胜率高,但会产生极端预测,使投资决策面临风险。
  • 市场不确定性:波动率受多种宏观及微观因素影响,历史规律不能完全映射未来动态,模型有效性具有限制。

- 数据限制:隐含波动率(iVIX)数据因发布时间限制只涵盖较短区间,影响对比分析的全面性。
  • 报告免责声明:不构成投资建议,模型仅统计意义下有效,投资者应结合其他工具和策略审慎使用。


---

六、批判性视角与细微差别


  • 技术分析模型效果有限:PLS基于技术指标的纯统计回归在沪深300中表现不佳,预测信号胜率低(仅46%),波动率数字估计也较粗糙,反映传统技术分析指标难以有效捕捉波动率未来变化。

- GARCH模型优势明显,但仍不完美:GARCH和EGARCH表现稳定且偏差较小,但方向准确率有限(约61%-66%)。
  • GARCH-M模型预测偏差大但方向较准,适合搭配使用,这一点作者提及但需注意投资应用中的风险管理。

- 数据周期选择与处理需谨慎:报告采用38天历史窗口最佳,但因iVIX数据截止时间早,后续验证或需新工具支持。
  • 报告对极端预测状况进行了披露,体现了风险意识,但未给出显著的缓和方案,可能需要进一步研究稳定性改善措施。


---

七、结论性综合



本报告系统研究了基于历史波动率数据,利用技术指标与GARCH模型对中国主要股指(沪深300与中证500)月度未来波动率进行预测的多种方法。通过大量数据分析和模型比较,得出以下关键信息:
  • 波动率的刻画基础:确认38天历史波动率窗口参数最优,与隐含波动率指标(iVIX)高度吻合,为后续预测建模提供了扎实的统计基础。(表1,图2)[page::4,page::5,page::6]

- 技术分析的局限性:31个仅基于收盘价的技术指标中,MICD和TEMA等预警信号较好,但整体PLS回归模型预测胜率仅为46%-55%,且难以精确捕捉波动率数值,技术分析在波动预测中效果有限。(表3,表4,图3,图4)[page::7,page::8,page::9]
  • GARCH系列模型表现优异:三种GARCH模型均表现出较高的方向预测胜率和较低的预测偏差,尤以基本GARCH模型的预测偏差最低、EGARCH模型胜率稳定,GARCH-M模型在方向上精准但存在极端预测风险。(图5至图13,表5)[page::12,page::17]

- 模型的搭配使用建议:报告建议以GARCH-M模型作为方向预测的工具,而GARCH和EGARCH模型用于波动率数值的估算,形成互补的预测体系。
  • 风险的明确提示:强调模型基于历史统计物理,面对未来市场不确定性存在固有限制,实际应用需谨慎,报告不构成投资建议。


整体现状显示,利用价格数据和统计模型对中国主要指数月度波动率进行合理预测是可行的,现代时间序列模型优于传统技术分析,但仍面临极端事件预警能力不足的挑战。未来工作可结合宏观变量、更多高频数据及机器学习方法,优化预测性能。

---

八、附:部分关键图表以Markdown方式展示



图 1:技术指标-波动率预测结果


图 2:GARCH-波动率预测结果


---

综述


该报告通过对中国主要股指波动率的深入研究,详细说明了不同波动率计算和预测方法的原理、参数选择及实证表现,既介绍了经济学及金融学中的经典统计模型,也创新地引入技术指标与机器学习相结合的思路,系统全面且数据充分,是理解市场波动率预测不可多得的专业文献。

最终,该报告用严谨的数据和实证结果论证,GARCH系列模型是指数月度波动率预测的较优选择,尤其是GARCH-M在波动率方向判断中表现突出,但需与GARCH和EGARCH模型配合使用以防范极端波动风险。该报告为投资风险管理和衍生品定价提供了重要的理论和实操依据。[page::0,page::3,page::5,page::6,page::9,page::12,page::17]

---

(全文共计约1800字,涵盖报告所有章节重点,并详细解析图表、方法、数据与风险。)

报告