机制转换视角下的资产配置:机器学习能否协助决策?
创建于 更新于
摘要
本报告系统研究了基于隐马尔可夫模型的机制转换模型在资产配置中的应用。通过对沪深300及多资产、行业指数的隐藏状态识别,发现单资产“拐点”识别灵敏度不足,但多资产与行业的隐藏状态划分对资产配置提供了有效的指导信号,机制转换组合相较传统动量策略表现优异。此外,宏观多变量的隐藏状态识别效果不佳,建议结合可观测宏观变量观点和资产隐藏状态观点实现资产配置优化,实现组合收益与稳定性的提升[page::0][page::9][page::15][page::21][page::23]
速读内容
机制转换模型基础与理论介绍 [page::4][page::6][page::7][page::8]
- 机制转换( Regime Switching )是假设资产收益或宏观变量背后存在不可观测的隐藏状态,状态转换服从一阶马尔科夫过程。
- 使用隐马尔可夫模型(HMM)连接观测序列与隐藏状态,通过极大似然估计等算法识别隐藏状态序列,辅助资产配置决策。
单资产“拐点”识别测试与局限 [page::9][page::10][page::11][page::12]

- 基于沪深300日收益率,建立2状态混合正态HMM模型,拟合结果清晰区分高波动和常态状态,收益均值和方差差异显著。

- AR模型假设下的机制转换能更好识别2017-2018年不同隐藏状态,提升识别灵敏度。

- 通过滚动拟合机制转换模型进行择时,模型灵敏度低且择时信号滞后,难以实现有效前瞻。
多资产机制转换识别与配置优势 [page::12][page::13][page::14][page::15]

| 状态 | 沪深300平均收益 | 中证500平均收益 | 商品平均收益 | 债券平均收益 |
|-------|----------------|----------------|-----------|-------------|
| 1 | -2.10% | -0.84% | 0.25% | 0.39% |
| 2 | 5.18% | 4.79% | 0.97% | -0.12% |
| 3 | 3.34% | 6.80% | -0.39% | 0.58% |
| 4 | 0.38% | -0.37% | 0.16% | 0.48% |
- 多资产隐状态识别较单资产更频繁且有效,能揭示资产在不同状态下的收益特征,识别到权益市场与债券表现的分歧。
- 机制转换配置回测显示相较基准和动量策略,机制转换组合实现更高夏普率和更低最大回撤,说明模型具有较强选资产能力。

| 组合 | 年化收益率 | 年化波动率 | 最大回撤 | 夏普率 |
|--------------|-----------|-----------|---------|-------|
| 基准 | 5.25% | 6.18% | 7.87% | 0.85 |
| 动量 | 8.00% | 10.95% | 12.37% | 0.73 |
| 机制转换 | 8.63% | 6.24% | 6.20% | 1.38 |
| 目标波动5% | 4.24% | 3.90% | 4.08% | 1.09 |
| 机制转换BL-5% | 5.36% | 2.97% | 3.12% | 1.81 |
行业层面机制转换效果 [page::16][page::17][page::18]
- 行业隐状态识别对行业收益排序有区分,三状态模型优于两状态模型,行业机制转换组合表现优于行业等权及动量组合。

| 组合 | 年化收益率 | 年化波动率 | 最大回撤 | 夏普率 |
|--------------|-----------|-----------|---------|-------|
| 行业等权 | 9.21% | 26.63% | 57.45% | 0.35 |
| 行业动量 | 11.03% | 27.62% | 65.82% | 0.40 |
| 行业机制转换 | 12.20% | 25.96% | 57.11% | 0.47 |
宏观数据的隐藏状态表现有限 [page::19][page::20][page::21]

- 单一宏观指标(如CPI同比)的隐藏状态划分显示对波动较小和较大部分的区分,但对资产配置帮助有限。
- 多宏观变量组合划分快速切换且稳定性、可解释性差,基于此的资产配置改进效果不明显。

宏观状态与资产隐藏状态组合提升配置表现 [page::22][page::23]
- 结合宏观经济预期和流动性观点,对机制转换隐状态收益进行调整后,构建稳健和激进组合,提升了收益和风险调整收益水平。
- 机制转换-流动性组合夏普率最高达1.05,显著优于基准及单纯历史收益观点组合。
| 组合 | 年化收益 | 年化波动 | 最大回撤 | 夏普率 |
|-----------------|---------|---------|---------|-------|
| 基准-无观点 | 9.11% | 12.13% | 26.79% | 0.75 |
| 历史收益-经济 | 8.16% | 10.98% | 24.84% | 0.74 |
| 历史收益-流动性 | 11.37% | 11.49% | 26.75% | 0.99 |
| 历史收益-复合 | 9.85% | 10.93% | 25.70% | 0.90 |
| 机制转换-经济 | 8.79% | 10.63% | 27.51% | 0.83 |
| 机制转换-流动性 | 11.89% | 11.30% | 26.47% | 1.05 |
| 机制转换-复合 | 10.43% | 10.72% | 27.13% | 0.97 |
结论与风险提示 [page::23][page::24]
- 机制转换模型能揭示资产隐藏状态,单资产拐点前瞻性不足,多资产及行业配置中更适用且优于动量指标。
- 宏观多变量隐状态识别效果有限,建议结合明确宏观观点和资产隐状态综合使用。
- 历史表现不代表未来,模型基于历史数据,市场环境大变时可能失效。
深度阅读
报告详尽剖析︱《机制转换视角下的资产配置:机器学习能否协助决策?》
---
1. 元数据与概览
- 报告标题:《机制转换视角下的资产配置:机器学习能否协助决策?》(数说资产配置研究系列之三)
- 作者与机构:证券分析师邓虎(邓虎@申万宏源研究),研究支持沈思逸(沈思逸@申万宏源研究)
- 发布时间:2021年2月23日
- 核心主题:探讨基于隐马尔可夫模型(HMM)的机制转换模型,及机器学习方法在资产配置中的应用,探索能否识别资产收益及宏观环境中隐藏状态变化以辅助投资决策。
- 投资提示摘要:
- 资产背后或有不可直接观测的"隐藏状态",不同状态对应不同收益波动特征。
- 单资产识别“拐点”灵敏度不足,模型适合复盘不适合前瞻。
- 在多资产与行业配置上,隐藏状态影响较大,模型在选择资产优于传统动量择时。
- 宏观数据上的机制转换拟合能力优于预测,复杂多变量下解释性差。
- 机器学习结合基本面逻辑有潜力捕捉非线性信息,提升配置效率。
- 风险提示:模型基于历史,未来可能失效。[page::0]
---
2. 分章节深度解读
2.1 引言与机制转换模型基本理论(1.1—1.3)
2.1.1 资产收益分布的状态多样性(1.1)
- 传统资产配置假设资产收益服从单一正态分布,均衡预期收益和稳定风险协方差矩阵。
- 实际上资产收益体现“厚尾”和波动聚集性,不同时期收益分布往往符合混合正态分布的假设(不同隐藏状态下有不同收益均值与协方差矩阵)。
- 例证沪深300指数2017年(均值0.08%,波动率0.64%)与2018年(均值-0.11%,波动率1.35%)日收益序列,均值与方差检验均显示两个时期显著不同,说明同一分布假设不合理,否则估值与风险偏差将较大。[page::4]
2.1.2 从可观测状态到隐藏状态的理论延展(1.2)
- 传统战术模型如“美林时钟”基于显性宏观变量划分状态,但限于变量个数与易变性,适应性弱。
- 通过马尔科夫过程刻画资产或宏观变量的状态转换性,Hamilton (1989)引入机制转换(Regime Switching)模型,观测序列的背后隐藏马尔科夫过程状态(不可观测的隐藏变量),可分离不同隐藏状态对应的收益分布。
- 对沪深300指数涨跌和PMI升降的自相关性分析表明简单一阶马尔科夫假设不足以刻画实际数据,支持采用隐藏状态建模。[page::5-6]
2.1.3 利用隐马尔科夫模型(HMM)识别隐藏状态(1.3)
- HMM假设隐藏状态构成离散时序的马尔科夫链,状态转移由转移矩阵控制;观测序列由状态对应的输出概率(如不同状态下的正态分布参数)生成。
- 三大算法核心:
1. 前向后向算法计算观测序列概率(用于参数估计基础)
2. E-M算法估计模型参数(极大似然法)
3. Viterbi算法进行隐状态序列“解码”
- 通过这些算法,模型实现对隐藏状态的估计,进而可据状态变化调整资产配置。[page::7-8]
---
2.2 单资产“拐点”识别(第2章,2.1节)
2.2.1 混合正态分布模型识别(2.1)
- 使用2009-2020年沪深300日收益,假设2隐藏状态,分别拟合发现部分大级别波动期如2015年中、2016年初及2020年初明显为高波动状态2。
- 该状态2收益均值显著负且方差远大于状态1,状态转移矩阵显示状态1稳定性高(99.39%概率维持),状态2可转状态1概率约8.4%。表明模型能区分不同波动机制。[图5-6,表2-3,页9-10]
- 缩小样本至2017-2018年,纯正态HMM未能成功区分两年差异,表明短期内正态假设不足以有效揭示“拐点”。
2.2.2 引入自回归(AR)模型改进识别效果(2.1)
- 采用AR(4)模型描述不同状态下的收益自相关,明显改善隐藏状态识别(图7)能区分2017、2018年的不同机制状态,且两状态均值及方差有差异(表4)。
- 状态持续概率依然很高(状态1 约99.07%),显示状态稳定。
- 然而,基于历史滚动窗口识别“前瞻”机制转换指标效果有限:模型灵敏度偏低,信号滞后,错失多轮重要行情,尤其是加仓信号辨识差(图8-9)。
- 综合来看,单资产机制转换模型更适合历史复盘而非预测绝对拐点。[page::9-12]
---
2.3 多资产及行业层面机制转换(2.2、2.3节)
2.3.1 多资产状态划分与资产选择能力(2.2)
- 以沪深300、中证500、商品、债券月度收益率构建多个隐藏状态(4状态)(图10),状态转换较为频繁,隐藏状态对应的各资产次月平均收益、上涨频率差异明显(表6)。
- 使用正态假设和VAR(向量自回归)假设,模型识别大多集中在权益不确定,债券较好表现的状态,符合市场实际。(图11-12)
- 采用滚动窗口策略,利用1000次循环学习减少HMM参数估计不稳定性,对各资产分配进行历史上涨频率筛选,形成多资产配置组合,进一步引入动力学迭代与贝叶斯岭(BL)方法优化权重。
- 实证结果显示,机制转换组合与机制转换+BL组合均显著优于基准和动量组合,表现为更高年化收益率、更低回撤和更优夏普率(表7,图13-14),说明隐藏状态识别在多资产配置中具备较强的选资产能力及风险控制能力。
- 状态维持概率图(图15)显示状态稳定性随时间波动,但变化时模型多能恰当调仓(图16),体现出一定前瞻作用。
2.3.2 行业层面的机制转换应用(2.3)
- 板块层面2状态模型区分效果有限,状态出现不均衡,难有效划分横向异质性(表9)。
- 行业层面(28个一级行业),以超额收益为输入,3状态模型识别优于板块,状态转移可视化较合理(图17),表明行业之间隐藏状态更显著。
- 基于1000次HMM实验的行业权重平均配置,重点配置前六行业,构建行业机制转换组合。与行业等权及行业动量组合比较,该组合年化收益率高,波动略低,最大回撤减少,夏普率最佳(表10,图18),体现出机制转换在行业层面选股优于动量的增值潜力。
- 但由于缺乏基本面支撑,模型解释力与稳定性仍有限。[page::12-18]
---
2.4 宏观变量上的机制转换研究(第3章)
2.4.1 单一宏观变量识别(3.1)
- 以CPI同比为例,应用带AR(1)滞后项的HMM模型,划分两隐藏状态,对应通胀波动较大与较小状态(图19)。
- 但该宏观划分与我国资产价格关联弱,资产收益表现区分度小,显示宏观隐藏变量对资产配置指导有限。[page::19]
2.4.2 多变量宏观数据划分与局限(3.2)
- 选取PMI、工业利润、社融、M2、债券收益率、CPI同比6大宏观指标转化为状态变量,建立4状态HMM模型得到频繁切换且不易解释的状态序列(图20-21)。
- 实证验证,将该多宏观隐藏状态结合资产配置效果有限,说明宏观隐藏状态识别不稳定、解释性差,难以实际指导资产配置。
- 建议宏观分析宜借助逻辑、理论及可观测状态分析,结合专家判断而非完全依赖机器学习黑箱模型。[page::20-21]
2.4.3 宏观可观测状态与资产隐藏状态组合(3.3)
- 结合《重塑资产配置“时钟”》框架,将宏观经济与流动性可观测状态观点与基于资产收益率的隐藏状态机制转换观点结合。
- 以隐马尔可夫模型识别过去5年历史中资产表现,替换传统的长期均值作为BL组合输入,结合宏观经济与流动性观点,构建稳健、激进组合(图22-25)。
- 结果表明机制转换改进版组合在收益、夏普比率上较无观点和历史收益简单组合均有提升,增强组合稳定性和收益表现(表11),验证隐藏状态模型与宏观变量组合的协同价值。[page::21-22]
---
2.5 总结与风险提示(第4、5章)
- 机制转换模型通过对资产、行业收益的隐藏状态建模,能捕捉资产收益中的非线性、多状态机制特征,优于传统动量策略。
- 单资产“拐点”识别灵敏度不足,有较好历史拟合效果但前瞻性能弱,主要适合复盘分析。
- 多资产及行业层面机制转换识别稳定性更高,具有资产筛选和配置指引价值,能显著提升收益和降低风险。
- 宏观数据隐藏状态识别存在解释性弱、变动快的问题,实用性有限,建议结合可观测宏观状态及经典逻辑判断使用。
- 机器学习优劣:较适合处理高维数据、复杂非线性资产收益信息,劣势在逻辑性强、粗糙结构明确的宏观指标上不佳。
- 风险提示:模型基于历史数据,且运行受参数估计不确定性影响,市场环境发生突变时模型可能失效。[page::23-24]
---
3. 图表深度解读
3.1 图1与表1:沪深300 2017-2018年日收益率及统计特征
- 图1直观显示2018年沪深300波动明显大于2017年,表1中2017年均值0.08%、波动0.64% vs 2018年均值-0.11%、波动1.35%,均值和方差的t检验均拒绝同分布假设,强调两年市场状态显著不同,支持机制转换多状态建模假设。
3.2 图2-3:沪深300涨跌及PMI升降自相关性
- 图2自相关系数接近0,表明沪深300日涨跌序列缺乏明显一阶马尔科夫特征;图3 PMI月度升降自相关同样波动剧烈,不具备简单一阶Markov性质,动态更复杂,须引入隐藏状态。
3.3 图4:机制转换模型结构示意图
- 体现隐状态向观测态的因果结构,隐状态按Markov链逐时刻转移,观测由对应隐状态产生,便于实现EM和Viterbi算法估计与解码。
3.4 图5-6与表2-3:沪深300分别在2009-2020和2014-2020的2状态隐状态识别
- 蓝色与深蓝色区分不同隐状态,2状态模型能有效识别2015-2016年大波动及2020年疫情,表2显示状态2显著负收益且波动远大于状态1。
- 状态转移矩阵平稳,状态1保持概率高达99.39%,状态2转向1概率8.4%,体现周期性的市场风险状态演变机制。
3.5 图7与表4-5:采用AR模型的2017-2018沪深300隐状态识别
- 图7显示AR模型下2017年和2018年被区别划分,表4状态间收益均值和方差明显差异,表5转移概率稳定,说明AR模型通过考虑滞后提高了短期状态识别效果。
3.6 图8-9:沪深300机制转换择时绩效(混合正态与AR模型)
- 图8-9显示单资产机制转换择时结果与基准相比,均有信号滞后、灵敏度不足问题,尤其正态假设下观察不到明显超额收益,AR模型月频信号略有改善,但整体表现仍受限,表明模型对单资产前瞻作用弱。
3.7 图10-12表6:多资产状态划分与绩效
- 图10-12分别在正态和VAR假设下展示多资产状态随时间变动。表6对应四状态下沪深300、中证500、商品、债券的次月收益及上涨概率,显示状态间存在明显差异,如状态2为权益市场活跃期,状态4为债市强势期。
3.8 图13-14与表7:多资产机制转换策略净值与绩效(含BL组合)
- 图13-14展示机制转换策略及BL组合净值较基准和动量组合更稳健、表现更优。表7统计机制转换组合年化收益8.63%,波动6.24%,最大回撤6.2%,夏普率1.38,显著领先基准和动量,BL组合进一步提升风险调整收益。
3.9 图15-16:隐藏状态不变概率与组合权重时序
- 图15显示多数时间隐藏状态维持概率较高,少数波动较大阶段状态变动多,提示模型能捕捉市场机制变换。图16权重动态体现债券长期占优,权益呈时序波动,符合市场实际。
3.10 表8-10与图17-18:行业层面机制转换及组合表现
- 表8展示申万行业分类,表9为两状态下板块排序,区分度弱;以28行业超额收益识别三状态模型(图17),状态转移合理分布。
- 图18呈机制转换行业组合相较基准与动量组合净值曲线更优,表10显示装配机制转换组合年收益12.2%,夏普率0.47领先其他方法,说明行业层面隐藏状态识别增值效果明显。
3.11 图19:CPI同比两状态隐藏状态识别
- 识别两种通胀状态,低波动和高波动期,模型准确区分周期性通胀,但其影响对资产表现关联度弱,实际资产配置运用受限。
3.12 图20-21:多宏观数据四状态隐藏状态识别
- 隐状态切换频繁,区分资产效果不明显,说明复杂宏观多变量在HMM下模型稳定性和解释性差,使用价值受限。
3.13 图22-25,表11:宏观可观测+机制转换组合净值与绩效
- 各图显示机制转换结合宏观观点构建组合相较无观点和简单历史收益组合具有更高净值增长。
- 表11详细列出激进组合年化收益、回撤及夏普比率改进,证实结合资产收益隐藏状态信息提升投资表现。
---
4. 估值分析
报告不涉及典型企业估值模型计算,核心研究在资产配置策略层面,侧重模型识别及择时方法,故无直接现金流折现(DCF)、市盈率等估值内容。
---
5. 风险因素评估
- 历史依赖性风险:模型基于过去数据训练,市场结构突变或新政策冲击时,模型可能失效;
- 参数估计不稳定性风险:HMM模型参数估计靠近局部最优,随机初始化带来结果波动,报告以重复循环减少;
- 模型前瞻性不足:尤其单资产模型灵敏度低,无法及时捕捉转折点;
- 宏观数据解释与稳定性不足:多变量机制转换导致结果缺乏稳定性和可解释性,进而降低应用可信度;
- 基于收益数据的隐藏状态解释限制:无法完全替代基本面深入分析。
报告强调需与定性逻辑相结合,避免完全依赖模型决策。[page::0,24]
---
6. 审慎视角与细微差别
- 报告客观说明机制转换模型的优势和局限,特别提到单资产“拐点”识别中前瞻不足,体现分析审慎。
- 多资产及行业层面效果明显,暗示模型实用性受资产结构复杂性增加带动提升,对单资产及宏观单变量则弱。
- 宏观多变量HMM状态识别结果波动大,表达潜在模型复杂度与数据逻辑不匹配的风险,反映当下机器学习应用于宏观金融领域普遍面临的困境。
- 报告中模型运行依赖参数初始赋值,虽通过多次采样降低不稳定影响,但仍可能存在一定的结果波动性。
- 建议的混合视角策略体现了机器学习与宏观定性分析结合的方向,避免单一依赖模型。
---
7. 结论性综合
本报告系统评析了基于隐马尔可夫模型(HMM)的机制转换模型在资产配置中的应用能力。报告前半部分阐释理论基础,揭示资产收益与宏观数据背后存在不可直接观察的隐藏状态,其识别有助于捕捉资产收益波动结构的非线性与多阶段特征。实证部分:
- 单资产层面:单一资产收益率序列基于正态分布假设的机制转换模型效果有限,自回归模型稍优,但均难实时有效识别市场转折点,动态信号滞后,主要用于复盘分析。
- 多资产和行业层面:使用多资产收益信息识别隐藏状态,结合滚动窗口与大量采样确定交易权重,模型在控制风险、提升风险调整收益率及最大回撤方面表现优异。行业层面3状态模型提升了资产筛选效果,且行业组合优于动量策略,显示机制转换识别在更丰富资产信息下的优势。
- 宏观变量层面:单变量(如CPI)机制转换模型能揭示简单通胀状态,高维宏观多变量机制转换识别则表现波动大、解释性差,无法显著提升配置决策稳定性,建议辅以显性宏观指标与基本面分析。
- 综合策略:将机制转换模型导出的资产隐藏状态收益率作为输入,结合宏观经济与流动性预判的可观测状态,利用贝叶斯岭等方法构建稳健与激进组合,提升策略收益率与风险调整表现。
总体而言,机制转换模型基于机器学习思想,适用于捕捉多资产复杂结构中的隐藏信息,尤其在资产层面而非宏观层面效果更优。报告明确其固有限制与前瞻性能弱的风险,建议模型应与传统宏观分析、定性判断相结合,以期实现理论与实操的最佳平衡与协同。
---
图表部分精选Markdown插图引用
(以下效果图及表格均位于报告对应页,可参考位置名或直接导入)
- 图1:沪深3002017-2018年日收益率

- 图5:沪深300日收益机制转换(2009-2020)

- 图7:沪深300日收益率机制转换(自回归模型,2017-2018)

- 图8-9:沪深300机制转换择时(正态及AR模型)


- 图10:正态假设下的多资产机制转换划分

- 图13-14:多资产机制转换策略净值及BL组合净值


- 图17-18:行业机制转换示意与组合净值


- 图19:CPI同比隐藏状态识别

- 图21:多宏观数据隐藏状态识别

- 图22-25:机制转换+宏观观点组合净值




---
总结
本报告为读者深度透析了运用机器学习中的隐马尔科夫模型以及机制转换理论,在资产配置领域中的实际应用挑战与机遇。报告严谨地证明了尽管单资产层面机制转换信号前瞻不足,但在多资产及行业层面隐状态的识别能够显著提升资产筛选和组合表现,优于传统动量策略,同时与宏观经济分析相结合形成更为稳健的投资组合。报告谨慎提示模型使用风险,提倡机器学习应融合定性逻辑与专业判断,以实现资产管理的科学性与实用性平衡。
[page::0,4-25]