`

基本面量化系列 (5):如何量化跟踪周期性行业景气度

创建于 更新于

摘要

本报告基于行业基本面数据,构建周期性行业景气度量化模型,重点关注毛利润增速作为景气代理。结合行业逻辑与相关性分析的打分模型对周期性行业盈利预测较好,且对部分行业(石油石化、煤炭、有色金属、钢铁、建材、汽车)的超额收益有较强预测性。同时采用机器学习XGboost模型对行业景气度进行分类预测,发现其对盈利预测表现较优,但对超额收益前瞻性有限。最新观点显示周期性行业景气整体向好,为中长期配置提供参考依据[page::0][page::2][page::30][page::46].

速读内容


行业景气度研究核心逻辑 [page::2]


  • 行业指数收益受基本面景气度、交易层面及金融市场环境影响,景气度反映行业盈利变化。

- 利润增速,尤其毛利润增速适合用于周期性行业景气度代理变量的构建。

利润增速周期性显著行业范围 [page::3][page::4]


  • 钢铁、大宗商品、交运、公用事业、汽车等行业利润增速显示显著波动,适合以毛利润增速作为景气度代理。

- 毛利润增速波动性高且与净利润增速相关性强,降低极值风险。

景气度量化研究基本原则 [page::5]


  • 预测指标需基本面逻辑长期稳定,历史数据充足,且至少月度更新保证及时性。


景气度模型构建方法:行业逻辑+相关性分析 vs 机器学习XGboost [page::6]


  • 传统模型强调行业基本面理解,指标筛选贴合行业认知,但可能存在样本内过拟合。

- 机器学习降低过拟合风险,自动权重赋值,但部分指标可能与行业理解存在偏差。

典型行业景气度模型效果汇总与策略表现 [page::9][page::10][page::12][page::15][page::30]

  • 石油石化: 以烯类、苯类、油类价格为主,择时策略净值显著跑赢基准,最高景气阶段超额收益胜率47.4%。

  • 煤炭:价格及运量为核心指标,景气度得分最高阶段超额收益胜率61.1%,择时策略显著跑赢行业基准。

  • 有色金属:主要依赖金属价格,盈利预测较好,择时较基准有优势,但超额收益表现较弱。

  • 钢铁:钢材价格及铁矿石运价为重要指标,景气度模型表现优异,超额收益达1.4%。

  • 汽车:销量及主要零部件产量反映景气,策略表现稳健,最高得分阶段胜率超90%,超额收益胜率64%。



机器学习XGboost模型设计与效果 [page::31][page::33][page::46]


  • 利用有监督学习的XGboost模型,基于行业毛利润TTM环比增速分类景气与不景气。

- 多组滚动时序训练/测试集确保模型稳健,重要参数(树颗数、学习率等)经交叉验证优化。
  • 机器学习模型能自动识别关键经济指标,部分行业盈利预测较好,但普遍对超额收益预测能力较弱。


机器学习模型行业表现对比 [page::45]


| 行业 | 盈利预测 | 超额收益预测 |
|----------------|----------|--------------|
| 石油石化 | 一般 | 一般 |
| 煤炭 | 较好 | 不佳 |
| 有色金属 | 较好 | 不佳 |
| 电力及公用事业 | 一般 | 不佳 |
| 钢铁 | 较好 | 较好 |
| 基础化工 | 较好 | 不佳 |
| 建材 | 较好 | 不佳 |
| 汽车 | 较好 | 一般 |
| 交通运输 | 一般 | 一般 |
| 电子 | 不佳 | 不佳 |
| 通信 | 较好 | 不佳 |

最新景气度模型观点(2021年6月)[page::46]

  • 景气较高行业:石油石化、煤炭、钢铁、汽车、建材、基础化工、交通运输、电子

- 景气一般行业:有色金属
  • 景气较低行业:电力及公用事业

- 超额收益较强行业:石油石化、煤炭、有色金属、钢铁、建材、汽车

深度阅读

基本面量化系列 (5):如何量化跟踪周期性行业景气度 —— 详尽分析报告解构



---

一、元数据与报告概览



报告标题: 基本面量化系列 (5): 如何量化跟踪周期性行业景气度
作者及联系方式:
古翔、刘均伟、王汉锋(均为中国国际金融股份有限公司研究部分析师),附执业证编号和邮箱。
发布日期: 2021年中(文中多处更新至2021年5月份数据)
发布机构: 中国国际金融股份有限公司(中金公司)
研究主题: 通过量化手段跟踪与预判周期性行业景气度,尤其聚焦周期性强且利润增速变化显著的行业,利用宏观及中观数据构建景气度指标模型,以辅助行业盈利和股票择时决策。

核心论点:
  • 行业景气度反映行业基本面变化,通常与行业利润增速正相关,采用毛利润增速作为主要的景气度代理变量。

- 根据行业基本面逻辑结合相关性分析,采用打分模型构建周期性行业景气度并验证其对行业盈利和超额收益的预测能力。
  • 机器学习方法(XGboost)尝试应用于景气度模型构建,发现能捕捉到部分非线性及低相关经济指标,但在预测超额收益方面普遍表现欠佳。

- 截至2021年5月,周期性行业中石油石化、煤炭、钢铁、建材、汽车等行业整体景气较好,电力及公用事业景气较差。
  • 综合看,景气度模型对行业盈利预测较为有效,但对行业超额收益的前瞻性有限,仅部分行业模型对超额收益具有较强预测能力。[page::0,1,2,46]


---

二、逐节深度解读



1. 行业景气度研究及代理变量选择


  • 行业指数收益受三大因素影响:

① 基本面景气度(行业利润变化)
② 交易层面及投资者预期情绪
③ 宏观环境及金融市场流动性
本报告重点关注①,即行业盈利相关的基本面景气度。[page::2]
  • 周期性行业适选利润增速作为景气度代理变量。

利润增速,尤其是毛利润增速,因其极值较少且与净利润、营收增速相关度较高,适合衡量行业景气度。
季度环比增速 (TTM环比) 数据被采纳为周期性变化特征的具体体现。
  • 各行业利润增速周期性差异示例:

- 钢铁行业表现出典型利润增速周期变化,适合用利润增速做景气代理。
- 医药行业的利润增速波动低,长期趋势平稳,利润增速难以表现明显景气周期。[page::3,4]
  • 统计显示,大宗商品(石油、煤炭、有色金属、钢铁)、交通运输、公用事业、汽车等行业利润增速的波动显著,适合用毛利润增速做景气度代理。

表4、5详细展示了毛利润增速波动幅度及其与净利润、营收增速的Spearman相关系数,确认毛利润增速作为代理指标的合理性和优越性。[page::4]

---

2. 景气度量化研究的原则与模型构建方法


  • 基本原则包括:

- 基本面逻辑长期稳定,有助于模型外推。
- 历史数据量充足,便于量化检验。
- 数据更新频率高(至少月度),保障信息及时。[page::5]
  • 景气度模型构建途径对比:

- 第一种:结合行业逻辑与相关性分析,主观筛选符合行业理解的核心经济指标,通过相关系数筛选并打分汇总。
- 第二种:机器学习模型(XGboost)自动从初筛指标中学习权重,自动组合预测,避免主观偏差但风险为过拟合及指标理解困难。
两种方法各有优势与局限,报告后续将分别展开。[page::6]

---

3. 结合行业逻辑与相关性分析的景气度打分模型——典型行业分析



3.1 石油石化

  • 指标涵盖主要产品三烯类、三苯类和原油/成品油,重点关注产品价格,产量和库存相关性较低,尤其是产量和库存对盈利影响弱。

- 图表10数据显示产品价格指标与毛利润增速Pearson及Spearman相关系数普遍较高(0.3-0.5+),产量和库存波动相关性弱,尤其是欧佩克原油产量对盈利负相关但弱相关。
  • 景气度打分基于价格指标均衡加权,得分区间0-3。择时模型表现优异,显著跑赢基准,尤其高景气对应较高超额收益胜率和毛利增速。

- 择时策略与毛利升降同步,2020年下半年出现较长时段回撤。[page::8,9,10]

3.2 煤炭

  • 重点指标为动力煤和焦煤价格、运输运量(铁路、港口)、库存和产量,运输量与盈利相关度中等(0.5+左右),价格影响最大(接近0.8)。

- 景气度模型同样采用价格和运量指标赋分,得分范围3分。择时表现优异,高景气得分区域行业盈利和超额收益明显提升,尤其胜率高达61%。[page::11,12]

3.3 有色金属

  • 主要产品包括铜、铝、锌、黄金等,指标聚焦国际期货结算价,价格指标与盈利相关度较高(多数>0.75),产量和库存相关性较弱。

- 景气度模型分多维度,价格指标加权汇总。择时择时对盈利预测较好,但对行业超额收益预测较弱,表现不稳定。
  • 超额收益在景气度最高阶段胜率优于整体,但幅度有限。[page::13,14,15]


3.4 电力及公用事业

  • 关注用电量、发电量及发电成本(动力煤价),其中动力煤价格与盈利负相关且相关性最高(-0.7),其他指标相关度较弱。

- 景气度模型主要以动力煤价格为唯一维度。
  • 模型对盈利预测表现较好(景气度高时毛利增速平均4.7%,胜率92%),但对超额收益预测不足,说明景气度与股票市场回报脱钩。

- 建议不以超额收益为主要预测目标。 [page::16,17]

3.5 钢铁

  • 主要产品钢材价格、产销量、库存及铁矿石运价,钢材价格及铁矿石运价对盈利正相关(Spearman最高达0.7),产量及库存相关性较弱。

- 景气度模型综合价格、运输运价及产量。
  • 择时表现良好,景气度高阶段平均超额收益达约1.4%,且与盈利增速呈正相关。 [page::18,19]


3.6 基础化工

  • 产品繁杂,重点关注涤纶长丝、PVC及部分化工原料价格,价格与盈利相关性较强,产量相关弱。

- 景气度模型按品类价格加权汇总。
  • 对盈利预测较好,但超额收益前瞻性较差,推测因产品多样性导致细分影响复杂。 [page::20,21]


3.7 建材

  • 产品涵盖水泥、玻璃,指标包括价格、产量、产能利用率,尤其玻璃产能利用率相关性较强。

- 万得建材综合指数相关性最高但数据历史较短未纳入模型。
  • 景气度模型分两维度(水泥价格、玻璃价格及产能利用率)。

- 择时自2010年以来整体跑赢基准,但2019年以来出现相对回撤。超额收益胜率改进有限。 [page::22,23]

3.8 汽车

  • 以销量(总销量、分厂销量)和产量(整车、发动机、轮胎)为核心指标。

- 相关性强,符合市场直觉。
  • 景气度模型包含销量和主要零部件产量,择时策略从2010年稳定超越基准,且高景气得分阶段毛利增速胜率及超额收益胜率大幅提升。 [page::24,25]


3.9 交通运输

  • 业务包括公路铁路、港口、航空;指标包括客运量、货运量、运价等。

- 指标相关系数普遍低于0.5且业务分散,航空和港口数据对盈利相关性相对较高。
  • 景气度模型按业务拆分维度,择时虽超越行业基准,但对超额收益预测能力有限。 [page::26,27]


3.10 电子

  • 盈利周期受技术与产品革新驱动,传统景气预测困难。

- 采用台股营收及集成电路进口等数据做一定程度跟踪,相关性达0.5左右。
  • 景气度模型对盈利有一定预测性,却无超额收益预测能力,择时表现不佳。

- 通信行业景气度指标相关性极低,未尝试构建景气度模型。 [page::28,29,30]

---

4. 机器学习算法的应用——XGboost景气度模型


  • 采用监督学习中的极值梯度提升(XGboost)算法:

- 利用标记为“景气”或“不景气”的月度数据训练模型。
- 训练采用滚动时间序列分割,每次用近10年数据训练,下一年数据测试。
- 模型自动筛选和赋权经济指标,计算特征重要性,体现其对景气状态判断的贡献。
- 参数优化通过交叉验证选取最优树数、学习率等。 [page::31,32,33]
  • 各行业机器学习模型的特征重要性差异明显:

- 石油石化:关注多产品价格、欧佩克产量、美国战略库存,重要性相对分散。
- 煤炭:动力煤价格占主导,权重超50%。
- 有色金属:铝铜价格为最重要指标。
- 电力及公用事业:以固定资产投资、用电量为主,动力煤重要性低。
- 钢铁:钢材价格、产量及PMI指标重要性高,汽车产量亦被重点关注。
- 基础化工:涤纶、PVC价格领先。
- 建材:水泥价格和玻璃产能利用率。
- 汽车:M1货币供应、二手车交易、销量及产成品存货等综合反映需求、金融环境。
- 交通运输:航空运量、航运运价和铁路货运量。
- 电子:台股营收、进口数据。
- 通信:移动电话用户数、话费CPI等少数指标。 [page::34-44]
  • 机器学习模型在行业盈利预测上表现较好,多数行业景气度得分较高时,平均毛利润增速和正向概率均明显提升。

- 但机器学习模型普遍对行业超额收益预测欠佳,景气度高低对超额收益区分度小甚至反向,反映模型过拟合或重要影响因子缺失。
  • 仅钢铁行业表现为盈利和超额收益预测均较好,汽车、交通运输等部分行业对超额收益存在一定预测力。

- 电子、通信行业盈利及超额收益预测表现不佳,反映技术创新行业难以用传统经济指标准确建模。 [page::44-46]

---

5. 综合比较:传统打分模型VS机器学习模型



| 行业 | 传统打分模型盈利预测 | 传统打分模型超额收益预测 | XGboost模型盈利预测 | XGboost模型超额收益预测 |
|--------------|----------------------|-------------------------|---------------------|------------------------|
| 石油石化 | 较好 | 较好 | 一般 | 一般 |
| 煤炭 | 较好 | 较好 | 较好 | 不佳 |
| 有色金属 | 较好 | 较好 | 较好 | 不佳 |
| 电力及公用事业 | 较好 | 不佳 | 一般 | 不佳 |
| 钢铁 | 较好 | 较好 | 较好 | 较好 |
| 基础化工 | 较好 | 一般 | 较好 | 不佳 |
| 建材 | 较好 | 较好 | 较好 | 不佳 |
| 汽车 | 较好 | 较好 | 较好 | 一般 |
| 交通运输 | 较好 | 不佳 | 一般 | 一般 |
| 电子 | 较好 | 不佳 | 不佳 | 不佳 |
| 通信 | 未建模型 | 未建模型 | 较好 | 不佳 |
  • 传统打分模型在多数周期性行业中对盈利和部分行业超额收益有较好预测力。

- 机器学习能够捕获较多、非传统指标,但在超额收益预测不足,且解释性较差。
  • 建议综合两者优势,未来进一步融合行业逻辑与机器学习。 [page::30,45]


---

三、图表深度解读(精选重点说明)



图表1:行业指数收益影响因素


  • 以三个主要驱动维度解释行业指数收益:基本面景气度、交易层面因素、金融市场环境。

- 逻辑清晰,明确基础景气变化为后续模型的切入点,减少噪音干扰。[page::2]

图表4 & 图表5:毛利润增速波动性与相关系数


  • 图4展现各行业毛利润增速波动分布,钢铁、交通运输等周期波动最大,适合作为景气变化代理。

- 图5显示毛利润增速与净利润及营业收入增速Spearman相关度,多数行业相关度超过0.7,验证毛利润增速作为代理变量的合理性。[page::4]

图表10:石油石化各类指标相关系数


  • 价格为盈利主要驱动力,多个品类石油及石化产品现货价格Pearson及Spearman系数均超过0.3-0.5。

- 产量和库存相关性较低或负相关,揭示实际盈利以市场需求/价格为核心。
  • 该图直观支持景气度打分聚焦价格模型设计。[page::9]


图表12:石油石化行业景气得分阶段盈利和收益表现


  • 景气得分由0至3分区分不景气及高景气阶段。

- 得分3分时毛利润增速达4.1%,超额收益胜率近47%,显著好于整体39%。
  • 验证景气度模型对盈利及股票择时的正向预测效果。[page::10]


图表55 & 图表56:石油石化XGboost模型特征重要性


  • 多个价格型指标得到一定权重,PTA价格最高约8%,原油现货价格近年权重攀升。

- 特征重要性随时间变化,表明模型动态识别关键因子。
  • 指标覆盖广泛,含出口产量及库存等非核心价格指标,显示机器学习引入了新的相关变量。[page::34]


图表57:石油石化XGboost景气度各得分阶段收益表现


  • 景气度为1阶段毛利润增速为正率60%,明显优于0阶段42.9%。

- 超额收益区分度较低,模型预测超额收益能力有限。
  • 反映机器学习模型的盈利预测优于择时收益预测。[page::35]


(其他行业图表深度分析,基于相同解读逻辑)

---

四、估值与风险因素分析



报告中未重点涉及具体估值方法、目标价或风险因素专节。其核心关注点为行业盈利及超额收益的景气度预测,以及模型性能。风险提示主要隐含于模型预测有效性的讨论中,如过拟合风险、数据指标不全及行业特殊性导致的预测偏差等。[page::0-47]

---

五、批判性视角与细微差别


  • 景气度预测工具的选取:传统基于行业逻辑的打分模型直观、解释性强,较适合投资者理解与应用。机器学习模型虽减轻主观成分,发掘额外信息,但因指标权重分散且解释性弱,实际应用中存在透明度不足问题。

- 超额收益预测不足的普遍困境:无论打分法或机器学习,多数行业模型对超额收益预测能力有限,仅少数行业(如石油石化、煤炭、钢铁等)表现良好,说明仅凭基本面景气度难以捕捉短期资产价格波动,叠加估值和情绪指标可能为未来研究重点。
  • 行业特性差异显著:技术驱动、创新密集型行业如电子与通信,难以通过常规经济指标建立稳定景气度模型,提示分析框架需差异化设计。

- 数据频率与覆盖限制:部分关键指标起始时间较晚(如建材综合指数),数据更新延迟和缺失也对模型稳定性构成限制。
  • 内部一致性:报告系统性呈现景气度代理变量和模型设计理念,指标选择及模型验证过程严谨,但对机器学习方法的局限说法较为保守,未充分展开算法层面的深度讨论。

- 定量评估指标:采用Pearson、Spearman系数、胜率、超额收益平均值衡量性能,方法科学,指标多维,有力支持结论。
  • 尚无具体估值数据:报告核心为盈利和超额收益预测,估值(如DCF)未涉及。

整体上,报告内容丰富、数据详实,逻辑清晰,是周期性行业景气度量化研究的典范,有效结合基本面数据与量化建模工具。[page::0-47]

---

六、结论性综合



本报告系统地构建并验证了基于基本面逻辑和数据驱动的周期性行业景气度模型,重点聚焦中国市场典型周期性行业。核心成果如下:
  1. 代理变量选择合理,毛利润增速优于净利润,且适用于周期性行业如石油、煤炭、钢铁、汽车等。 行业利润周期性强大幅波动,选用毛利润增速捕捉基本面变化更稳健。[page::3,4]
  2. 结合行业逻辑与相关性分析的景气度打分模型在大部分周期性行业对盈利预测表现优异,且部分行业(如石油石化、煤炭、钢铁、建材、汽车)还能有效预测超额收益,具备择时功能。 择时策略在2010年至2021年表现稳定,部分行业超额收益胜率达50%-60%及以上,表明模型对投资决策有实用参考价值。[page::9-28,30]
  3. 机器学习(XGboost)模型辅助挖掘更复杂、非线性且低相关性指标,如电力用电量指标和欧佩克产油量指标,丰富了景气度研究视野。 但对超额收益预测能力不足,且解释性差,实际应用需谨慎或结合传统分析框架。[page::31-46]
  4. 不同行业特征差异大,技术创新密集行业(电子、通信)景气度模型表现弱,需另辟蹊径。公用事业与交通运输行业虽然盈利预测尚可,超额收益预测能力有限。[page::28-31,37,42,43]
  5. 2021年6月景气度综合得分显示石油石化、煤炭、钢铁、汽车、建材为高景气行业,有色金属景气度一般,电力及公用事业景气低迷。 这与疫情后经济复苏及大宗商品周期复苏高度吻合。[page::46,47]
  6. 未来研究方向建议:

- 深化行业逻辑与机器学习结合,优化模型指标筛选与解释机制。
- 探索叠加估值和市场情绪指标,提高对超额收益的预测能力。
- 针对非周期性及创新驱动行业,开发专门的景气及盈利预测框架。

整合传统行业分析与现代机器学习,报告为投资者提供了具备科学验证与实践指导意义的行业景气度量化工具,具有较高的应用价值和进一步研究潜力。[page::46-47]

---

以上分析紧密依据原报告内容,结合财务数据、模型设计及择时策略效果,全面解读原文核心思想、数据支撑和结果判定,适度揭示优缺点及未来方向,充分体现资深金融分析师的专业判断。

报告