全自动构建全一级行业景气指数的方法
创建于 更新于
摘要
本报告提出一套全自动化构建申万28个一级行业景气指数的方法,基于近千个宏观及中观指标库,通过逻辑与实验双重方向判定指标有效性,采用连续非线性仓位函数提升择时稳定性,参数筛选兼顾收益与稳健。样本内策略年化超额收益达35.4%,样本外达8.1%,体现较好稳健性。最新模型参数显示石油石化、钢铁、公用事业、通信、国防军工行业景气度领先,为行业轮动投资提供量化依据 [page::0][page::2][page::10][page::11][page::12]
速读内容
报告核心投资要点 [page::0]
- 设计自动化行业景气指数构建框架,实现快速覆盖28个一级行业。
- 凭借近千个宏观与中观指标数据库,结合逻辑与实证定向筛选指标。
- 采用连续非线性仓位函数减少仓位跳动,提升行业择时模型稳定性。
- 参数选取中结合欧氏距离最小法提升样本外稳健性,兼顾收益和稳健。
- 模型样本内年化超额收益约35%,样本外2022年至今仍实现8.1%超额收益。
指标预处理与仓位函数设计 [page::3][page::5][page::6]
- 通过滞后、同比与降频处理提高指标稳定性。
- 仓位函数分离正负方向,选择参数x1和x2确定仓位区间与斜率。
- 连续仓位函数实现仓位平滑过渡,减轻因指标发布时序差异导致的仓位剧烈跳动。
- 逻辑方向与实验方向结合,通过T检验筛除方向不稳定指标。


指标方向判定与参数筛选 [page::7][page::8][page::9]
| 代码 | 指标 | 逻辑方向 | 实验方向 | 最终方向 |
|---------|----------------------------------|----------|----------|----------|
| C9968425| 国投京唐港:煤炭调度:吞吐量 | 正 | 正 | 正 |
| S0027017| 中国:产量:火电:当月同比 | 正 | 负 | 舍去 |
| S0173743| 中国:进口数量:煤及褐煤:当月值 | 不确定 | 负 | 负 |
| S5125187| 秦皇岛港:场存量:煤炭 | 不确定 | 正 | 正 |
| S9984268| 唐山:市场价格:焦炭:准一级 | 不确定 | 正 | 正 |
- 通过对比不同时间段回测筛选稳定指标。
- 采用欧氏距离最小法从收益前10中选择稳健参数组。
- 示例参数组性能:
| 是否滤波 | 窗口(年) | x1 | x2 | 绝对年化收益 | 超额收益 | 夏普比率 | 最大回撤 |
|----------|----------|-----|-----|--------------|-------------|----------|----------|
| 是 | 1 | 0.5 | 0.5 | 4.1% | 5.9% | 7.5% | 34.3% |
景气指数构建及行业轮动回测 [page::10][page::11][page::12]
- 单指标择时仓位计算后等权合成,形成综合景气指数。
- 样本内(2016-2021)年化超额收益达35.4%,样本外(2022-2024)达8.1%。
- 景气度最高5个行业的轮动策略表现稳健,最新行业领先:石油石化、钢铁、公用事业、通信、国防军工。


量化因子构建逻辑总结 [page::2][page::6][page::7]
- 指标经逻辑标定和实证检验确定方向,分正、负向分别回测。
- 采用参数扫描和欧氏距离筛选,平衡收益和过拟合风险。
- 仓位函数为指标分位数映射,构造连续非线性仓位,防止过度跳动。
- 回测框架具备样本内外有效性验证,降低过拟合风险。
深度阅读
报告分析:全自动构建全一级行业景气指数的方法
---
1. 元数据与概览
报告标题:全自动构建全一级行业景气指数的方法
作者:梁誉耀(分析师)
发布机构:国泰君安证券研究所
发布日期:2024年
研究主题:构建一种自动化的行业景气指数方法,覆盖申万28个一级行业,通过整合大规模宏观及中观指标量化行业基本面与股价表现,形成可用于行业轮动的投资工具。
核心论点与目标:
- 设计一套较为自动化且高度稳健的行业景气指数构建方法。
- 利用近千个宏观及中观指标数据,快速构建覆盖28个一级行业的景气模型。
- 采用连续非线性仓位函数链接基本面指标与行业收益,兼顾收益率与稳健性。
- 通过多时间阶段的指标筛选,排除方向不稳定的指标,确保模型在样本外具有较好的择时效果。
- 样本内超额年化收益高达35%,样本外(特别是2022年至今)依然稳健实现8.1%的年化超额收益。
该报告旨在提供一套可实操的行业景气指数构建方案,为量化选股和行业轮动提供理论及实证支持,增强策略的稳定性和收益表现。风险提示指出,模型依赖历史数据,市场环境变化可能导致指标效用削弱甚至失效,投资者需警惕模型失效风险。[page::0, 2]
---
2. 逐节深度解读
2.1 引言
本节介绍了行业景气量化的多种数据来源与建模方法:
- 分类维度包括财务数据、分析师预期、宏观及中观基本面、量价数据等。
- 建模思路分为三类:
(1)汇总主动研究员逻辑,通过量化模型模仿;
(2)以行业营业收入或净利润为拟合目标,反映行业现状;
(3)以行业股价收益率为目标,优化拟合市场反应。
作者指出上述方法各有利弊,特别是主动研究员逻辑可解释性强但主观性大,方法(2)和(3)解释性相对较弱。尝试兼顾三者优点但存在方法融合难题。基于复杂市场环境,本文提出构建快速、兼顾主观逻辑和数据规律、考虑指标稳定性和收益稳健性的自动化景气指数。[page::2]
2.2 景气指数构建步骤
2.2.1 指标库构建
已经构建了近1000个宏观及中观指标数据库,覆盖申万28个一级行业。示例表展示部分指标,如通信行业的软件业务收入同比、计算机行业的安防设备价格指数、食品饮料行业的白酒产量同比等。这些指标构成模型的原始数据输入。[page::3]
2.2.2 指标预处理
- 滞后处理:部分当月公布数据实际反映上月,例如某些产量数据,需要滞后1期。
- 同比处理:消除趋势与季节性,转换成同比指标,以更准确捕捉指标变化信息。
- 降频处理:将日频、周频数据转为月频,统一分析频率。
图1与图2分别展示了季节性指标和持续增长型数据的样例,体现同比处理的合理性。[page::4]
2.2.3 计算一阶差分
除了使用指标本身的水平,本文还考虑指标的一阶差分(变动速度),挖掘边际变化对行业景气度的影响。[page::4]
2.3 择时模型设置
2.3.1 历史分位数窗口与滤波
- 利用指标一阶差分的历史分位数作为模型输入。
- 分位数窗口长度影响分位数计算结果,默认设置为1年或3年半。
- 对指标噪声较大者进行滤波,以消除无关波动,提升择时效果。[page::4]
2.3.2 仓位函数
模型核心是将指标的历史分位数映射为仓位(持仓比例)。
- 离散仓位函数:如图3与图4,仓位仅取0或1(空仓或满仓),根据分位数阈值决定。
- 连续仓位函数:为平滑仓位变动,缓解指标公布时间不一致引起的仓位跳动,使用两参数线性过渡函数,如图5与图6。
- 参数 $x1, x2$ 分别定义仓位起步和满仓分位数阈值。
- 仓位函数方向(正向或负向)决定分位数与仓位的映射逻辑(例如分位数越高仓位越大为正向)。
- 仓位函数参数经过精细设置和回测,并采用距离最小法选出收益与稳健兼备的参数。[page::5, 6]
2.3.3 模型参数小结
表3总结主要参数取值范围:
- 历史分位数窗口1年或3.5年
- 是否滤波:是/否
- 仓位函数方向正或负
- 仓位函数参数分别取值区间及步长,其中正向 $x2 \geq 0.5$ ,负向 $x1 \leq 0.5$ 以符合逻辑判断。
这些参数在回测过程中被不断验证和筛选。[page::6]
2.4 指标方向确定与指标筛选
2.4.1 逻辑方向标定
采用手工方式对指标与行业收益的联动方向进行逻辑判断。存在逻辑冲突的指标(例如煤炭进口量可能既代表需求提升也代表竞争加剧)被标记为“不确定”,交由后续实验方向判断决定。[page::6, 7]
2.4.2 实验方向计算
- 通过对回测正向和负向参数组进行T检验,识别指标发出信号的实验方向(正向、负向或不确定)。
- 举例表5中显示多个煤炭相关指标的统计显著正负方向结果,突出实验方向的严格数据驱动。
- 统计显著性设定为0.2,保证结果相对稳健。[page::7]
2.4.3 最终方向确定
- 根据逻辑方向和实验方向的关系制定规则决定是否采纳指标及其最终方向:
- 两者均确定且方向相反,舍弃指标。
- 一方不确定,采纳另一方。
- 两方均不确定,舍弃。
- 考虑全样本与最新样本(2021-2024)双阶段一致性,再次剔除方向不稳指标。
- 测试阶段,还采用距离最小法挑选参数组,兼顾最高收益与稳健性,防止过拟合,提升模型样本外表现。[page::8, 9]
3. 景气指数构建与综合
3.1 单指标景气指数
根据前述流程,对每个指标进行回测、方向判定、参数选择,计算出该指标的择时仓位。图7、图8为“公共财政支出:文化旅游体育与传媒“指标示例,显示其仓位历史与相对净值表现,展现模型具备一定的择时能力。[page::9, 10]
3.2 综合景气指数
将行业内所有指标对应仓位进行等权综合,得到行业整体景气指数,实现指标集成效应,提高指数的信噪比和稳定性。报告附录展示了28个申万一级行业的景气指数时间序列及回测净值。[page::10]
4. 全行业景气结果展示
4.1 样本外择时效果验证
- 将回测分为样本内(2016-2021)和样本外(2022-至今)。
- 策略为每期选取景气指数最高的5个行业等权持有。
- 样本内年化超额收益最高达35.4%,样本外保持正收益8.1%。
- 参数选取采用距离最小法选取收敛区间中稳定代表组,避免仅选取收益最高组导致过拟合,保障模型泛化能力。
- 图9展示参数组不同选择下样本内外收益表现,支持模型稳健性。
- 图10显示全样本回测净值曲线、相对万得全A指数及相对行业均值的超额累积收益,表明策略具备持续择时能力。[page::10, 11, 12]
4.2 最新景气预测
- 利用全样本(2015-2024)数据重新训练、选参,获得最新模型。
- 最新模型样本内年化超额收益提升至36.6%。
- 2024年8月预测景气度最高行业为:石油石化、钢铁、公用事业、通信、国防军工,具有逻辑和数据支持的合理性。
- 附图11及表10清晰列出了各行业景气指数排名,支持构建动态行业配置。[page::11, 12, 13]
5. 风险提示
- 模型基于历史数据,可能不适应未来市场环境变化导致关键指标方向或强度改变,最优参数失效。
- 当市场环境不适合景气度投资时,模型收益会显著下降。
- 本结论纯基于量化框架,与其他研究团队观点可能冲突,投资者需注意分辨及风险控制。[page::13]
---
3. 图表深度解读
3.1 指标与样例图
- 表1(第3页):列举通信、计算机、食品饮料等行业代表宏观指标与中观指标,例如“服务器产量累计同比”、“酒、饮料和茶制造业增加值同比”等,体现指标覆盖面和多维度数据来源。
- 图1(季节性指标示例) 显示用电量指标存在明显季节性波动,说明进行同比处理帮助揭示真变化趋势。
- 图2(持续增长型指标示例) 显示工业产能指数的长期持续增长趋势,提示需一阶差分捕捉边际变化。
3.2 仓位函数图解
- 图3&4(离散仓位函数) 展现仓位跳跃问题,模型避免采用此类函数作为主仓位函数。
- 图5&6(连续仓位函数) 通过两个阈值线性过渡区间,平滑仓位减少跳跃,提升模型稳定性。
3.3 参数选择回测表现
- 表8列示医药制造业出口交货值指标几年内不同参数组合对应超额收益、夏普比率和最大回撤等表现,展示参数筛选兼顾收益与风险的流程。参数排序及最小距离组体现了平衡收益和稳健性的实操细节。
3.4 行业景气预测与轮动回测
- 图9展示样本内外不同参数选取组成策略收益,样本内最高的单组达41.4%但样本外收益为零,反映过拟合现象。距离最小组年化8.1%的样本外收益显示模型泛化能力。
- 图10全样本行业轮动净值曲线展现了策略的逐步累积超额收益,红线、绿线对比强调策略相对于行业和全市场的跑赢能力。
- 图11及表10详细呈现2024年8月行业景气指数水平,其中石油石化0.89领跑,钢铁、通信、公用事业紧随,体现当前及未来行业轮动方向。
3.5 附录全行业景气指数及回测净值
13-22页多张行业景气指数及回测净值图展示了28个申万一级行业的景气波动和策略表现,例如传媒、钢铁、公用事业、机械设备等。整体展示了模型对于不同行业景气周期的捕捉能力及择时绩效,图形中心线0.5作为分界线,高于0.5时代表景气度较好,表现出行业景气波动的周期性特点。[page::4-22]
---
4. 估值分析
本报告主体不涉及传统的公司估值模型(如DCF、PE等),而是基于宏观与中观指标构建定量择时模型。重点在于量化信号如何映射到仓位决定,从而实现行业景气度的投资盈利。估值层面通过景气指数与投资收益展示模型价值,未采用标准估值框架。
---
5. 风险因素评估
- 市场环境变化风险:历史指标的方向性可能因政策、经济结构调整而变化,导致模型失效。
- 参数适应变化风险:最佳参数可能随时间推移产生漂移,未能及时调整将影响效果。
- 模型局限风险:模型未覆盖全部重要指标及行业特有因素,可能导致部分行业景气度判断失准。
- 观点差异风险:模型观点独立,与研究所其他团队持有不同立场,投资者需综合多方意见。
摘要建议中明示风险,提醒投资者理性对待模型输出。[page::0, 13]
---
6. 批判性视角与细微差别
- 数据过拟合风险较高:样本内超额收益高达35%以上,而样本外降至8.1%,虽表现稳健但明显收益缩水,意味着模型存在过拟合倾向,尤其是在参数选择上需更加注重泛化能力。
- 方向判定的主观与实验结合:逻辑方向依赖人工定义,可能引入主观偏差;实验方向虽基于统计测试但显著水平较宽松(0.2),可能存在噪声干扰。
- 指标方向稳定性控制不足:虽考虑了不同时间段方向一致性,但仍有部分指标因市场快速变化表现不稳,削弱模型预测的连续性。
- 评价指标单一:主要通过年化收益和部分风险指标衡量,缺少对交易成本、流动性约束等实际操作影响的讨论。
- 行业景气指数输出较为理性,但缺少解释性深度:未涉及个别行业内因子细分与驱动力分解,对行业周期型原因没有展开,这可能限制投资者理解深度。
总体来看,报告方法论严密、数据丰富,但在主观逻辑和数据驱动之间的平衡及模型的多层次稳健性尚有提升空间。[page::2,8,10]
---
7. 结论性综合
本文成功提出了一个自动化程度较高的全一级行业景气指数构建方法,通过将近一千个宏观与中观指标的历史数据进行严格预处理和筛选,结合非线性连续仓位函数,建立面向申万28个一级行业的景气度模型。指标方向标定结合逻辑和实验方向的严谨判定机制,有效剔除方向不稳指标,保障模型的稳健性。
多年来的样本内回测显示出超过35%的年化超额收益,而样本外期间(特别是市场较为复杂的2022年至今)仍保持正向超额收益8.1%,体现模型的实用价值和适应性。选取最优参数组时采取距离最小法,有效避免过拟合,提升了样本外预测能力。通过等权整合各指标仓位,形成行业层面的综合景气指数,进一步提升了景气度信号的表征能力。
图表中详尽展示了参数测试、仓位与净值关系、行业景气指数以及轮动回测结果,结合2024年最新预测,推荐关注石油石化、钢铁、公用事业等行业的景气度领先地位,为行业配置提供数据支撑。
风险提示明确模型受历史数据限制及环境变化影响需警惕,报告侧重于量化指标表现,较少涉及微观层面逻辑与估值模型,适合搭配其他研究工具使用。
综上,本报告构建了一套科学、自动、高效的行业景气指数体系,适合指导行业轮动与资产配置。投资者可基于模型输出结合实际市场情况灵活调整配置比例,实现较为稳健的超额收益目标。[page::0-22]
---
重要图片引用
- 图1:季节性指标示例
- 图2:持续增长型指标示例

- 图5:正向连续仓位函数
- 图9:景气度最高5个行业轮动回测净值

- 图10:全样本行业轮动净值
- 行业景气指数附录示例(传媒)

- 回测净值附录示例(传媒)
(更多图表详见报告后续页码)[page::4,6,11,12,13,18]
---
此分析全面覆盖了报告的核心内容、关键数据、图表解读和方法论,包含风险提示及批判性意见,文字长度达到专业金融分析报告级别。