`

商品基本面量化研究之铁矿石

创建于 更新于

摘要

本报告基于向量自回归(VAR)模型和IVX回归方法,系统分析了铁矿石价格的基本面影响因素,包括供给、需求、库存和成本,并结合宏观变量探讨其对铁矿石收益的作用机制。实证发现,铁矿石收益率与部分基本面因子如粗钢产量季调值、港口发货量、矿山产量等显著负相关;资源国兑美元汇率为显著宏观预测因子。样本外季度长线预测准确率优于短线预测,有效预测占比达70%以上,构建的预测策略年化收益最高达32.37%,夏普率1.59,最大回撤低至-16.2%,为铁矿石量化交易提供科学参考。[page::0][page::14][page::30][page::31]

速读内容


行业与产业链概况 [page::4][page::5][page::6]


  • 全球铁矿石主要产自澳大利亚(41%)和巴西(21%),形成寡头垄断。中国是最大进口国且需求占全球60%-70%,但缺乏定价权。

  • 钢铁产业链由上游铁矿石、煤炭至中游钢铁及下游多个应用领域构成,需求具明显季节性。大商所铁矿石期货与现货价格相关性高。



基本面因子分析 [page::7][page::11]


  • 供给侧因子包含海外港口发货量、国产矿产量、废钢价格比等,需求侧采用高炉开工率、粗钢季调产量、终端采购量等,库存和成本因子也纳入研究。

- 相关系数显示大部分因子相关性较低,部分如废钢价格与高炉开工率相关度高,需进行多重共线性剔除处理。
  • 宏观因子通过影响需求侧基本面间接作用于铁矿石价格,资源国兑美元汇率为重要宏观变量。


量化模型与因子关系 [page::14][page::15][page::16]

  • 采用VAR模型分析供给、需求、库存、成本因子与铁矿石价格的动态关系,选择滞后阶数p=2。

- 结果表明滞后二阶的中钢协粗钢季调产量和终端采购量环比与铁矿石收益率显著负相关,滞后一阶的海外港口发货量同比和滞后二阶矿山铁精粉产量环比亦与收益率负相关。
  • 格兰杰因果检验显示铁矿石价格与粗钢产量、矿山产量互为因果关系,体现基本面交互影响机制。




样本内预测结果(IVX回归) [page::19][page::20]

  • 采用Kostakis(2015)扩展的IVX回归处理变量内生性及持续性问题,检验基本面以及宏观因子样本内预测能力。

- 供给、需求、库存因子中SI(废钢比)、Bfor(高炉开工率)、Cspd(粗钢产量季调)、Ironpd(矿山产量)及Smi(钢材库存)为显著预测因子。
  • 资源国汇率因子(澳元兑美元、巴西雷亚尔兑美元)显著影响铁矿石收益率,宏观其它变量主要通过基本面间接影响收益。


样本外滚动预测与策略验证 [page::21-31]



  • 短线单因子样本外预测有效占比高达90%,方向准确率仅55.2%,低于24个月滚动均值预测。

- 长线季度滚动预测有效占比约72%,方向准确率提升至70.5%,预测稳定性明显增强。
  • 经济衰退期预测准确率最高,达到77.8%,显示经济周期对预测性能影响显著。

- 构建基于样本外滚动预测的交易策略,季频加阈值过滤与止损年化收益19.83%,夏普率1.10,最大回撤-15.4%;月频策略年化收益32.37%,夏普率1.32,最大回撤-25.7%。季月组合策略综合表现更优,年化收益25.53%,夏普率1.59,最大回撤-16.2%。

风险提示 [page::0][page::31]

  • 预测模型准确率可能受不确定性因素干扰,投资需注意市场风险和模型局限性。

深度阅读

商品基本面量化研究之铁矿石 —— 深度解析报告



---

1. 元数据与概览


  • 报告标题:《商品基本面量化研究之铁矿石》

- 发布日期:2018年8月8日
  • 发布机构:上海东证期货有限公司,东方证券研究所衍生品研究院

- 主笔分析师:田钟泽,高级分析师(金融工程)
  • 主题:研究铁矿石价格的影响因素,通过宏观经济指标与基本面因子(供给、需求、库存、成本)建立模型,进而预测铁矿石现货价格走势,验证预测模型效果并设计量化交易策略。

- 报告核心论点
- 宏观指标通过调节下游产业需求影响铁矿石价格,基本面因素(供给、需求、库存、成本)直接决定价格形成。
- 利用向量自回归(VAR)模型和扩展的工具变量回归模型(IVX回归)研究铁矿石收益率的驱动因子及预测能力。
- 充分考虑了变量内生性和时序特征,模型预测效果在中长期优于短期,投资策略在月度和季度频率组合表现良好,实现较高年化收益和夏普比率。
  • 风险提示:不确定因素对模型预测准确性构成风险[page::0] [page::30]


---

2. 逐节深度解读



2.1 影响铁矿石价格的因素



产业链特点


  • 铁矿石是钢铁生产最关键的原材料,生产1吨生铁约需1.6吨铁矿石,铁矿在生铁成本中占比超过60%。

- 铁矿石形态包括块矿、粉矿、精矿等,国内铁矿石不具备定价权,全球依据第三方现货指数(TSI、MBIO、Platts)定价,且普氏指数主导价格形成。
  • 全球铁矿石生产高度集中,澳大利亚和巴西产量合计占比超过60%,三大矿商必和必拓、力拓、淡水河谷控制全球78%海运市场,形成寡头垄断。

- 中国是全球最大铁矿石消费和进口国,但因钢铁业集中度低,导致定价话语权弱,进一步加剧对海外矿商的依赖。

图表解读
  • 图表1:全球铁矿石主产国产量占比

澳大利亚41%、巴西21%、其他20%、印度5%、中国6%、俄罗斯7%分布清晰表现出澳巴产量主导地位。

  • 图表2:中国铁矿石进口来源

我国60.5%的进口矿石来自澳洲,巴西16.9%,进口来源集中,且澳洲依赖度长期维持高位。

  • 图表3:中国大陆进口结构变化

2005-2017年间澳大利亚进口占比显著上升,印度进口逐渐减少被南非超越,巴西相对稳定。

  • 钢铁产业链及黑色金属关系描述详尽,图4和图5阐明铁矿石、焦煤(炼焦煤转化)和焦炭的成本结构,强调延伸的供需链和产业传导机制。


  • 交易数据表现出铁矿石期货价格与现货基准价紧密相关,且与钢材特别是螺纹钢期货相关性稳定在0.7以上,反映市场与产业链紧密耦合。



基本面因素


  • 供给主要来自海外进口和国产矿,分别用海外港口发货量同比、进口矿库存天数环比、国内矿山铁精粉产量环比等指标衡量。

- 废钢价格相对于铁矿石价格的比值反映废钢对铁矿石的替代压力,对价格具有抑制作用。
  • 通过对变量平稳性处理,譬如对铁矿石到货量进行环比处理,确保时间序列建模的合理性。(图8、图9展示了环比处理前后的ACF/PACF显著收敛差异)


  • 钢铁需求面选取高炉开工率、钢厂盈利比例、粗钢产量季调值、螺纹钢终端采购量环比等,季节性调整显示粗钢产量数据明显的季节波动,去季节后数据满足平稳性要求(图11、图12)。


  • 库存和成本因素也对价格形成关键影响,库存充足时价格趋弱,成本中特别强调铁矿石海运费用的波动及其对进口矿实际到岸价的影响。
  • 经过统一处理后基本面因素指标各自相关性适中,非共线性问题较轻(图14)。



宏观因素


  • 宏观因素反映经济周期影响,选取工业增加值、PMI、房地产投资、通胀指标、货币供应、利率指标和汇率因子,特别重视资源国(澳洲、巴西)货币兑美元汇率。

- 多重共线性显著,通过VIF方法剔除高相关指标,简化指标库并保证模型鲁棒性(图15-18)。


---

2.2 基本面因子与铁矿石收益率关系探讨


  • 使用向量自回归模型(VAR),兼顾内生性和异期相关性,滞后阶数选2阶(基于AIC、BIC准则)。

- VAR模型回归系数和脉冲响应分析显示,铁矿石收益率显著关联因子较少,具体包括:
- 需求因子:中钢协会员企业粗钢产量季调值(Cspd)和螺纹钢终端采购量(Wsp)的滞后二阶,均与铁矿石收益率负相关。
- 供给因子:海外港口铁矿石发货量同比(Ship
vol)滞后一阶和国内矿山铁精粉产量环比(Ironpd)滞后二阶同样负相关。
  • 各变量自相关强,且存在复杂的异期相关关系以及多层次动态影响关系。

- 脉冲响应图表明多数因子对铁矿石收益率的影响在10期左右趋于稳定。
  • 格兰杰因果检验确认Ironpd和Cspd与铁矿石收益率呈相互因果关系,体现产业链上下游联动特征。


相关图表
  • 图表20-24详细展示了VAR模型的回归系数矩阵及脉冲响应函数曲线,验证了不同基本面因子对铁矿石收益的动态传导关系。

- 图表25展示格兰杰因果检验统计,多个基本面因子相互影响且同时影响铁矿石收益率。[page::14-18]

---

2.3 样本内预测结果


  • 经典OLS回归受变量内生性及时间序列非平稳性限制,不适合金融时间序列预测。

- 采用扩展的IVX回归方法,能有效处理变量的持续性强度及内生性问题,估计更为稳健。
  • 基本面指标中废钢价格比(SI)、高炉开工率(Bfor)、粗钢产量(Cspd)、矿山铁精粉产量(Ironpd1)、钢材库存(Smi1)等对铁矿石收益率有显著预测力。

- 宏观因子中资源国货币兑美元汇率(澳元、巴西雷亚尔)显著影响铁矿石收益,而其它宏观因子通常间接通过基本面影响铁矿石价格。
  • IVX与OLS结果对比显示,对近似平稳变量IVX更优,尤其是库存类指标。

- 宏观指标对钢厂开工率和产量及库存影响显著,是推动基本面因子的关键机制。

---

2.4 样本外预测结果



短线滚动预测


  • 采用不同长度的滚动窗口样本外探索短期预测能力,结果RSquared指标普遍负值,表示预测模型不及24个月滚动均值预测。

- 短线预测方向准确率约55%,预测指标持续性不足,预测有效比最高指标约占20%时间。
  • 有效预测占比较高的指标包括巴西雷亚尔兑美元汇率、美元指数、矿山铁精粉产量、钢材库存、中钢协粗钢产量等,体现供需和汇率的影响。

- 预测准确方向随时间波动,短线预测结果受外部扰动影响较大,稳定性有限。
  • 个别指标短线预测方向准确率超过60%,但整体回归效果仍不理想。


长线滚动预测


  • 长线预测考虑收益率未来3-6个月走势,滚动窗口预测中k=3表现最优,方向准确率达到70%以上,RSquared接近甚至微弱正值。

- 预测效果随着滚动窗加长有所下降,k=6、k=12的预测效果差。
  • 长线预测指标有效预测占比显著提升,尤其是海外港口发货量(Shipvol)、美元指数(USDXd)、钢材库存(Smi1)、粗钢产量(Cspd)、高炉开工率(Bfor)等。

- 经济周期影响明显,衰退期和滞涨期预测准确率较高,复苏期较低,反映经济状况对预测效果的调节作用。

样本外预测策略验证


  • 构建季频和月频量化交易策略,根据预测信号做多空交易,不计手续费与滑点。

- 季度策略持仓3个月,起始日效应明显,采用多个起始点等权加权组合降低策略波动。
  • 加入止损机制减少最大回撤,止损阈值-1.5%为经验选择。

- 策略收益:
- 季频组合策略年化收益约19.83%,夏普率1.10,最大回撤15.4%。
- 月频策略加入趋势过滤和止损,年化收益32.37%,夏普率1.32,最大回撤25.7%。
- 两频率组合策略进一步升至年化收益25.53%,夏普率1.59,最大回撤16.2%。
  • 策略对趋势行情表现较好,震荡行情预测准确度下降,组合策略减缓震荡期影响。

- 波动控制手段(阈值过滤、趋势过滤、止损)大幅提升策略的稳健性和收益风险比。

相关图表
  • 图表28-31短线预测表现,图表33-36长线预测表现,图表37-43策略净值与风险指标详细展示量化交易效果。[page::21-30]


---

2.5 主要结论总结


  • 铁矿石价格受宏观经济和产业链供需双重作用影响,但宏观变量主要通过影响需求端基本面来传导价格变化。

- 供给端的海外铁矿石发货量,需求端的粗钢产量和螺纹钢采购量,以及库存和成本因素,是影响铁矿石收益率的关键基本面因子。
  • 利用VAR模型揭示因果关系和动态影响,采纳IVX回归突破内生性和非平稳性难点,提升预测有效性。

- 短期样本外预测鲁棒性不足,长期和季度频率预测表现显著优于短期,尤其是在经济衰退期。
  • 汇率因子(美元兑巴西雷亚尔与澳元)为重要的宏观预测工具,因其影响海外矿山成本与出口。

- 基于预测构建的量化策略在风险调整后获得稳健正收益,适合捕捉趋势行情,且通过风险管理措施提升策略表现。
  • 综上,铁矿石现货价格有部分可预测规律,利用产业链基本面与宏观指标结合的金融工程方法能够提供一定投资决策支持。


---

3. 图表深度解读



以下针对部分关键图表做详尽说明:

图表1-3:全球及中国进口结构


  • 数据从全球供应格局、资源来源结构和时间演变三个视角,清晰展示澳巴主导地位,上述结构直接影响国内价格形成及调整空间。

- 进口结构变化说明产业链供需变化,对价格形成有连锁效应。

图表8-12:时间序列平稳性处理及季节调整


  • 图表8-9原始数据自相关与偏自相关显示强滞后趋势,环比处理后指标平稳性明显提升。

- 粗钢产量季节调整体现产业周期性因素,剥离季节性波动,为后续定量分析创建条件。

图表14-18:相关系数和方差膨胀因子


  • 相关系数热力图和VIF分析确保在建立模型时降低变量间共线性问题,提高模型估计的有效性和稳定性。


图表20-24:VAR模型回归结果及脉冲响应


  • 回归系数矩阵详细列出各变量滞后一期和两期对自身及其他变量的影响强度及显著性,体现基本面变量间的动态交互。

- 脉冲响应函数分别体现供给、需求、库存及成本因子的冲击对铁矿石收益率的短期响应过程和幅度。

图表25:格兰杰因果检验


  • 统计量检验显著因子的因果双向关系,支持价格与供需变量存在反馈机制。


图表26-27:全样本内回归


  • IVX回归结果揭示部分基本面因子与宏观指标对铁矿石收益的显著预测能力,结构清晰。


图表28-31 & 图表33-36:样本外预测表现


  • 通过多个指标和窗口长度的比较,展示短期与长期预测的差异,短期预测准确率不足,长期趋势预测表现改善。


图表37-43:投资策略表现


  • 净值曲线和风险指标展示不同条件下策略收益、夏普率和最大回撤,验证策略稳健性和风险控制效果。


各图表数据均来源于Wind数据及东方证券研究院统计,绘制专业规范,能够有效支撑报告观点[page::4-31]。

---

4. 风险因素评估


  • 模型预测精准度受不确定因素干扰,包括宏观环境突变、产业政策调整、市场非理性波动等。

- 输入数据质量、频率不一致和可能的结构性变革也会影响模型稳定性。
  • 策略风控反复强调止损及资金组合分布,缓解单点偏误风险,但不可完全消除市场系统性风险。

- 短期市场波动较大导致短线预测能力有限,投资者应警惕过度依赖日内信号的风险。

综上,报告提出的风险提示针对预测模型准确性的系统性影响,督促用户结合多种工具和审慎对待结果[page::0,31]。

---

5. 批判性视角与细微差别


  • 报告较好地融合了宏观和微观基本面,兼顾了变量内生性,采用先进方法IVX回归克服OLS局限,增强预测的实用价值。

- 但短期预测效果有限,方向准确率仅55%,表现接近随机,说明在市场短期波动中,供需基本面因子及宏观因子预测能力受限。
  • 经济周期对预测能力影响显著,衰退期预测表现最好,可能与市场波动加剧、价格调整机制更明显有关。

- 由于时间跨度及数据样本限制,经济周期效果统计具有一定偶然性,未来长周期验证仍需关注。
  • 变量平稳性和数据处理上的处理(环比、季调、异常值剔除)降低了指标的解释力,模型可能忽略了部分非线性或微观结构影响因素。

- 起始点效应显著,需要策略组合减少偶然性,这反映实际市场操作需考虑制度性与市场情绪因素。
  • 此外,海外矿商的寡头垄断定价权意味着模型预测结果更多反映需求侧和成本波动,价格操纵风险不能完全排除,这在高度集中市场中是固有的未知变量。


总体上,报告方法论先进,分析深入,但预测模型本质上仍受大宗商品市场复杂性限制,应结合多讯号和市场判断综合使用[page::18-31]。

---

6. 结论性综合



本报告通过系统地梳理中国铁矿石产业链特征,结合供给、需求、库存和成本四大基本面因子,以及宏观经济指标,构建了多层次、多频率的动态预测模型。采用向量自回归(VAR)揭示了基本面因子间的多期交互影响及价格反馈机制,并通过IVX工具变量回归缓解样本内估计中的内生性问题。

短期样本外预测表现一般,方向准确率55%左右,预测指标的持续有效时间较短,受市场噪声干扰较多。而长期(季度及以上频率)样本外预测效果明显优于短期,方向准确率70%以上,与24个月滚动均值预测性能接近,且具有较强的统计显著性。

关键的预测指标包括海外港口铁矿石发货量同比、美元指数、资源国兑美元汇率、粗钢产量和钢材库存等。经济周期对预测效果存在明显调节作用,衰退期和滞涨期的预测准确率较高,反映宏观经济环境对需求端敏感度。

基于上述模型构建的量化交易策略,月频结合趋势过滤和止损,季频引入阈值过滤和起始日多策略组合,有效降低了回撤风险,提升了年化收益率和夏普率,表明模型具备一定操作指导价值。

报告彰显了宏观与产业链基本面因子在铁矿石价格形成机制中的核心地位,通过科学的数据处理和前沿计量方法,实现对铁矿石价格的定量理解和预测。但模型亦存在短期波动应对不足、内部假设及数据处理可能导致的局限性,使用时应多角度验证与风险控制。

总体评级:持中性偏多看法,长线趋势判断更具参考价值,建议结合宏观经济动态及产业政策变化灵活应用并注重风险管理。

---

附录:图表示例
  • 全球铁矿石主产国产量占比:



  • 中国铁矿石进口来源结构变化:



  • 供给因子对铁矿石收益率脉冲响应:



  • 样本外滚动预测策略表现(月频加止损&等权季频组合):




---

结语



本报告是一份结构完善、数据详实、方法精准的专业金融量化研究,适用于中长期投资分析和风险控制,能够为投资者和产业链参与者提供有价值的决策参考和市场洞见。

[page::0,4-31]

报告