`

中金:如何利用大模型实时预测宏观经济指标?

创建于 更新于

摘要

本报告旨在解决宏观经济指标发布时间滞后问题,提出结合自回归模型与大语言模型(LLMs)的实时预测框架,通过解析宏观研究报告文本,提升经济指标的即时预测能力。研究发现,自回归模型适用于平稳且趋势性弱的指标,大语言模型则在非平稳或传统模型效果较差指标上表现出显著提升,特别是在预测新增人民币贷款等指标相关性由-0.1提升至0.9。报告详细对比了常用实时预测方法优缺点,并通过多指标实证验证了LLMs结合文本的预测优势,为宏观经济的快速响应和投资策略调整提供新思路[page::0][page::3][page::8][page::9][page::10][page::12]。

速读内容


宏观数据实时预测的重要性与方法选型 [page::0][page::1][page::2]

  • 由于宏观经济数据发行存在滞后性,影响资产配置与市场择时的时效性,实时预测成为必要。

- 主要方法包括:1)基于高频拆分数据的GDPNow模型,2)结合季节性及外生因子的自回归差分移动平均(SARIMAX)模型,3)大语言模型(LLMs)文本解读法。
  • 不同方法在数据需求、适用性及解释能力上差异显著,本文重点对比自回归模型与LLMs方法效果。


自回归模型的适用性与效果评估 [page::3][page::4][page::7]


| 宏观指标名称 | 沿用上期相关性 | 自回归模型相关性 | 调整方式 |
|------------------|---------------|----------------|------------|
| 金融机构各项贷款余额:同比 | 0.98 | 0.98 | 无调整 |
| CPI:当月同比 | 0.91 | 0.90 | 无调整 |
| 社会消费品零售总额:同比 | 0.75 | 0.68 | 春节效应调整 |
| 贸易差额:当月值 | 0.55 | 0.65 | 春节效应调整 |
| CPI:环比 | 0.18 | 0.57 | 春节效应调整 |
| 新增人民币贷款:当月值 | -0.10 | 0.25 | 无调整 |
  • 自回归模型适合平稳且趋势性弱的指标,能利用时间序列特性与少量外生变量,有效剥离春节效应。

- 对非平稳指标或方差波动剧烈的指标(例如新增人民币贷款),模型预测效果不稳定且平滑度偏高。
  • 部分指标沿用上期数据即可,无需构建复杂模型。


大语言模型(LLMs)结合文本信息的实时预测优势 [page::5][page::6][page::8][page::9][page::10]

  • 利用朝阳永续的向量化数据库,通过关键词搜索宏观研究报告标题与内容,输入LLMs生成实时预测信号。

- 四种输入策略中,“仅输入当月相关报告标题”效果最佳,克服了内容匹配质量不稳定的问题。
  • 实时预测相关性显著提升:新增人民币贷款由-0.1提升至0.9,出口金额同比从0.37提升至0.72,贸易差额提升至0.76。

- 过度依赖参考自回归预测值会限制模型预测发挥,降低预测准确性。
  • 大模型对极值捕捉平滑,但趋势判断更敏锐,整体实时预测准确度普遍优于传统模型。




代表指标预测效果对比展示 [page::8][page::10][page::11]

  • 出口金额同比、工业增加值、贸易差额、新增人民币贷款等关键宏观指标实时预测结果,LLMs结合研报标题的预测曲线与真实值吻合度显著优于自回归模型及沿用上期值。










结论及投资启示 [page::12]

  • 实时预测可分层应用:上期相关性强者直接沿用,平稳指标用SARIMAX回归模型,非平稳且传统方法效果差用LLMs文本分析。

- LLMs通过捕捉市场分析师观点,对实时经济状态判断较为灵敏,适合辅助宏观经济管理与资产配置快速响应。
  • 未来可持续完善输入数据质量与模型稳定性,实现更高频率、更精细化的宏观经济预测。


深度阅读

详尽分析报告:《如何利用大模型实时预测宏观经济指标?》——中金公司研究部



---

一、元数据与概览


  • 报告标题:如何利用大模型实时预测宏观经济指标?

- 作者:陈宜筠、郑文才等
  • 发布机构:中金公司研究部

- 发布日期:2025年7月10日
  • 研究主题:宏观经济数据的实时预测方法,特别是利用大语言模型(LLMs)结合宏观研究报告进行实时预测的创新框架,提升宏观经济指标的预测时效和准确率。


核心论点:传统宏观经济指标发布具有一定滞后性,实时准确掌握宏观经济动态对资产配置及投资策略至关重要。常规的实时预测方法主要有高频数据拆分和自回归模型(SARIMAX),但存在局限。本文提出并评估了基于大语言模型结合宏观研报文本的实时预测方法,在多项指标上表现出显著的提升效果,尤其是对部分自回归模型难以准确预测的指标,如新增人民币贷款等。

---

二、逐节深度解读



1. 宏观数据滞后性与实时预测必要性



报告开篇明确指出,宏观经济指标因统计周期长(如月末或季末收集、校验数据)存在显著发布时间滞后,因此需要构建实时预测模型及时捕捉宏观经济动态。传统策略“定期后移法”、“动态后移法”固然简易但无法提升预测及时性,只有“实时预测法”能够解决这一滞后弊端,尽管代价是更高的数据维护成本以及模型随机性[page::0,2].

2. 实时预测常用方法对比



主要介绍了三种主流实时预测方法:
  • 高频拆分数据模型:例如“GDPNow”模型,通过拆解GDP各组成部分用高频季度和月度数据加以预测,具有较强可解释性和稳健逻辑,但因需大量专业拆分规则且难以广泛系统化应用,且高频数据噪声大导致过拟合风险[page::0,2,3]。

- 自回归差分移动平均模型(SARIMAX):基于时间序列的历史相关性提取并结合季节性及外生变量(E),适合高频且满足平稳假设,外生冲击有限的数据,模型稳健且计算低复杂度。春节效应作为非规律性季节因素被作为外生变量单独剔除,提高模型对中国独有季节性调节的适应性[page::2,3,4,5]。
  • 基于大语言模型(LLMs)的文本信息解析:借助LLMs对非结构化的宏观新闻、分析师研报等文本进行语义理解和逻辑推理,实时生成宏观指标预测信号,突破传统计量模型对数据平稳性及结构的限制,能够敏锐捕捉市场变化及突发事件信息,适用性更广,但存在信息质量依赖和随机性挑战[page::0,1,3,5,6]。


3. 指标选取与数据基础



研究聚焦于月频宏观数据,特别是存在发布时点滞后的关键指标,如工业增加值、工业投资、社零总额、进出口金额、贸易差额、社会融资、M2及人民币贷款等14个指标。剔除季度GDP、PMI及日频汇率,确保数据时间长度满足建模需求,便于统一基准较量[page::4]。

4. 自回归模型细节与春节效应处理


  • 春节效应因年份变化导致特定月份的统计异常,简单季节参数无法捕捉到偏移期,故采用春节占比作为模型外生变量对其剥离,提升自回归拟合的准确性。

- 建模时点采用"滚动扩展窗口"方法,确保拟合基于截止当月的历史数据,避免未来信息泄露[page::4,5,6]。

5. 实时预测判断流程与模型选择


  • 首先针对与上期指标相关性极高($\geq 0.8$)的指标,采用最简化“沿用上期值”,规避模型复杂度及失效风险。

- 对于相关性较低且满足平稳性等假设的指标,采用SARIMAX模型进行实时预测。
  • 对于自回归模型效果欠佳或不满足模型假设的指标,采用LLMs结合宏观研报文本进行预测以期突破传统模型瓶颈[page::1,6,7].


6. 自回归模型预测效果评估


  • 自回归模型对平稳且具有相对弱趋势的指标提升有效,如CPI环比等。

- 对于高相关性指标(如金融机构贷款余额同比、PPI当月同比),沿用上期值和自回归效果相当,无明显提升。
  • 具有明显节日效应的指标(社零同比、贸易差额、CPI环比)在春节调整后自回归能力有所提升。

- 自回归效果较弱指标典型代表为新增人民币贷款,因该指标方差随时间变化较大且趋势明显,模型参数不稳定导致预测平滑且不尽准确[page::6,7,8].

7. LLMs结合宏观研报文本的实时预测框架


  • 利用朝阳永续向量化数据库,通过关键词检索获取相关研报标题及对应内容向量。

- 采用DeepSeek大语言模型,通过设计特定prompt指令,要求模型全量阅读标题,进行语义分析,结合逻辑推理输出精确的当前指标预测值及推理说明。
  • 支持带或不带自回归预测参考值,探讨引入自回归预测对模型表现的增强作用[page::5,6].


8. LLMs预测效果显著优于自回归


  • 在11个指标中,LLMs对绝大多数指标的预测相关性优于自回归和沿用上期值,尤其对新增人民币贷款(由-0.1跃升至0.9)、出口金额、贸易差额表现提升明显。

- 仅对CPI环比预测效果略逊于自回归,可能因该指标本身平稳且历史规律稳定,更适合传统模型。
  • 使用研报标题信息的LLM预测效果明显优于使用内容,原因在于内容匹配频次过多且不精确(存在重复引用、表头、定义等无效信息),影响模型语义分析质量。

- 参考自回归预测作为输入对LLM整体预测不具备稳定增强作用,且可能限制文本语义空间,反而降低部分预测效能[page::8,9].

9. 预测效果可视化分析(图表解读)


  • CPI环比自回归预测图:表现为较稳定的预测曲线,体现自回归对该类平稳指标的适用性。

- 新增人民币贷款自回归预测图:自回归预测曲线平滑且滞后,真实值波动剧烈,说明模型对极端变化捕捉不足。
  • 出口金额同比预测图:LLM研报标题预测曲线较真实值贴合,优于自回归与内容预测。

- 工业增加值累计同比预测图:LLM标题预测曲线趋势与实际较为贴近,表现出趋势及时捕捉能力。
  • 贸易差额预测:LLM标题预测平滑,能较好捕捉对应趋势,但极值表现欠佳。

- 新增人民币贷款实时预测:LLM预测曲线波动幅度更大,更贴合实际,体现该方法对突变更敏感[page::8,10,11].

这些图表辅助说明了LLM模型在对非平稳、受突发事件影响大的指标上表现更佳,而传统自回归模型则更适合平稳且趋势弱的指标。

10. 模型预训练对预测的影响考量


  • 文章分析了DeepSeek-R1版本预训练截止时间(2025年1月)前后的模型预测效果差异,除贸易差额指标略有影响外,其余指标无明显预训练信息泄露迹象,降低了未来数据“先知效应”疑虑[page::11].


11. 结论与建议实践方案



报告总结了实时预测宏观经济数据的推荐流程:
  • 高相关性指标直接沿用上期值,操作简单可靠。

- 对趋势弱且平稳的指标,结合季节和春节效应调整的SARIMAX自回归提供辅助提升。
  • 针对非平稳、随机性强或自回归效果欠佳的指标,借助LLMs实时语义分析宏观研报文本进行预测,获得较传统模型更灵敏和准确的预测效果。


同时指出三者各有优劣,前两者均基于历史数据外推、模型逻辑透明,但实时更新速率受历史依赖限制;LLMs虽依赖文本数据质量,有一定随机性与计算成本,但具备突破传统结构化数据限制的潜力,是未来宏观实时分析的重要方向[page::12].

---

三、图表深度解读



图表1:处理宏观数据滞后性的三种方法对比表(第2页)


  • 内容描述:列举“定期后移法”、“动态后移法”、“实时预测法”三种处理方法,从“数据维护成本”、“状态适应能力”、“策略稳定性”三维度进行比较。

- 解读:前三种方案的成本-收益权衡明显,“实时预测法”虽成本最高,但状态适应能力最强,适合对市场高敏感性的需求,支撑本文立意。
  • 联系文本:该表为后续推荐实时预测法带来理论基础[page::2].


图表2:自回归模型输入数据特征图(第3页)


  • 描述五项严苛输入假设,包括差分后平稳性、自相相关性、样本长度、线性关系假设和残差为白噪声。

- 清晰指出自回归模型对数据平稳性和历史相关性强的依赖,提示其局限性。
  • 该图为模型选择和预判效果的关键判断依据[page::3].


图表3:实时预测方法优劣势对比(第3页)


  • 三种实时预测方法在“可解释性”与“系统性应用”间的权衡。

- 显示LLM方法可解释性较弱且存在随机性,强调模型依赖输入信息质量。
  • 支撑报告对方法综合评价的论述[page::3].


图表4:自回归预测效果对比表(第7页)


  • 数据展示多个指标沿用上期、以及自回归模型实时预测的相关系数对比。

- 反映出多指标自回归预测提升有限,部分指标甚至略微下降,突出其局限。
  • 着重强化春节调整后提升指标的案例,指导实践应用[page::7].


图表5~11:多个历史时间序列真实值与预测值的对比图(第8至11页)


  • 各图清晰展示传统沿期值、自回归模型和LLM预测在历史区间内的拟合曲线,体现三者不同的预测特点和优势。

- 例如新增人民币贷款图显示自回归预测曲线过于平滑,LLM则能捕捉更多波动。
  • 出口金额、工业增加值、贸易差额、CPI等图均验证了LLM对趋势捕捉的优越性能。

- 这些可视化直观帮助理解本文多模型结合策略的效果体现[page::8-11].

图表12:贸易差额匹配研报内容示例说明(第9页)


  • 展示研报文本在匹配过程中可能出现的“重复引用”“表头引用”“模糊匹配”、“定义性关键词”等无效数据。

- 佐证本文为何推荐使用研报标题而非全文内容作为LLM输入,以提高数据质量和预测准确度[page::9].

---

四、估值分析



报告无涉及传统企业估值的方法与目标价设定,属于方法论与技术应用类研究,重点在技术路径与模型表现,不涉及金融资产估值分析。

---

五、风险因素评估



报告隐含或明确的风险点包括:
  • 大语言模型的随机性和依赖输入信息质量:模型预测对研报文本质量高度依赖,文本重复、定义、引用内容可能导致语义解读偏差,影响预测稳定性。

- 自回归模型依赖数据静态分布假设:历史参数稳定性不强时,预测会失准,且对非平稳数据无力。
  • 模型预训练信息泄露风险:可能导致回测时刻模型“提前知晓”未来数据,从而放大预测精度,需动态监控预测效果。

- 春节效应剥离的准确性依赖于假期天数占比标定:剥除方式简化,存在模型假设风险。
  • 总体上模型预测行为的随机性和不确定性,未对风险概率及缓解策略作系统化阐述,但文本隐含多模型结合以平滑风险[page::3,6,9,11,12].


---

六、批判性视角与细微差别


  • 自回归模型评估存在历史回测潜在“未来信息”的污染,使得参数和预测表现偏向理想。

- LLM预测虽有效,但“随机性”和“依赖文本输入质量”两大弱点反复被强调,说明模型稳定性和通用性仍需强化。
  • 引入自回归结果作为LLM输入反而抑制预测表现,暗示了模型融合策略尚需更谨慎设计。

- 报告提及春节效应剥除作为外生变量,但该方法本身较为机械,实际节日经济影响更多维度。
  • 易忽视文本数据处理中的重复和无效信息对预测的干扰,实际应用仍需要单独设计高效的文本清洗流程。

- 未公开模型参数、训练细节和输入筛选机制,影响方法复制与验证。
  • 总体来看,报告基于丰富数据和最新模型技术,客观反映不同方法优势和不足,但结论需结合模型实际运行环境谨慎评估。


---

七、结论性综合



本文系统构建了宏观经济数据实时预测的技术框架,以突破传统数据滞后限制为目标,比较了三大方法路径:基于高频拆分数据的传统计量模型、自回归SARIMAX模型以及创新应用大语言模型(LLMs)结合宏观研报文本的实时预测法。
  • 实证验证表明,对于自回归模型适用的平稳、趋势弱指标(如CPI环比),自回归方法提升有限但仍优于简单沿用上期值;

- 对于非平稳、随机性大、外生扰动频繁的指标(新增人民币贷款、贸易差额、出口金额等),LLMs基于宏观研报的文本语义分析方法显著提升预测准确率,相关系数大幅超越传统方法,实现对突发事件和趋势变换更敏锐的捕捉;
  • 大语言模型输入选择上,论文实证显示“研报标题”优于“全文内容”,因后者包含重复、无关及定义性文本,影响模型推理;

- 引入自回归预测作为LLM输入的辅助变量未必提升表现,提示模型融合策略需谨慎设计,防止限制LLM的语义探查空间;
  • 综上,报告提出一个顺序应用策略:沿用上期值 → SARIMAX自回归模型 → LLM文本语义实时预测,力求在稳定性与创新性间平衡,拓展宏观经济指标实时预测的新未来。


通过系列数据和图表的深入解析(新增贷款、贸易差额、出口金额等指标的预测曲线),报告强调了LLMs在宏观实时分析中的应用潜力,特别是在数据质态复杂、传统结构化模型难以支持的环境中,精准捕捉宏观经济态势转折,提升投资配置的前瞻性。

该报告代表中金公司对宏观数据建模最新技术应用的前沿探索,兼顾理论深度与实际应用价值,为投资者和研究人员提供了宏观经济实时监测新的重要工具和研究思路,具有推动资产定价模型迭代的战略意义。[page::0-12]

---

附录:报告中重点图片索引


  1. 实时预测方法优劣势对比图


  1. 自回归模型数据特征要求图


  1. 朝阳永续向量化数据库提取代码示例


  1. LLM基于研报标题实时预测prompt示例


  1. 新增人民币贷款自回归实时预测效果


  1. 出口金额同比实时预测效果对比


  1. 工业增加值实时预测效果对比


  1. 贸易差额当月值实时预测效果对比


  1. 新增人民币贷款实时预测效果对比



---

综上为本报告的全面分析解读,透彻揭示了模型选择依据、数据处理细节和实证效果,明确指出了未来宏观经济实时预测的技术发展方向和挑战,供专业投资者及研究者深入参考。

报告