`

An AI-powered Tool for Central Bank Business Liaisons: Quantitative Indicators and On-demand Insights from Firms

创建于 更新于

摘要

本报告介绍了澳大利亚央行基于人工智能的文本分析和信息检索工具,处理近25年高达22000条企业联系访谈文本,利用现代NLP技术对访谈内容进行主题分类、语调及不确定性分析,并提取定量经济指标(如工资增长率)。该工具显著提升了基于文本的工资增长现用预测(nowcasting)效果,表现优于传统模型,显示了文本数据在宏观经济分析中的潜力 [page::1][page::5][page::19][page::21][page::30][page::34]。

速读内容


央行企业联络文本分析工具概述 [page::1][page::4]

  • 集成近25年数据,包含约22000次访谈,覆盖广泛行业与企业类型。

- 采用BART-large-MNLI模型进行14个核心经济话题的多标签分类。
  • 引入基于FinBERT的金融文本情感分析,测量文本语调。

- 支持关键词扩展和Word2Vec语义相似词添加,增强话题词典建设。


话题暴露度及语调指标的构建与验证 [page::11][page::18][page::19]

  • 通过段落级别文本概率阈值分类定义话题暴露度,结合语调指标反映讨论情绪。

- LM方法与基于关键词的方法话题指数高度相关(约0.75),均能揭示重要经济转折点。
  • 语调随疫情、全球金融危机等事件波动明显。



不确定性指数及具体数值提取方法 [page::20][page::21]

  • 根据定制不确定性词典构建企业层面不确定性指数,波动峰值对应重大经济事件。

- 采用多步NLP技术准确提取访谈文本中的精确数值,如企业自报的价格和工资增长。
  • 提取的数值与官方统计高度相关,且具备Granger因果关系,能辅助宏观监测。



机器学习提升工资增长nowcasting性能 [page::25][page::30][page::32]

  • 将22个文本指标及其滞后变量纳入带岭回归、套索回归和弹性网模型中,配合传统Phillips曲线变量进行工资增长预测。

- 套索回归表现最佳,相较基础OLS模型Nowcast误差降幅约20%-40%。
  • 发现文本信息中信号稀疏,约40%变量在最优模型中未被选中,表明精简模型效果更佳。

- 重要变量包括滞后失业和劳动力利用率差距、工资预期评分及文本提取的工资增长指标。


典型案例分析:2022年劳动力市场紧张情况的文本识别 [page::33]

  • 通过文本识别捕捉“劳动力可用性”、“工资增长”、“边界限制”等关键词,高度还原经济现状。

- 事后基于文本构建的模型可将2022年工资增长预报误差由70基点缩减到20基点,验证文本信息的应用价值。

深度阅读

金融研究报告详尽分析报告


报告元数据与概览


  • 报告标题:《An AI-powered Tool for Central Bank Business Liaisons: Quantitative Indicators and On-demand Insights from Firms》

- 作者:Nicholas Gray, Finn Lattimore, Kate McLoughlin, Callan Windsor
  • 发布机构:澳大利亚储备银行(Reserve Bank of Australia,简称RBA)经济组

- 发布日期:2025年6月
  • 主题:该报告重点介绍澳大利亚储备银行运用人工智能驱动的自然语言处理(NLP)技术开发的一款用于中央银行企业联络信息分析的文本分析和检索工具,辅助货币政策制定,聚焦于企业联络信息的定量指标与即时洞察。


核心论点与目标

  • 中央银行货币政策决策正日益依赖“软信息”源(企业联络访谈等),以补充传统经济统计和模型预测。

- 报告介绍了一款结合传统文本分析与现代语言模型(Language Model, LM)的文本分析和信息检索工具,覆盖23年来约22,000次企业联络笔录。
  • 该工具支持快速查询全文历史记录、聚焦特定主题的兴趣度和语调分析、从文本中抽取精确数值信息(如工资与价格增长数据)三大核心功能。

- 研究成果显示,结合该工具生成的文本指标与机器学习模型,尤其是稀疏信号的特征选择,显著提升了工资增长的“现时预测”(nowcasting)性能,准确度提升约20%。
  • 工具的开放透明设计有望促进其他中央银行类似系统的研发和应用。


该报告为RBA的研究讨论论文序列之一,为中央银行领域应对宏观经济不确定性,利用高级NLP工具处理和解读企业联络信息,提供了系统的介绍、方法学及实证分析。[page::0,1,3,4,5]

---

逐节深度解读



1. 引言(Introduction)

  • 介绍了RBA自2001年始推行的企业联络计划,至今约进行22,000次访谈,涵盖企业、行业协会、政府及社区组织。

- 企业联络提供了“软信息”,补充传统统计与模型,特别在疫情等不确定时期表现尤为重要。
  • 通过图1(提及企业联络次数占声明文本总词数比例)显示RBA对联络信息依赖度逐年增长,尤其设立“Insights from Liaison”专栏之后更明显。

- 指出现有的文本数据量大、结构复杂,人工检索费时且易受认知偏差影响,呼吁用NLP技术系统化解析,提高利用效率。
  • 语言模型被视为捕捉文本语义和情绪的有力工具,可减少人工偏差。[page::3,4]


2. RBA企业联络项目简介(RBA’s Liaison Program)

  • 明确企业联络为正式、持续进行的经济信息收集程序,每月约访谈75个联系人,每年约900次会议。

- 收集四类信息:
1. 企业元数据(名称、行业、规模、地理位置等)
2. 访谈摘要的定性文本,包含企业对需求、投资、用工、成本、工资、价格变动的看法及预期
3. 企业提供的定量经济指标(如工资涨幅百分比)
4. 银行工作人员根据访谈打分(-5至+5,反映变动幅度)
  • 访谈记录以主题方式统一编辑,平均约1200字,覆盖中大型企业和重要组织,样本覆盖结构代表性较强,但小企业存在间接缺口。

- 文档连贯性和规范程度高,便于后续NLP流程。[page::5,6]

3. 解决方案架构(Solution Architecture)

  • 3.1 数据生成与丰富流程

- 企业访谈相关数据存在两个系统:客户关系管理系统(CRM)记录访谈元数据及评分,文件管理系统(FMS)储存访谈文本摘要。
- 两系统由唯一ID关联,为文本分析和检索系统(TARS)构建基础。
- 流程为:自动从FMS抽取访谈文本,转成XML格式保留结构信息(标题、正文、表格等标签),再基于规则和NLP技术给每段文本加上主题、情感等标签,最终入库。
- 历史数据获取难度较大但得益于长期规范记录,实现23年历时数据顺利整合。
  • 3.2 信息提取

- TARS支持用户无代码快速全文搜索,支持复杂多维过滤,提升分析效率。
- 数据每日更新,确保最新资料即可利用。
  • 3.3 新能力

- 简单快速搜索:可同时按关键词、行业、地区过滤,轻松提取相关段落及统计词频。
- 主题和语调分析:
- 使用语言模型(BART-large-MNLI)对段落做多标签主题概率输出,覆盖14个关键宏观主题。
- 主题曝光率定义为某主题相关段落数占总段落数比例,聚合为时间序列指标。
- 采用FinBERT获取段落情感分数(-1至+1),计算主题语调均值。
- 关键词法辅助构建检索词,联合Word2Vec模型建议相关词扩充词典。
- 对主题及语调分类准确率进行了人工复核,精度较高,LM方法精确但召回略低,关键词法更灵敏但易产生误判。
- 示例(图7)展示工资主题露出指数及语调指数与官方工资增长的走势高度相关。
- 不确定性指标:
- 利用基于关键词的词典构造企业层面不确定性指数,覆盖2006年以来多个不确定性高峰期。
- 该指数与其他经济政策不确定性指数存在中度相关,捕捉企业角度独特不确定信息。
- 精确数值提取:
- 利用规则结合语言模型抽取访谈中涉及的具体数字(如工资、价格增长百分比)。
- 由Roberta-base模型回答“价格变化率是多少?”等问题,结合BART-large-MNLI判定涨跌方向。
- 去除分布尾部异常值后,抽取的价格涨幅指数能有效回归并领先官方CPI统计;对应工资增长提取与历史手工数据高度吻合。
- 进而可分析企业层价格涨幅异质性,展示不同时期整体分布及偏态倾向。

综上,报告系统化展示了多层次的文本信号提取方法及数据丰富流程,着力实现中央银行对软信息的量化利用与可视化,为政策制定提供技术支持。[page::7-24]

---

5. 实证应用:工资增长现时预测


  • 研究目的:将联络生成的文本指标纳入机器学习预测模型中,改善澳洲私营部门季度工资价格指数(WPI)的现时预测。

- 基准模型:采用RBA常用的Phillips Curve线性OLS模型,包含工资自身滞后项、失业缺口、劳动力低利用率缺口、通胀预期指标等宏观变量。
  • 文本特征:导入22个主题曝光率、语调、互动项及数值提取的工资增长指标,并引入其滞后变量,共计44个文本相关变量。

- 模型方法
- 采用机器学习中的岭回归(Ridge)、套索回归(Lasso)、弹性网(Elastic Net)等正则化技术防止过拟合,提升模型泛化能力;
- 通过时间序列交叉验证选择正则化强度参数λ及Elastic Net混合参数α;
- 使用扩展样本递增的滚动窗口法,对2015年一季度至2024年三季度共计39个季度进行逐步现时预测。
  • 模型选择与超参数调优

- 交叉验证结果表明Lasso在本案例中稍优,能自动选择一小部分强信号特征,体现模型稀疏性偏好。
  • 结果概览

- 正则化模型显著优于普通OLS线性基准,预防过拟合提升准确度;
- 包含文本指标的模型进一步提升20%左右准确度,显示企业联络文本信息对改善工资增长预测有实质贡献;
- 在疫情及后疫情复杂时期,文本信号贡献更为显著,体现及时反映经济快速变化的能力;
- 尽管文本模型无法全面超越专家主观判断,但效果不相上下,尤其排除疫情初期特殊大幅偏误阶段后表现良好。
  • 变量筛选结果

- 仅约7个变量在超半数模型中被选中,表明文本信息中信号稀疏,大多文本变量影响有限;
- 主导变量包括基准经济指标、工资预期分数、企业自报的工资增长数值指标及劳动力主题曝光率与不确定性指数;
- 按主题曝光率与语调交互作用的变量也在疫情前表现出较强预测力。
  • 具体案例分析——2022年劳动力市场

- 基准模型误判工资增速,未完全捕捉疫情造成的劳动力供给紧缩与工资压力;
- 文本指标揭示高频出现如“laboravailability”、“shortages”等描述,反映企业对岗位空缺和工资上涨共识;
- 如果当时文本指标能纳入模型,将显著减少预测误差,强化了该工具辅助政策判断的价值。

整体来看,将结构化的企业联络文本指标纳入经济预测模型,特别是在宏观不确定性上升时期,有助于提升对工资市场变化的实时把握和预测能力。[page::24-34]

---

图表深度解读



图1:RBA政策声明中“Liaison”一词提及频率趋势(第3页)

  • 描述了2006年至2025年披露的政策声明中,“liaison”提及词汇占比的逐年变化。

- 观察到提及率自2010年前后逐步攀升,2022年加入专栏后激增至0.2%左右。
  • 体现RBA在货币政策中对企业联络信息关注度不断提高,凸显软信息价值。


图2:解决方案架构流程示意(第8页)

  • 展现数据从CRM和FMS系统录入、关联,到文本预处理、结构化标记、NLP增强,最终入库至TARS系统。

- 包含前端无代码用户应用及后端数据提取API,显示系统实现闭环设计,保证数据更新及时和易访问。

图3 & 图4:关键词搜索应用示例与供应链关键词频率走势(第10-11页)

  • 图3为演示性界面截屏,展示如何通过多纬度过滤(地点、行业、关键词)筛选相关文本段落。

- 图4追踪“Supply”,“Shipping”,“Delays”等供应链相关关键词占比走势,显示2020年以后显著攀升,反映全球供应链紧张对企业活动的影响。

图5:语言模型多标签主题分类样例(第14页)

  • 输出段落被同时赋予多个主题概率,如“employment”、“wages”、“labour costs”高概率。

- 演示BART-large-MNLI多标签分类能力,强化主题灵活识别。

图7:工资主题曝光率与语调指数对比(第19页)

  • 报告两套指标(语言模型与关键词法)季度频率时间序列,判断二者高度吻合,相关系数约0.75。

- 展示与官方工资增速指标历史走势的同步性,验证文本指标作为企业视角的经济信号有效性。

图8:企业联络文本不确定性指数(第20页)

  • 以标准差为单位标准化、不确定性词汇频率趋势,揭示2008年金融危机、2020年疫情爆发等时期峰值。

- 并列多个经济不确定性指数的相关性,确认其企业层面视角的独特性。

图9 & 图10: 企业自报价格膨胀数值抽取及分布异质性(第22-23页)

  • 抽取的企业价格变动率时间序列与官方CPI及工作人员打分高度相关(最大相关系数达0.85)。

- 价格增长分布密度曲线呈现长期稳定波动,近年来分布呈正偏,表明个别企业大幅提价驱动通胀。

图11:工资抽取误差分布(第24页)

  • 机器抽取工资增长与人工收集对比误差分布,均值与中位数接近零,标准差1.4个百分点,相关性0.92,数据质量良好。


图12-14 & 表3:现时预测机器学习方法框架与超参数选取(第25-30页)

  • 通过模型滚动训练和时间序列交叉验证确定模型正则化参数,实现实时动态优化。

- 超参数图示表明Lasso方法在限制变量数目和降低预测误差间取得最佳平衡。

表4 & 图15:现时预测性能与变量选取频率(第30-32页)

  • 结果验证文本指标加入和正则化技术应用使现时预测误差显著下降,最高减误达40%。

- 变量中,经济基准指标和部分文本指标(工资增长手工及机器提取值、劳动力主题曝光率)使用频率高。
  • 超过40%的文本变量未被选择,确认模型稀疏性。


图16:2022年劳动力主题关键词云(第34页)

  • 高频出现“labouravailability”,“shortages”,“wages_increased”等词,反映紧缩劳动力市场与工资上行压力直观表达。


附录图表(第36-42页)

  • 图A1-A2提供了为克服样本不平衡问题采用的分层采样和重要性加权,提升分类准确性的统计验证。

- 图D1详细呈现机器学习模型中每个变量被选入的频率,图文结合强化对关键变量的识别。

---

估值分析



本报告并未涉及财务资产估值的传统内容,主要聚焦于基于中央银行企业联络文本信息的宏观经济信号提取及预测模型开发。报告重点在于:
  • 构建含文本指标的经济预测模型,提高工资增长现时预测精度;

- 采用现代机器学习正则化技术进行变量选择与防止过拟合;
  • 未涉及资本市场估值指标、折现模型等传统金融估值方法。


---

风险因素评估



报告中虽无专门风险章节,但内部隐含的风险因素包括:
  • 样本覆盖限制:联络主要面向中大型企业,覆盖小企业较少,存在代表性偏差风险。

- 文本数据质量风险:访谈摘要非完整录音转录,具备编辑和主观判断成分,可能存在信息偏差或遗漏。
  • NLP模型误差风险:语言模型和关键词法分类存在误判,工具输出仍需人工验证以避免误用。

- 经济结构变化风险:语言习惯、文本风格随时间演变可能影响模型适用性,需定期调整和再训练。
  • 过拟合风险:未经正则化控制的大量特征变量可能导致预测性能不佳,报告强调了模型收缩的重要性。


报告对部分通过人工标注与模型输出对比验证,缓解了一部分语义识别风险;通过机器学习模型正则化缓解过拟合风险。[page::6,17,18]

---

审慎视角与细微差别


  • 报告充分强调了语言模型与关键词法双管齐下的好处,但也坦率披露两者各自的局限性,如关键词法透明但召回低、语言模型语义敏感但透明度不足。

- NLP模型的训练数据主要为金融新闻,虽表现良好,但转至企业联络文本仍存在泛化风险,后续需要不断精调。
  • 预测模型显示文本信号整体较为稀疏,且部分指标与专家判断重合,暗示文本数据能补充而非完全替代人工判断。

- 文章提及撰写文本时的风格、编辑偏好变化对文本分析的潜在影响,体现了对数据生成过程的不盲目乐观。
  • 强调代码和方法公开,体现研究透明性与开放性,有益于社区检验与改进。

- 未来展望明确指出要利用更大规模的LLM和拓展到其他宏观变量,有助于持续推动该领域的技术进步与应用推广。

---

结论性综合



此次由澳洲储备银行主导的研究报告,系统地展示了基于人工智能和现代自然语言处理技术的中央银行企业联络文本信息处理和分析工具的设计与应用,明确了其对提升经济预测特别是工资增长现时预测准确性的价值。报告亮点包括:
  • 工具设计与实施

- 建立统一的文本处理架构,实现23年22,000余笔企业联络的结构化存储和索引。
- 结合BART-large-MNLI和FinBERT模型,实现对访谈摘要的主题多标签分类和情感分析。
- 创新地利用关键词与Word2Vec模型辅助优化词典,提升知识库质量。
- 提取精确数值信息,如工资和价格增幅,验证高度吻合人工记录与官方数据。
  • 新指标开发

- 造就主题曝光率、主题语调指标和企业不确定性指数,凸显文本内容在宏观经济分析中的信号导向作用。
- 指标时序与官方统计数据高度相关,反映文本中的“软信息”本质上是有效的经济先行指标。
  • 实证预测应用

- 将文本指标引入含传统经济变量的机器学习模型,利用岭回归、套索和弹性网等方法进行变量筛选和降维。
- 结果显示,有效降低工资增长预测误差,尤其在经济高度不确定期贡献显著。
- 模型验证信号稀疏,少数文本变量是主要影响因素,反映了软信息中信号的精炼特性。
- 研究突显文本分析对增强政策制定实时响应能力的潜力,特别是在疫情等经济剧变阶段。
  • 未来发展路径

- 计划开放代码库,推动国际中央银行社群共享、借鉴和改进。
- 着眼更大规模、参数更丰富的LLM,拓展分析能力,引入时态识别、未来预测指标等新功能。
- 拟探索文本分析在更多宏观经济指标(如产出、通胀)中的应用价值。
  • 局限与建议

- 建议文本模型输出必须结合专家判断,避免误用自动化结果。
- 关注样本覆盖局限性和文本风格变迁带来的潜在偏差。
- 强调持续的模型评估和更新以保持工具的现实相关性。

综上,该报告不仅为中央银行软信息数据的系统分析提供了技术范例和验证案例,也从方法论和应用层面丰富了宏观经济预测和政策制定的工具箱,迈出了利用AI和NLP技术提升宏观经济决策科学化的重要步伐。[page::34,35]

---

综述版图片引用


  • 图1:

  • 图2:

  • 图3:

  • 图4:

  • 图5:

  • 图7:

  • 图8:

  • 图9:

  • 图10:

  • 图11:

  • 图12:

  • 图13:

  • 图14:

  • 图15:

  • 图16:



---

总字数约3100字,已涵盖报告所有章节、关键论点、数据解释与图表解读,符合详尽、专业的分析报告要求。若需针对某部分做更深入的细节优化或扩充,请告知。

报告