Using CPI in Loss Given Default Forecasting Models for Commercial Real Estate Portfolio
创建于 更新于
摘要
本文针对商业地产贷款(CRE)违约损失率(LGD)预测难题,提出了以CPI为领先指标的创新方法。通过分析CPI与利率及CRE市场销售价格的相关性,依托JPMC内部数据和多种统计模型,证明纳入CPI指标能显著提升CRE LGD模型准确性,尤其有效缓解早期经济下行的损失低估问题。[page::0][page::2][page::9][page::14][page::18]
速读内容
- LGD建模挑战及背景 [page::1][page::2]
- CRE贷款违约后的处置周期长,LGD数据存在左截尾问题(LGD非负制约)。
- CCAR与CECL框架限制模型仅能使用违约时及之前数据,不允许使用违约后宏观变量信息,导致早期经济下行时LGD常被低估。
- CPI作为领先指标的理论与实证基础 [page::3][page::6][page::7][page::9]

- CPI同比增长率(YoY)与多种名义利率(联邦基金利率、30年房贷利率、1年期国债利率等)表现出强正相关(相关系数最高达0.69)。
- CPI的领先性明显:CPI同比与未来12个月名义利率相关性高达0.7左右。
- CPI与失业率相关性极低,二者可在模型中并存且相对独立。
- CPI与CRE市场销售价格关系 [page::9][page::11][page::12]

- CPI高涨预示未来利率走高,抑制房地产价值,导致市场销售价格1年后明显下跌。
- 在不同历史窗口(GFC、90年代衰退、COVID-19)及不同地理位置(全国、纽约、洛杉矶)和物业类型(公寓、办公楼)均观察到CPI和销售价格涨幅的显著负相关,GFC期间相关度最高达-0.8。
- CRE LGD模型中CPI指标应用及效果 [page::14][page::15][page::16]
| 变量 | 系数 | 说明 |
|------|------|------|
| CPI 6月对数差分 (LDIFF6M) | +2.40 | 显著正相关 |
| HPI 6月对数差分 (LDIFF6M) | -2.23 | 显著负相关 |
- 带入CPI变量的Tobit I模型显著降低了2008-2009年信用危机期间LGD的低估,实测模型对LGD前期峰值拟合更优。
- 10折交叉验证和逐年留出验证显示模型系数稳定,非偶然相关。

- CPI与LGD非线性关系的机器学习分析 [page::17][page::18]

- 利用MARS方法,CPI与LGD表现为二次型“V”形关系。
- 但当其他变量HPI一并入模时,MARS剔除非线性色彩,表明线性项已能充分解释LGD变化。
- 经济与业务逻辑支持 [page::13]
- 高通胀预期导致抵押物维护费用、租户改善费用及运营成本增加,降低购买报价,导致LGD升高。
- CPI反映的通胀压力是LGD波动的重要宏观驱动因素。
- 文献综述与创新点 [page::3][page::4][page::5]
- 以往LGD模型多聚焦传统宏观变量如失业率、GDP、利率等,极少纳入CPI。
- 本文首次系统揭示并验证CPI作为领先指标对CRE LGD预测提升作用,具有重要理论与实务价值。
深度阅读
使用CPI预测商业地产贷款违约损失率的模型分析报告详解
---
1. 元数据与概览
- 报告标题:Using CPI in Loss Given Default Forecasting Models for Commercial Real Estate Portfolio
- 作者:Ying Wu, Garvit Arora, Xuan Mei
- 发布机构:JPMorgan Chase & Co.
- 发布日期:文中无明确日期,但引用资料截止至少为2024年初
- 报告主题:围绕商业地产(CRE)贷款的违约损失率(Loss Given Default, LGD)预测,特别关注采用宏观经济变量CP I(消费者物价指数)改进LGD模型的效果
核心论点及信息:
报告指出,在合规于美国联邦储备委员会下的综合资本分析和审查(CCAR)以及当前预期信贷损失(CECL)框架的条件下,预测商业地产贷款违约损失率(LGD)尤为复杂,主要因为违约后的清算周期较长,且模型仅允许使用违约发生时或之前的信息。作者首次系统地尝试将消费者物价指数(CPI)作为领先指标纳入LGD预测模型,证明其能够有效缓解早期经济下行导致的LGD低估问题,特别是在当前通胀高企、利率居高不下的背景下,CPI能作为抵押品市场价格指数和利率的良好前瞻指标,从而提高LGD预测准确性[page::0][page::1][page::2]。
---
2. 逐节深度解读
2.1. 引言与CRE CTL组合介绍
- 关键论点:JPMorgan Chase(JPMC)商业期限贷款(CTL)业务支撑以稳定收益的商业地产融资,贷款集中于小型投资者(“mom and pop”),平均贷款规模约240万美元,90%为多户住宅物业。作为美国最大的多户贷款人,JPMC需遵守CCAR和CECL在贷款风险预测上的要求。作者团队负责开发包括PD(违约概率)及LGD模型在内的套件,满足合规标准[page::1]。
- 难点:LGD模型构建较PD模型复杂,主要因两点:
1. LGD数据受下限限制(LGD不得小于0,且清算后有时出现负损失),导致LGD存在截尾、双峰分布,需采用Tobit、fractional response等特殊统计模型。
2. CECL和CCAR规定预测时只能使用违约时及以前的信息,而CRE贷款的清算周期长,后期宏观经济环境变化(如房地产价格下跌)不被允许纳入模型,导致早期经济下行时LGD被低估的问题[page::1][page::2]。
2.2. 文献综述
- LGD与利率:早期研究显示利率与LGD存在正相关关系(利率高时LGD高),但多家研究未覆盖2008金融危机全段时间。部分研究中联邦基金利率与债券回收率相关分析表明,低利率多发生在经济低迷期,因而可能与较高LGD相关。这与作者从JPMC CRE数据里得出的在当前高利率环境下利率和LGD系数为负的结果存在差异,作者对其合理性保持怀疑[page::4][page::5]。
- LGD与CPI:只有少量文献(如Yao et al. 2017)考虑过CPI,将其视为风险驱动因子,表明CPI上涨预示着LGD提升,原因是通胀降低借款人还款能力,难以改善回收。该结论与报告对CRE领域的观察相符,且由于长期低通胀,文献中一般未将CPI纳入变量池,存在研究空白[page::5]。
2.3. CPI与利率及CRE价格指数关系分析
- CPI数据定义及形式:报告选用美国劳工统计局(BLS)发布的CPI-U,全美城镇消费者价格指数,涵盖主要消费类别,公布月度数据。为建模方便,采用CPI的同比增长率(YoY RDIFF12M和LDIFF12M),两者高度相关,选择YoY直观表现通胀动态[page::6][page::7]。
- 与即期利率的关系:
- 通过数据分析,1950年代以来CPI YoY与联邦基金有效利率之间保持高度相关(相关系数0.686),且单位根测试表明两者均为平稳序列,统计相关显著。
- CPI与多种即期利率(如30年固定抵押贷款利率、1年期国债收益率等)均表现出良好的正相关,理论依据为著名Fisher方程,名义利率≈真实利率+通胀率。通胀驱动利率水平,模型中用CPI蕴含部分利率信息。
- CPI与失业率相关性极低(0.09),显示两者在模型中信息冗余度低,可安全同时入模[page::7][page::8]。
- 与未来利率的关系:
- CPI YoY在当期与未来12个月后的利率存在较强正相关,联邦基金率等长期名义利率的12个月未来值与当前CPI YoY相关度超过0.6,且CPI与失业率未来1年值相关高达0.32,为LGD预测提供前瞻信息[page::8][page::9]。
- 与未来CRE市场销售价格指数的关系:
- 报告定量推理:LGD由贷款余额、资产价值变化和工作成本构成,资产价值在违约到处置之间有变化,而这一价值变化深受市场价格影响。
- 通过JPMC CRE违约清算数据,计算违约资产价值变化与违约时CPI变化的相关系数约为-0.335,说明高通胀伴随资产价值下降。
- 进一步利用CoStar市场销售价格指数这一更细分的220条路径数据(涵盖全国及54个主要MSA,4种物业类型),在若干经济周期窗口分析,发现CPI YoY和未来1年全国及重点市场公寓和办公物业销售价格指数均呈现显著负相关,尤其在GFC(金融危机)期间达到-0.8以上,显示高通胀对应价格大幅回落[page::9][page::10][page::11][page::12]。
- 经济学解释:
- 高通胀环境导致前期应维护资产的维护费用和租户改善成本显著上涨,潜在买家会计入更高的维修和重构成本,导致售价压低,从而拉高LGD。
- 律师费、物业管理开支等工作成本亦随通胀提高,加剧损失[page::13]。
2.4. 建模及实证
- 模型框架:
- 使用Tobit I模型(截尾模型)对接受左截尾且满足CCE且CCAR规定的LGD(非负)进行建模。模型基于违约时贷款层属性和宏观经济变量(如CPI变动率及房价指数HPI等),误差呈正态分布,使用最大似然估计实现参数拟合[page::14]。
- 变量筛选及模型表现:
- 经过筛选,模型选用6个月对数变化率的CPI和HPI作为重要宏观变量,其中CPI六个月对数差分系数为2.40,显著为正,验证高通胀提高LGD。
- 在2007-2010年季度内模型能够准确捕捉2008年金融危机期间的LGD峰值,相较除去CPI变量的模型显著减少了下行偏差[page::15][page::16]。
- 交叉验证:
- 采用10折交叉验证和逐年留出法对模型稳定性测试,系数均表现稳健,说明模型中的CPI效应非偶然。
- 留出2009年(金融危机高峰年)时CPI系数降低,符合该年来CPI与价格指数负相关度更强的特征,这体现模型对严重经济下行的敏感性和稳定性[page::16]。
- 非线性关系检验:
- 针对监管组关注CPI与LGD可能呈“V型”关系(CPI急剧下降时LGD仍高)的担忧,作者采用多元自适应回归样条(MARS)方法建模。
- 单独使用CPI时出现明显的二次“V型”曲线关系,但加入HPI后,非线性及交互项被自动剔除,模型建议仅用线性项足矣,说明房价指数解释了CPI跌落时LGD上升的部分现象[page::17][page::18][page::19]。
---
3. 图表深度解读
3.1. 图1(FRB商业地产价格同比变化)
- 描述:2005-2023年期间美国商业地产价格同比百分比变化趋势
- 关键点:2008年GFC期间,房地产价格暴跌超过30%,对应LGD高峰;其余时间价格波动较小,且多数时间处于正增长区间
- 说明:突显市场价格波动对LGD的影响,验证价格指数为LGD预测关键指标
- 参考链接图片:

3.2. 图2(CPI YoY与联邦基金利率)
- 描述:1955年至2023年期间消费者物价指数同比变化与联邦基金有效利率走势对比
- 解读:两条线走势高度一致,尤其在1970-1980年代初和近年高通胀环境中,同步上升和下降;相关系数达到0.686,统计上显著。
- 支持文本:验证CPI作为利率前导指标,说明通胀驱动下央行调整利率,是利率变化的主要推动力,CPI能捕捉宏观经济信息,进而影响LGD[page::7]
- 参考链接图片:

3.3. 图3(计算CPI与CRE市场销售价格指标相关性示意图)
- 描述:示意CPI与具体违约时间点及实际资产处置时间点之间数据的衔接,彰显处理时间序列不对称性
- 说明:此分析基础是设定违约时间与资产处置时间的时间差,利于区分市场价格对LGD的滞后影响,从时间维度支撑论文分析体系[page::12]
- 参考链接图片:

3.4. 图4(LGD模型内样本拟合对比)
- 描述:2007-Q1至2010-Q1季度内三条曲线:实际LGD,含CPI变量模型预测LGD,剔除CPI变量模型预测LGD
- 解读:含CPI变量模型(红线)更贴近实际(蓝线)LGD高峰,剔除CPI模型在2008-Q2显著低估LGD,验证CPI变量有效缓解早期经济下行LGD低估问题[page::16]
- 参考链接图片:

3.5. 图5(MARS检测的CPI和LGD“V型”关系)
- 描述:使用MARS算法,仅以CPI六个月对数差分作为自变量的LGD预测曲线,体现非线性二次模式
- 解读:LGD值对CPI变动敏感,CPI大幅正增和负减时LGD均较高,形成典型“V”形,反映模型中潜在的非线性特征
- 结合分析:但引入房价指数后该非线性项被剔除,表明房价已经解释了部分负相关影响[page::18]
- 参考链接图片:

3.6. 图6(MARS结果含HPI和CPI)
- 描述:MARS加入房价指数后保留线性项,无非线性和交互项
- 解读:表明房价指数是比单独CPI更重要解释变量,不需要复杂非线性调整,简化模型同时维持解释力[page::19]
- 参考链接图片:

---
4. 估值分析
报告主要围绕LGD建模,没有直接进行传统的企业估值分析如DCF、市盈率等。但模型估计使用了以下金融计量技术:
- Tobit I回归模型:为处理LGD数据的左截尾问题(非负且具质量失衡),采用经典截尾回归模型,假定误差正态分布,通过最大似然法估计系数,确保估计稳定性。
- 模型选择准则:基于BIC(贝叶斯信息准则)以平衡模型拟合优度和复杂度,最终确定CPI和HPI为显著变量组合。
- 交叉验证:
- 10折交叉验证保护模型免受过拟合,保证预测外推能力,CPI系数稳定无大波动。
- “留一年”交叉验证进一步判断模型是否对单一年份数据过度敏感,尤其注意2009年数据,在经济危机峰值具有较大影响力。
报告还利用了机器学习算法MARS对可能的非线性关系进行自动挖掘,增强模型灵活性[page::14][page::15][page::16][page::17][page::18][page::19]。
---
5. 风险因素评估
报告具体识别的风险主要包括:
- 模型的左截尾和非负限制:违约损失可能出现负值,但基于规定LGD不得负,需特殊处理截尾,可能带来统计处理难度,影响估计准确性。
- 宏观经济变量取样窗口限制:CECL和CCAR规范限制LGD模型只能使用违约时及以前信息,但LGD的实际损失构成取决于后期经济环境,尤其在长期清算贷款项目中,未来市场的不可预测性带来模型风险。
- 特定经济周期的极端影响:金融危机等特殊窗口(如2008-2009年)对模型拟合有显著影响,若未来出现新型经济危机,模型表现尚未可知。
- 数据局限性:模型基于JPMC内部数据,包含约4000违约案例,对其他机构或市场能否普适应用尚需测试。
- 非线性影响及交互项识别困境:监管对模型非线性关联的指出,以及机器学习揭示的非线性,但模型后续线性简化可能忽视某些复杂关联。
- 当前通胀和利率环境特殊性:由于近年持久高通胀和“滞胀”担忧,模型需持续动态检验其在极端宏观环境下的有效性[page::1][page::2][page::16][page::17][page::18][page::19]。
---
6. 批判性视角与细微差别
- 对原文局限的认识:
- 作者自身强调研究为观察性研究,缺乏因果关系实验验证,模型虽用交叉验证测试稳健性,但本质仍为统计关联,存在因果方向不明确风险。
- CPI作为领先指标的新颖应用值得肯定,但其是否适用于更广泛CRE贷款或其他市场,需进一步验证。
- 利率与LGD关系在不同研究中存在相反结果(报告中利率系数为负,文献多为正),提示经济环境或样本不同的影响,模型对利率的解释可能欠缺普适性。
- 跨时间段、行业周期的异质性较大(如COVID-19对办公地产价格的特殊影响),说明模型捕捉宏观经济变化的能力仍有改善空间。
- 模型非线性探诊中的减少复杂度:MARS最终选择舍弃二次及交互项虽然简化模型,但可能存在部分非线性细节折中,尚需持续动态校验。
- 样本数据区间主要集中于GFC和其前后,可能导致模型在其他经济周期下预测能力受限。
- 内含敏感信息部分内容被遮蔽,限制了外部验证和复现。
- 作者建议领域内研究者应把CPI纳入考量,提醒模型构建者关注通胀持续带来的影响风险,显出报告旨在填补当前研究空白的企图,也表明研究尚处于探索阶段[page::5][page::16][page::18][page::19]。
---
7. 结论性综合
本报告系统探讨了美国商业地产贷款违约损失率(LGD)预测中引入消费者物价指数(CPI)变量的必要性及有效性,解决了长期违约清算期内宏观经济信息局限和早期经济下行期LGD低估问题。
核心发现包括:
- CPI同比增长率(YoY)与多个关键宏观经济变量(联邦基金利率、30年期抵押贷款利率、未来利率等)均表现出高度正相关,同时与失业率相关较低,适合作为独立解释变量纳入模型。
- CPI与未来1年商业地产市场销售价格指数呈显著负相关,尤其在金融危机等下行周期中,该指标能较好反映抵押品价值损失,进而影响LGD。
- 结合JPMC内部4000条商业地产贷款违约样本,CPI相关变量在Tobit I截尾回归模型中系数为正且显著,增加模型对2008年金融危机期间LGD峰值的捕捉能力,明显优于剔除CPI的模型。
- 交叉验证和“留一年”验证确认了模型稳定性,非线性检验表明在引入房价指数HPI时,简单线性形式已足以解释数据,不必复杂化模型。
- 经济学实务解释支持CPI通过提高后续维护成本、租户改善成本等“工作成本”项影响LGD。
整体来看,作者立场明确,提倡将CPI纳入包括商业地产在内的LGD模型变量池,尤在当前及未来潜在高通胀和“滞胀”丛生的宏观环境下尤为重要。报告不仅填补相关文献空白,还为行业内部信贷风险模型升级提供坚实依据和方法框架[page::0-page::19]。
---
参考图表索引(示意)
| 图表编号 | 内容描述 | 页码 | 说明 |
|-----------|-------------------------------------|--------|----------------------------------------------------------------|
| 图1 | 美国商业地产价格指数同比变化趋势 | 3 | 明确显示经济周期内市场价值波动,验证LGD预测变量的重要性 |
| 图2 | CPI同比与联邦基金利率历史对比 | 7 | 展示CPI作为利率前导指标的统计相关性和经济学解释 |
| 图3 | CPI与CRE市场销售价格计算相关示意 | 12 | 解释违约时间与资产处置时间差对关系分析的影响 |
| 图4 | LGD模型内样本拟合对比(含/不含CPI) | 16 | 展示CPI纳入后对经济危机LGD峰的拟合改进 |
| 图5 | CPI对LGD的MARS算法识别的非线性“V”型形态 | 18 | 揭示纯CPI预测LGD非线性关系 |
| 图6 | 在HPI并入下MARS模型线性简化情况 | 19 | 说明房价指数替代部分非线性效应,简化模型结构 |
---
以上内容综合展现了报告对CPI引入商业地产LGD模型的充分论证,统计验证和经济解释,具有较强的学术价值和实务指导意义。