`

Using Machine Learning to Compute Constrained Optimal Carbon Tax Rules

创建于 更新于

摘要

本论文提出了一种结合深度平衡网络与高斯过程的三步机器学习框架,系统求解具异质代理、气候风险的随机重叠世代模型中的有限制最优碳税规则。实证显示,简单的线性碳排放累积税即可带来显著社会福利提升0.42%,引入更复杂税基则边际收益甚微,凸显转移支付设计在实现代际帕累托提升中的关键作用[page::0][page::2][page::5][page::25][page::26][page::16]

速读内容


一、研究背景与目标 [page::1][page::2]

  • 气候变化带来显著不确定性,设计同时实现经济最优与代际帕累托改进的碳税政策极具挑战。

- 本文提出基于深度神经网络和高斯过程回归的三步机器学习框架,克服高维非线性模型求解瓶颈,实现全局最优碳税及转移方案的快速计算。

二、方法框架概述 [page::8][page::9][page::10][page::12]

  • 第一步:使用深度平衡网络(DEQN)模型,统一解算包含税收转移参数的随机重叠世代模型政策函数。

- 第二步:基于DEQN生成的政策函数,构建高斯过程(GP)代理模型逼近社会福利函数,减少高昂仿真计算开销。
  • 第三步:利用GP代理,快速进行约束优化,求解满足帕累托改进约束的最优税及转移参数。




三、基准情景表现(BAU)[page::15][page::16]


| 指标 | 数值描述 |
| ----------------- | --------------------------------- |
| 排放趋势 | 与IPCC典型RCP4.5情景吻合 |
| 150年后温升 | 平均约3°C,范围2.5°C至3.6°C |
| 经济损失 | 均值约4%,最坏可超15%GDP |
| 碳存量 | 连续增长至高位 |



四、福利提升型碳税设计[page::16][page::17][page::18]

  • 设计线性累积碳排放税,转移收入主要给年轻代,递减分配给更老代。

- DEQN求解精度高,相对误差均在10⁻³以下。
  • 建立GP社会福利代理,留一交叉验证误差极低(3.2×10⁻⁵)。

- 最优税率参数:截距约-0.01,系数0.43。
  • 政策效果:

- 制约排放较BAU低约25%,减缓气候风险并将温升稳定在2.7°C左右。
- 经济损失控制在3%左右,初代可能遭受最高5%福利损失,未来代获显著收益。
- 社会福利年化等价消费提升约1.6%。

五、代际帕累托改进税转移政策[page::19][page::20][page::21]

  • 扩展优化包括12个世代的转移份额,确保无代际福利损失。

- 线性税参数优化为截距-0.186,系数0.225。
  • 集中转移收入保障初代不受损害,未来代福利增强最高达1.4%。

- 整体社会福利消费等价改善0.42%。
  • 政策使末期排放和气候损害上界明显下降,减少极端风险。




六、复杂税基下的最优政策分析[page::22][page::23][page::24][page::25]

  • 进一步纳入碳强度和气候临界点距离的税基,增加两个税参数与转移份额。

- 最优税系数:截距-0.237,累积排放0.203,碳强度0.037,临界点0.012。
  • 社会福利收益仅微升至0.45%,边际收益递减显著。

- 表明简单线性税加有效转移即可实现绝大部分福利收益。
  • 政策辐射效果包括排放减少、温升抑制和经济损害降低,风险显著下缩。




七、模型检验与计算效率[page::15][page::19][page::22][page::23]

  • 多场景均展现相似的DEQN训练精度,Euler方程与价值函数相对误差均小于10⁻³。

- 采用贝叶斯主动学习高效选取GP训练点,训练点总数约在500-800之间。
  • 使用现代硬件如Apple M1或NVIDIA GPU,DEQN训练时间从数小时缩减至数分钟,极大提升计算效率。


八、结论与政策启示[page::26]

  • 简单线性累积排放税规则配合代际转移机制,可实现可观的福利与气候改善且政治可行。

- 复杂税基带来的增益有限,政策制定应聚焦于稳健简单规则与公平转移设计。
  • 提出的方法具备可扩展性,有望应用于更复杂宏观经济模型与政策设计中。

深度阅读

极其详尽和全面的金融研究报告分析



---

1. 元数据与概览(引言与报告概览)



报告标题:Using Machine Learning to Compute Constrained Optimal Carbon Tax Rules
作者:Felix Kübler, Simon Scheidegger, Oliver Surbek
发布时间:2025年7月3日
主题领域:应用机器学习技术解决在气候变化背景下的最优碳税设计问题,模型为随机的重叠世代(OLG)经济模型,涉及经济学中的气候政策、最优税收、深度学习以及贝叶斯统计等交叉领域。

核心论点:本报告提出了一种基于深度等效网络(Deep Equilibrium Networks, DEQNs)和高斯过程(Gaussian Processes, GP)代理模型的三步机器学习框架,能够高效求解约束条件下的全局最优碳税规则,实现跨代际Pareto改进。通过对12期OLG模型的具体应用,发现仅使用定义为累计排放的线性碳税已实现相当的福利提升(0.42%),而引入更复杂的税制仅能带来边际福利增益(0.45%)。该方法显示了处理高维复杂经济模型中的政策设计的潜力,并为各类异质代理经济中的政策分析提供了示范框架。[page::0,1,2]

---

2. 逐节深度解读



2.1 引言


  • 关键论点:目前气候变化政策制定面临巨大的计算难题,尤其在异质世代已存在及环境不确定性的情况下。传统模型通常简化(无不确定性、线性化或代表性代理人)或手工设计税率路径,未能充分捕捉政策设计的复杂性和政治可行性。

- 技术创新:提出了三步机学习算法:
1. 使用DEQNs计算包括税收参数的全局政策函数,即将政策参数作为“伪状态”加入状态向量。
2. 以高斯过程构建社会福利函数(SWF)的代理模型,极大减少计算负担。
3. 基于代理模型,通过快速优化确定满足Pareto改进的最优税收和转移方案。
  • 模型设定:12期OLG,考虑能源碳强度和气候损害函数的随机冲击;设计税规则为依赖观察变量的简单线性函数,通过税收收入转移使政策Pareto改进。

- 结果预览
- BAU情况下温度上升约3°C,最坏情况下经济损失达15% GDP。
- 简单线性累积排放税能将平均升温降至约2.7°C,整体福利提升1.6%,但初代群体福利下降5%。
- 加入跨代转移安排保障所有世代不受损,福利整体提升0.42%,但减缓温控措施强度。
- 更复杂税制的边际福利提升有限,仅达0.45%。
  • 文献贡献:系统地结合多学科技术(气候经济动态建模、最优税收理论、机器学习算法),相较现有工作具有全球最优求解能力,并兼容非代表性代理人和不确定性。[page::1,2,3]


---

2.2 模型架构(章节2)


  • 经济-气候耦合的SOLG模型,时间无限,12重叠时期。

- 生产部门(2.1节)使用柯布-道格拉斯函数,以资本和劳动力为投入,生产过程中排放CO₂,由碳强度κt驱动,考虑减排措施μ和相关成本函数Φ。损害函数Ω取自Weitzman (2012)扩展,考虑气候临界点(tipping points)随机演化。
  • 家庭部门(2.2节)代理人活12期(每期5年),以贴现效用最大化为目标,规划消费和资产积累,纳入政府转移支付Tt,j。劳动力端给予弹性劳动供给,退休后劳动收入为工作期间的40%。效用采用CRRA形式,定义了政策下与BAU下累积效用的比较标准。

- 政府(2.3节)针对碳排放征税,并按世代转移税收收入,通过制定简单线性税率函数τt和收入分配规则最大化加权SWF,考虑利润资源约束。
  • 气候模块(2.4节)采用累积排放与大气温度近似线性相关的碳气候响应(CCR/TCR)模型,累计排放Et与CO2浓度及温度直接挂钩。

- 均衡定义(2.5节),市场出清,家庭、企业行为均纳入最大化问题,一阶条件明确,Euler方程为家庭跨期最优条件。
  • 关键假设:碳强度κt遵循非负自回归过程,临界点TPt随机游走,损害函数凸性体现极端事件风险。[page::3,4,5,6,7]


---

2.3 校准(章节3)


  • 人口经济学设定:12期世代,每期5年,劳动力相关参数根据Benzell等(2015)文献设定,初始资产来自无气候变化的确定性模型稳态。

- 生产参数:柯布-道格拉斯函数,资本份额约0.3,折旧率0.2,碳排放强度初始值κ0=0.35032,随时间衰减并受随机冲击影响(创新取值{+0.03, 0, -0.03}(概率各1/3))且不可降至负。
  • 减排成本参数θ1=0.7,θ2=2.6保证全额减排不经济,反映现实成本。

- 气候模块参数:气候敏感度CCR=1.7,临界点范畴界限设置在2.5至3.5°C,TP
t受随机游走过程影响,带反射壁避免模型极端化。
  • 总体模型能生成BAU排放轨迹与RCP4.5情景相近,长期平均气温升高3°C左右,配合潜在重大经济损失风险。[page::7,8]


---

2.4 机器学习计算Pareto最优政策(章节4)


  • Step 1(DEQN):将税率和转移参数作为伪状态,扩充至状态向量,利用深度等效网络高效求解非线性高维非稳定性SOLG模型,为各参数组合生成全局政策函数映射P(x,θ)≈N(x,θ),其中N为神经网络。训练耗时较长,数小时,但推断极快。

- Step 2(GP代理SWF):用训练好的DEQN模型产生模拟数据,训练高斯过程回归构造低成本代理函数,近似社会福利函数,采用贝叶斯主动学习最大化数据效用,显著减少必须模拟次数。
  • Step 3(基于代理优化):利用GP代理的快速评估能力,对政策参数θ进行优化,获得满足约束的最大福利的税收和转移参数。在约束条件下求解非凸问题非常高效,且多次起始点测试表明结果稳健,最优解可迅速输出。

- 技术细节
- DEQN包含FNN结构、多层前馈网络,采用诸如GeLU激活函数,优化目标为一阶条件残差平方和。
- GP采用Matérn 5/2核,自动相关长度尺度调节,噪声项增强数值稳定性,贝叶斯优化参数细致调整。
- 校准参数空间设定策略确保税率不负,最大税率有限,凭BAU模拟数据指导(初期和末期税率限制)。
  • 图1示意:DEQN计算政策函数→GP代理社会福利曲线→快速优化锁定最优θ参数。[page::8,9,10,11,12,13,14]


---

2.5 结果发布(章节5)



5.1 BAU模型解


  • DEQN求解无政策基准模型,精度高(Euler方程误差均值约10^-3以下),符合文献水准。

- 模拟显示排放沿RCP4.5路径发展,长期温升约3°C,经济损失平均4%,最坏超15% GDP。碳储存量持续累积。
  • 该阶段无政策优化,步骤2、3未启用。[page::15,16]


5.2 简单线性累积排放税(福利最大化)


  • 税率τt=θ0+θE Et,两个参数线性规划,转移方案固定且递减(年轻世代优先)。

- DEQN求解精度提升(Euler方程误差均值低至10^-4),GP代理的留一法交叉验证误差极低(3.2×10^-5),表明模型拟合良好。
  • 优化显示最优税参数约为θ0=-0.01,θE=0.43,税率随时间和累计排放增长,由0.35提高至0.7。

- 该政策将排放降低25%,平均温度控制在2.7°C,经济损害下降至3%GDP。
  • 福利分析表明断代分布:初代潜在福利损失5%,而未来世代福利提升近5%。整体社会福利提升1.6%。[page::17,18,19,图3,图4]


5.3 Pareto改进累积排放税+最优转移


  • 税率仍为线性累积排放形式,转移由政策内优化,12个转移参数与2个税参数组成14维参数空间。

- 转移参数符合Dirichlet分布限制,保证非负和和为1。
  • DEQN同样保持高精度。

- GP针对40代群体分别拟合效用代理,约束所有世代福利不低于BAU。
  • 求解得到税参数θ0=-0.186,θE=0.225,且设计的转移方案保护初代代利益不损失。

- 与BAU相比,排放基本稳定,温度略降,经济损害略减,极端风险有所削弱。
  • 世代福利分析显示无任何世代受损,晚些世代获得最多福利提升,整体消费等价福利提升0.42%。

- 税率平均水平较简单福利最大化税低,减少激进减排以兼顾政治可行。[page::19,20,21,图5,表5,表6,表4]

5.4 Pareto改进全线性税(累积排放+碳强度+临界点)+最优转移


  • 税率模型扩展为三变量线性函数:τt = θ0 + θE (Et/E0) + θκ (κt/κ0) + θTP (1 - 距临界点距离归一化) + 12个转移参数,总16维参数空间。

- DEQN与GP保持高准确度。
  • 求解取得参数 θ0 ≈ -0.237,累积排放斜率θE ≈0.203,碳强度项0.037,临界点项0.012,转移向量详见表9。

- 模拟显示排放和气温与5.3节相似,经济损害轻微下调,极端尾部风险进一步约束。
  • 福利提升0.45%,比5.3节0.42%仅小幅提升7%。

- 结论:增加税基复杂度收益递减,政策实施考虑宜优先关注转移设计和简单稳健税率。
  • 图6完整呈现碳税、排放轨迹、气温和福利分配等关键路径。[page::21,22,23,24,25,图6,表8,表9,表10,表7]


---

2.6 结论(章节6)


  • 本文主张用机器学习融合深度网络与高斯过程代理,突破高维、非线性、非稳定的随机OLG气候经济模型的计算瓶颈,实现最优受约束碳税和跨代转移设计。

- 结果表明单纯线性累积排放税可大幅降低气候风险,然而易导致早期代损失,政治可行性低。
  • 加入转移机制成功保证Pareto改进,实现所有世代至少不受损害的碳税政策,虽减排力度和社会福利提升较前者有所降低,但极端风险受控且政治可行。

- 加入碳强度和临界点作为税基,仅带来极小的边际社会福利增长,建议政策重点放在简单规则和高效转移方案上。
  • 框架高度通用,可扩展至多维代理、复杂技术演化及状态依赖转移方案,未来研究可探讨非线性税制和更丰富经济结构。

- 本方法为异质代理模型中的Ramsey政策问题提供了实用的求解范式,推动定量经济政策分析新进展。[page::26]

---

3. 图表深度解读



图1(第10页)


  • 展示三步方法流程:1) 用 DEQN 获得状态与伪状态条件下的政策函数 \(P(x,\vartheta)\approx \mathcal{N}(x,\vartheta)\);2) 用 GP 代理建立社会福利函数 \(\widehat{QoI}(\vartheta)\);3) 优化器基于 GP 代理搜索最大化福利的参数。\

- 结构清晰展示算法核心逻辑,强调将大规模高维数值求解前置在DEQN,后续流程极大加速。[page::10]

图2(第16页)


  • BAU情景下4幅图:

- (a) 排放轨迹及与IPCC不同RCP情景对比,平均轨迹与RCP4.5一致,范围宽广。
- (b) 气温时间序列,平均升温3°C,10%-90%置信区间约2.5-3.6°C。
- (c) 经济损害占GDP比例随时间增长,均值4%,严重尾部损失超15%。
- (d) 大气碳储存量持续上升。
  • 图示直观反映BAU长期风险与不确定性,奠定政策对比基准。[page::16]


图3(第17页)


  • 福利函数关于参数 \(\vartheta0, \vartheta_E\) 的等高线图,色块区分福利高低,呈现消费效用对税参数的敏感度。

- 边界由约束限定,形状显示最优解附近存在明显的凸性峰值,方便优化器定位,辅助验证代理精度。[page::17]

图4(第19页)


  • 六子图:政策下排放下降,五代群体福利分布,气温和经济损害均较BAU优化,税率上升。

- (a) 排放平均水平显著低于BAU,尾部风险减少。
  • (b) 初世代福利遭损失,未来世代稳健获益,福利随出生时间递增。

- (c)(d) 温升控制于2.7°C,经济损害降低至3% GDP水平。
  • (e) 税率呈线性增趋势,最终接近70%。

- (f) 碳储存稳步下降,体现减排政策效果。
  • 平衡了环境与代际福利,体现模型政策主题。[page::19]


图5(第22页)


  • 引入跨代转移的Pareto改进策略。

- 具体参数控制税率和12转移份额,为确保无世代福利退步设计。
  • 排放和温度有小幅改善、经济损害有所削减,尤其极端损害的尾部下移显著。

- 福利分配图显示较早世代免受福利损害,年轻世代福利提升明显,体现跨代兼顾的政策设计。
  • 税率与碳储量演变反映较为温和的减排路径。[page::22]


图6(第25页)


  • 最复杂的税收组合和转移设计,4个税基与12转移参数。

- 排放和温度路径近似优化较简单策略,经济损害略有进一步压缩。
  • 福利增益达到0.45%但边际收益有限,税率曲线平稳而非激进。

- 展示多维参数空间下模型解的稳定性与实际政策边际效用递减特征。[page::25]

表格1(第8页)


  • 模型参数汇总,含家庭偏好、生产函数、气候相关系数。

- 指示参数均符合现实估计标准,如折旧率0.2、风险厌恶3等,确保模型基准匹配现实数据。
  • 为后续模型与政策结果提供了严谨的数值基础。[page::8]


表格2,3,4,7(第15页、第17页、第20页、第23页)


  • 精度指标:Relative Euler Equation error 与 Relative Value Function error的均值与极大值均保持极低水准(约10^-4至10^-3),证明DEQN合作GP方法解法具备高精度和稳定性。

- 不同政策场景下精度保持稳定。
  • 强化了模型应用的可信度。[page::15,17,20,23]


表格5,6,8,9(第20页、第21页、第23页、第24页)


  • 优化所得税率及转移份额的数值展示,体现了模型税率截距、累积排放等参数在不同场景下的估计结果。

- 转移份额因世代不同表现分布差异,模型捕捉不同世代的政策受益权重。
  • 数值具体,辅助理解模型政策设计细节。

- 反映了政策对世代之间公平的处理,转移机制确保Pareto改进。[page::20,21,23,24]

表格10(第24页)


  • 整合不同税基复杂度下的福利提升总结。

- 二参数税基(简单累计排放税):福利增0.42%;
  • 四参数税基(含碳强度和临界点):福利增0.45%;

- 明显福利递减规律,政策设计应照顾成本收益均衡。 [page::24]

---

4. 估值分析



报告中的“估值”主要指政策参数空间下的社会福利函数最大化。构造了三阶段代理框架,相当于为优化问题构造了价值函数代理与策略空间上的最优解。
  • 估值方法:使用DEQNs求解政策函数(隐含价值函数的最优映射),之后GP代理社会福利函数作为目标价值函数代理,最后对代理目标进行约束优化(保证Pareto改进)。

- 关键输入/假设
- 经济状态变量、气候状态变量和税收转移参数的联合状态空间表示方式,状态空间高达30余维。
- 瑞利-贝叶斯主动学习算法用于训练GP,实现高效样本设计,避免在宽阔空间中盲目采样。
- 参数范围由经济合理性约束(非负税率、合理转移份额等)限定。
  • 优化内容

- 目标为最大化所有世代加权效用和,权重均匀。
- 约束包括所有世代福利不低于BAU、税率区间限制和转移份额和为1。
  • 敏感性分析:通过多初值测试显示目标函数大致凸性或单峰,支持全局最优收敛结论。

- 计算效率:从耗时昂贵的原始蒙特卡洛模拟降至秒级别的代理优化查询,极大提升实际可应用性。[page::9,12,13,14]

---

5. 风险因素评估



尽管报告未设专门风险章节,但隐含风险和限制可归纳如下:
  • 模型设定风险

- 气候损害函数形式依赖Weitzman(2012)且带随机临界点,但现实更复杂,损害估计存偏误和模型不确定性。
- 经济参数固定且简化权重设置,未涵盖跨世代和跨阶层更细致的异质性,忽视技术创新和政策反应弹性。
  • 政策实施风险

- 虽有转移以保证Pareto改进,但实际上跨世代政治协调复杂,转移设计需配合法律与政治环境。
- 随机冲击及模型潜在非线性效应,可能导致预期外政策效果。
  • 方法学风险与局限

- DEQN训练需大量计算资源,模型扩展性或受限。
- GP代理对超高维参数有挑战,虽已有主动学习缓解。
- 线性税率形式限制探索非线性或动态调整税率下的潜在增益。
  • 缓解措施

- 转移设计为负效应最小化提供直接对冲方案。
- 模型架构和方法框架具有较强扩展性,为未来添加复杂分析模块提供基础。
以上风险与潜在缓解策略均在报告相关章节有所提示,且结果通过多次敏感性试验加以验证。[page::1,26,31]

---

6. 批判性视角与细微差别


  • 政策简化限制:虽然线性税设置赋予清晰解释性,但忽略税率非线性效应及动态调整潜力,可能低估更复杂税收设计空间的潜在福利增益。

- 福利权重均匀假设:实际社会福利函数可能更复杂,不同世代、群体权重设定对结果敏感,固定均匀权重忽视社会政治权力结构。
  • 因模型结构导致的递归假设:模型设时间折现序列且跨世代视角固定,可能忽略行为反馈及非理性因素影响。

- 不确定性假设内限性:气候风险和技术冲击建模方式虽先进,但依赖参数估计和过程假设,存在未知风险。
  • 计算成本:尽管报告声称可用消费者级硬件运行,但复杂场景仍需高性能设备,限制了方法普及性。

- 整体而言,报告在其自身设定范围内保持客观严谨,充分披露方法局限及可改进空间。未见数学或逻辑自相矛盾,提供了方法和实证案例的扎实验证。[page::10,26,31,35]

---

7. 结论性综合



本报告从方法学、理论架构及实际应用多个维度全面展示了利用机器学习解决复杂经济气候模型最优碳税政策设计的进展。通过深度等效网络高维政策函数求解,高斯过程代理社会福利函数及贝叶斯主动学习采样,成功绕过了传统方法在维度诅咒和非凸非线性问题上的计算瓶颈,实现金融经济领域中长期跨代际气候政策的全局优化。

核心发现包括:
  • 简单线性累积排放碳税即实现显著福利提升和减缓潜在气候风险。

- 纯福利最大化策略对早期世代产生显著负面效应,政治可接受性低。
  • 精巧设计的转移方案能够保障所有世代至少不受损害,实现Pareto改进,虽减缓减排力度但仍带来正向福利增益和风险管控。

- 纳入更复杂碳强度和临界点变量作为税基并未带来显著边际福利提升,政策实施应优先考虑转移分配及规则简洁性。
  • 该机器学习框架不仅应用于碳税,还为异质代理模型中的Ramsey类政策问题以及其他动态最优控制问题提供了通用求解模板。


图表明晰形象地支持了上述结论,表格数据严谨展示了模型参数、误差精度和优化结果的可靠性。数字结果与当前文献相符,充分体现了机器学习技术在宏观经济气候政策分析中的突破潜力。

本报告为今后量化宏观经济政策设计,特别是在气候风险不确定性背景下跨世代政策协调,提供了重要算法和理论支持,展示了深度和贝叶斯机器学习技术与经济建模结合的前沿发展路线。[page::0–26]

---

参考资料


  • 所有数据与结论均溯源于报告对应页码,跨节复杂推理均严格对应原文表述。

- 深度网络、GP及贝叶斯主动学习相关技术规范详见第4章,参数设定及数值验证详见附录章节。
  • 税收与转移政策具体函数形式及取值范围详见附录B。

- 精度与误差评估详见章节5测试结果及表格2–7。
  • 模型背景与相关文献明晰总结于章节1–3。


---

总结:本研究深度融合现代机器学习技术与宏观经济气候模型,构建了一套功能强大且高效的政策优化框架,既能生成理论最优方案,也具备政治经济实施的可行性,开辟了未来政策分析的新局面。

报告