Using Event Studies as an Outcome in Causal Analysis
创建于 更新于
摘要
本报告提出一种两步因果分析框架:第一步估计单元特定事件研究(ULES)以度量单位对事件的响应,第二步使用这些估计进行因果推断。该方法克服了传统回归的局限,能够揭示异质性和动态效应。实证上应用于荷兰托儿服务扩张对育儿惩罚的影响,发现托儿服务扩张对母亲劳动供给有复杂的正向影响,而传统方法则得出负向结论,证明两步法的有效性和灵活性 [page::0][page::1][page::3][page::4][page::5][page::6][page::23][page::27][page::41]。
速读内容
- 方法论核心:提出两步估计框架。第一步,构建单元级事件研究指标(ULES)$\hat{\tau}{i,h}$,通过比较事件前后单位的结果与适当对照组的差异获得无偏估计,量化个体对事件的响应。[page::6][page::7][page::8]
- 第二步,将ULES作为因变量,结合组级政策变量$Wg$进行因果分析,允许灵活识别和处理动态、多样化的政策效应,同时明确样本选择问题。[page::9][page::10][page::11][page::12]
- 识别策略:提出两种关键假设:(a) 政策不影响事件时间$Ei$;(b) 事件时间与单位响应独立。两种假设对应不同的加权回归方法,解决了环境中常见的选择偏差。[page::9][page::10][page::14]
- 实证数据:采荷兰统计局CBS面板数据,包含1999-2016年税务、就业、人口与托儿服务机构信息。聚焦首次生育年龄≤44岁的群体,细分性别与教育层次。[page::20][page::21]
- 个体异质性分析:估计个体级育儿惩罚指标$\tilde{\tau}{i,h}^{BJS}$,利用聚类分析揭示显著异质性,近三分之一男性无育儿惩罚,女性呈现多样化的劳动力退出与部分工时路径。关键图示如下:

[page::23][page::24]
- 政策变量构建:通过托儿所工作人员数与当地5岁以下儿童数比值创建市级托儿服务指数CCI,反映2005年改革后托儿供给的区域间差异及时间动态:

[page::25][page::39]
- 描述性分析:CCI与个体育儿惩罚呈负相关,尤其女性随时间推进负相关性增强。男性影响较弱。此现象表明托儿供给提升有助于缓解育儿惩罚。


[page::40]
- 因果分析结果(两步法):以个体育儿惩罚为因变量,利用CCI的基线(出生前年)和同期水平(出生后不同时点)进行政策回归,控制地区、时间和年龄固定效应,证实托儿扩张提高母亲(尤其高学历)劳动收入和就业。

[page::41]
- 经济解释及异质性:托儿扩张对高学历女性影响更显著,归因于工作时长弹性及工资结构非线性,托儿费用降低推动其劳动供给增加。
[page::27][page::28][page::72][page::73]
- 与传统单步法对比:采用常用二元处理的差分法回归,粗化政策变量分组,结果显示托儿扩张降低父母收入与女性参与率,结论显著异于两步法结果。

产生差异的原因包括单步法内嵌测量与政策分析、忽视动态政策影响和选样偏误,揭示两步法提高透明度和统计功效。[page::29][page::30][page::42]
- 理论贡献归纳:测量与因果推断分步处理,有效规避一阶段法中混入的污染偏差和样本选择偏差,保证估计结果更加科学合理。该框架拓展了面板事件研究的应用范围,支持多周期、多样本和动态处理分析。[page::5][page::16][page::17][page::19][page::20]
- 统计推断:在样本容量充分,群组规模适宜条件下,估计误差不会带来偏误,群组层面聚类可提供稳健标准误,保证推断的有效性。[page::14][page::15][page::59][page::60]
深度阅读
深度分析报告:Using Event Studies as an Outcome in Causal Analysis
---
1. 元数据与概览
标题: Using Event Studies as an Outcome in Causal Analysis
作者: Dmitry Arkhangelsky, Kazuharu Yanagimoto, Tom Zohar
发布日期: 2025年1月30日
主题: 经济学方法论,特别聚焦于事件研究(event studies)在因果推断中的应用,及其在劳动经济学中对“Child Penalty”(生育惩罚)和托儿服务政策影响评估的实证分析。
核心论点:
本文提出一个系统的两步程序,用以测量每个单位对事件的响应(单位层面事件研究,ULES),并将测量结果作为因果分析的输入。此方法不仅克服了传统回归方法在异质性和动态效应分析中的限制,更能提供更为透明且稳健的政策效果估计。实证上,本文以荷兰2005年托儿托儿服务扩张政策为例,展示该方法的优越性,揭示托儿服务扩张对家长劳动力供给的积极作用,且异于传统单步回归的负面结论。[page::0,1,3,4]
---
2. 逐节深度解读
2.1 引言(Section 1)
- 关键论点: 大量经济学问题关注经济结果在特定事件(如成为父母)前后发生的变化。传统事件研究一般关注整体平均效应,但无法直接用于理解政策如何影响个体反应的异质性。本文提出的两步法,一是基于面板数据文献中关于单位层面影响的识别,估计每个单位(个人)的事件效应;二是利用这些单位级别估计来探究政策的因果效应。
- 推理基础: 程序基于“平行趋势假设”确保单位层面比较结果不偏,进而单位效应估计为无偏观测。与通常所用的一步回归法相比,分两步可以克服离散化政策变量、忽视动态效应、限制利用数据丰富性的弊端。
- 并指出要注意的统计挑战: 测量误差、样本选择偏差、重叠条件失败等问题。尤其两步法能明晰样本选择问题,而非被简单地掩盖(one-step方法反而可能掩盖这一问题)[page::1,2]
2.2 实际应用(Section 3和4)
2.2.1 数据与样本构造(Section 3.1)
- 数据来源: 荷兰中央统计局(CBS)涵盖1999-2016的详尽行政及就业数据,包括税收记录、就业状况、工资、个人出生年、性别、教育等。托儿服务供应通过企业岗位分类和地址数据计算。
- 样本限定: 追踪第一次生育时年龄<44岁,且劳动市场与教育时间合理匹配的个体,确保前置观察期完整且减少截尾偏差。
2.2.2 测量方法(Section 3.2)
- 估计个体层面的Child Penalty(CP),即生育后劳动力收入与参与的变化,使用单位层面事件研究估计法律定义变量$\hat{\tau}{i,h}^{BJS}$,$h$是事件相对时间,涵盖生育前3年到生育后5年。
- 使用Boruyak等人(2024b)提出的imputation estimator,扩大控制组定义,调整事件时间的预期趋势差异。
- 验证方法基于观察负$h$值的效应,发现高等教育组中31岁以上出生者符合模型假设,因而后续分析聚焦于该子群。
- 结果初步揭示CP具有显著异质性——多数男性无明显CP,部分显示负趋势,女性则更多呈现退出或从全职转为兼职,存在显著个体及教育差异。[page::3,20,22,23,24,46,47]
2.2.3 政策因果分析(Section 4)
- 政策事件:荷兰2005年托儿服务改革,统一中心托儿补贴,极大推动托儿供应。
- 托儿指数CCI: 以托儿工作岗位数除以5岁以下儿童数构建。
- 描述性分析:CP与托儿供应呈负相关,母亲返工趋势明显,但存在需求驱动的潜在内生性,于是采用两步法明晰因果关系。
- 因果估计:利用$CCI{g,Ei-1}$(生育前年份)和$CCI{g,Ei+h}$(事件后同期)作为预期和当期政策变量,涵盖动态效应,控制地点、事件年及年龄固定效应。分析发现,高教育水平家长收益显著更大,且当期托儿供应对母亲劳动供给影响积极明显,父亲则主要受基线托儿供应影响。异质性背后经济含义可能是工作灵活性与工资结构差异导致托儿政策影响差异。[page::3,4,25,26,27,41,48,49]
2.2.4 与传统一阶段方法的对比(Section 4.4)
- 一步法通常二值化托儿服务改革处理组(婷婷如托儿指数提升超过10%),用传统差分中的差分模型估计。
- 该方法忽略了政策连续变量和动态特征,同时可能存在混杂偏差。
- 实证对比显示,一步法得出托儿扩张对母亲劳动力参与负面影响,与两步法对母亲和父亲收益和参与的积极效应结论截然相反。
- 关键差异源于定义比较组、利用数据变异性的程度以及对异质性和动态效应的处理能力。
- 两步法更灵活更透明,利于应用新兴政策评估工具,避免汇总偏差和不恰当的假设简化。[page::28,29,30,42]
---
2.3 结构与方法论框架(Section 2)
2.3.1 计量模型(Section 2.1)
- 离散面板模型,单位$i$观察3个时期$t\in\{0,1,2\}$,事件时刻$Ei\in\{1,2,\infty\}$。
- 结构化结果由单位固定效应$\alphai$,群组时间效应$\lambda{g(i),t}$,单位事件响应$\tau{i,h}^e$(含动态$h$和事件时间$e$异质性),以及噪声$\varepsilon{i,t}$组成。
- 通过特定差分(如等权平均调整前期结果)构造无偏的单位层面事件效应估计$\hat{\tau}{i,h}$,组成单位层面事件研究(ULES)。
2.3.2 因果框架(Section 2.2)
- 政策变量$Wg$在群组层面变化,影响潜在结果$Y{i,t}(w)$和事件时间$Ei(w)$。
- 假设结构测量模型不变,计量误差$\nu{i,h}$与$Wg$独立。
- 关键问题是因果效应如何解读,特别是事件时间的可能依赖性,提出两种无选择偏的假设:(a)事件时间不受政策影响,(b)事件时间与单位响应独立。
2.3.3 识别机制(Section 2.3)
- 基于(3)式两种假设确保ULES的无偏性和政策分析的一致性。
- 在随机分配$Wg$下,利用反概率加权(IPW)等标准工具识别因果效应。
- 当$Wg$分布未知时,提出线性偏移模型,即政策效应由“基线”($w{e-1}$)和“同期”($w{e+h}$)两部分组成。
- 利用组内差分$\Delta W{g,t}$变异识别参数,假设组内政策均值具有限制性的可分解结构($ag + bt$)。
2.3.4 估计与统计推断(Section 2.4)
- 使用Borusyak et al. (2024b)的imputation estimator估计ULES,$\hat{\tau}{i,h}^{BJS}$。
- 强调两阶段误差:测量误差$\nu{i,h}$与估计误差$\xi{i,h}$均不引入偏差,前提是群内单位数充足。
- 估计因果效应时依据两种选择性假设分别采用普通最小二乘(OLS)和加权OLS,带入群组和事件时间固定效应确保多维异质性能被控制。
- 利用过度识别检验(例如群组层次的平行趋势检验$\hat{\nu}g^1$)对模型假设进行验证。
2.3.5 一步法缺陷(Section 2.5)
- 自然且广泛采用的一步方法(直接在面板上拟合交互效应等)因无法消除选择和污染偏差,可能无法解释估计系数。
- 两步法通过明确分离测量与估计阶段,提高透明度,减少潜在的偏差及误解释风险。
- 单位内政策变异与群组内政策变异处理有本质差别,前者估计时需要更复杂的误差处理和设计。
---
3. 图表深度解读
3.1 Figure I – 子图(a)与子图(b):个体Child Penalty的异质性
- 描述:(a)展示了男性和女性儿科惩罚率(CP)的分布随事件相对时间$h$改变情况,图中包络线为概率密度分布,点为分布均值。
- 解读:
(a)显示CP呈左偏态分布,女性CP负值更显著,随事件时间推移负值加剧。儿科惩罚并非均匀存在,而是具有强烈异质性。
(b)通过K-means聚类方法,分别找出男性和女性的三种典型CP路径。大约60%以上男性几乎无CP,女性中55%存在中度负CP,28%显示劳动市场退出趋势。
- 联系文本: 支持传统均值估计掩盖异质性,凸显测量单位层面CP的必要性。测量误差存在,需谨慎解释。 [page::38,23,24]
3.2 Figure II – 托儿服务扩张
- 描述: (a)展示1999-2016年荷兰各地级市托儿岗位与5岁以下儿童数目之比,折线为年度平均,阴影区域为各市数量分布。2005年托儿补贴改革导致整体水平显著跃升。
(b)简单的$2\times2$ DiD设计示意图,区分托儿服务高低(处理组和控制组)和时间(前后政策实施)。
- 解读: 政策改革导致托儿供给剧烈变化,个别市之间初期差异明显。这为利用差分识别政策效应提供了基础,但$2\times2$设计过于简化。
- 联系: 说明本文两步法中托儿指数连续变化的复杂动态与拙劣二分类DiD设计的区别。[page::39,25,29]
3.3 Figure III – 托儿供应水平与CP的相关性(按性别与时间)
- 描述:横轴为生育前年份托儿指数,纵轴是个体CP;每个子图按事件时间$h=0\sim 5$分面展示,分性别。
- 解读: 对女性,托儿供应提高明显与CP降低(正相关关系表现为趋势线下降),表明托儿供应可能缓解生育后劳动力参与/收入损失。男性相关性较弱。趋势随时间加强,说明托儿供应的长期效应。
- 联系:尽管存在正向相关,必须谨慎解释存在内生性,故转向因果分析。[page::40,26,27]
3.4 Figure IV – 托儿扩张政策对CP的因果效应(按教育程度和性别)
- 描述:对职业技术和本科教育组分别估计生育前年份托儿供应(基线)和事件时的托儿供应(同时)对个体CP的影响。
- 解读:
- 高学历妇女同时期托儿供应显著提升其劳动收入,基线效果多体现在高教育层,显示异质性。
- 男性更多受基线托儿水平影响。
- 效果差异反映劳动力市场中的工作灵活性和工资结构,非线性工资职业对托儿服务依赖度更高。
- 联系文本: 与理论模型和经济直觉结合解读托儿扩张对家庭劳动力的影响。[page::41,27,72,73]
3.5 Figure V – 一步法对托儿扩张效应的估计对比
- 描述:一步法下因托儿扩张产生的CP估计显示双方(尤其母亲)劳动参与及收入负效应。
- 解读: 严重与两步法结果冲突,体现了一步法可能受到模型假设限制、样本选择及污染偏差的影响。
- 联系: 强调两步法突破了传统单步方法的局限,提供了更合理符合经济理论的政策评价。[page::42,28,29,30]
---
4. 估值分析
本报告不涉及纯金融公司估值,但计量经济模型中的参数估计可视为某种结构参数的估值。文中提出的模型采用两步估计方法,分别估计单位层面事件反应($\hat{\tau}{i,h}$)和基于单位估计的政策反应参数($\delta$)。关键参数通过高维固定效应回归获得,模型假设及约束确保了无偏估计和渐近正态分布,为政策效果提供稳健估计基础。
---
5. 风险因素评估
- 测量误差风险:单位层面估计含噪音,然而两步方法中测量误差与政策变量独立,且群组内大样本使该误差对政策推断无偏。
- 样本选择问题:非所有单位都经历事件(如未生育者无CP定义),若事件时间受政策影响会导致选择偏差。本文通过提出事件时间不受政策影响或事件时间与响应独立的假设,有效缓解选择性偏差风险。
- 假设不成立风险:若上述关键假设不满足,仍可采用非条件分析或构造界限估计,但需额外假设支持。[page::2,9,10,43-45]
---
6. 批判性视角与细微差别
- 潜在偏见点:若事件时间($Ei$)确实依赖于政策,需用样本权重校正。否则一味忽视选择性偏差易致估计偏倚。
- 模型局限:政策均值限制($\mathbb{E}[W{g,t}]=ag + bt$)较强,若政策路径或异质性更复杂,估计需要适当调整。
- 一步法缺陷:回归中事件时间虚拟变量若做“坏控制”,可能导致广义选择偏差和污染偏差,致使系数缺乏清晰因果解释。
- 数据与设计要求:足够的组内事件时间重叠是估计关键,有组规模过小会因无重叠问题而限制估计有效性。
- 异质性未充分表征:估计抵消异质性带来的权重差异需谨慎,或许需用加权最小二乘。
综上,本文方法虽先进但对特定假设依赖较重,要求较高数据质量和设计理解。
---
7. 结论性综合
本论文开创性地将单位层面事件研究(ULES)作为因果分析的结果指标,采用两步估计方式:第一步严格估计单位特异的事件响应,克服传统差分设计的合并偏差和动态效应忽略问题;第二步将估计结果投入政策评估,准确剖析政策对个体效应的异质影响。理论与实证结合展示,荷兰托儿服务改革中更丰富的政策维度和异质性显著影响男女家长的劳动市场行为。
量化结果清晰表明,托儿服务扩张提升了母亲的劳动收入和参与率,且这种促进效应在高教育家庭中更显著,而常规的一步法往往错误估计为负向效应,凸显本文方法的优势和必要性。
图表分析印证数据丰富的动态和个体差异特征,辅以稳健的统计验证,增强了结果的可信度。本文方法为政策评估提供了灵活、透明、理论扎实的全新工具,极具推广价值。
最终,鉴于测量误差、样本选择和模型假设,对研究设计提出了明晰警示,推动未来应用与理论创新。[page::31,4,28,29,38-42,47,48,49]
---
附:关键图表Markdown格式

图I:个体Child Penalty的分布及路径聚类

图II:托儿服务供应扩张及简化DiD设计示意

图III:托儿供应水平与Child Penalty的相关性

图IV:托儿扩张政策对Child Penalty(按教育及性别)

图V:传统一步法对托儿扩张的政策效应估计
---
此分析详尽探讨了论文每个关键章节、核心方法论、图表所反映的数据趋势以及实证政策分析的深层逻辑与结论,结合理论及实证背景严谨呈现,对科研与政策评估均具有重要参考价值。