`

Income and emotional well-being: Evidence for well-being plateauing around $200,000 per year

创建于 更新于

摘要

本报告基于对Killingsworth等(2023)数据的再分析,使用数据驱动方法确定收入阈值,发现情感幸福感与收入的关系在约20万美元后达到平台期。通过普通最小二乘和分位数回归分析验证,无论幸福感的分布部分,收入超过该阈值后幸福感增长趋于平缓。这一结论挑战了之前认为情感幸福感持续随收入增长的观点,但报告也指出模型设定和数据限制需谨慎对待,呼吁后续更细致的研究以确认该关系 [page::0][page::1][page::3][page::4][page::5]

速读内容

  • 研究背景及问题定义 [page::1]

- 情感幸福感与收入关系存在学术争议,关键问题是是否存在收入阈值后幸福感达到平台。
- Kahneman和Deaton(2010)发现平台阈值为7.5万美元,Killingsworth(2021)及Killingsworth等(2023)则认为情感幸福感随收入单调增加。
  • 数据来源及样本说明 [page::2]

- 使用Killingsworth等(2023)公开数据,包括33,391名美国雇佣成人的172万次即时情感幸福感报告。
- 收入分为15个组别,最高组别为62.5万美元。
  • 线性结构断点模型的最优阈值识别 [page::3][page::7]

- 采用普通最小二乘回归模型,收入阈值通过最小化残差平方和确定,最优阈值介于17.5万至25万美元之间。
- 该阈值下,收入高于阈值部分的情感幸福感关系呈平稳趋势,区别于100,000美元阈值下的持续上升。
  • 分位数回归分析结果及差异体现 [page::4][page::8]

- 多分位数(15%、30%、50%、70%、85%)回归结果显示,100,000美元阈值时,除最不幸福者外幸福感随收入单调增长,且最高幸福分位呈加速增长。
- 使用数据驱动的200,000美元阈值,则所有分位均表现为阈值后情感幸福感趋于平稳,无显著上升趋势。
  • 方法论及模型假设局限 [page::5]

- 模型假设幸福感与对数收入的关系为线性且具有单一结构断点,但现实中此关系可能更复杂。
- 收入分组处理可能带来偏差,未考虑其他影响幸福感的变量存在遗漏偏差风险。
- 研究呼吁更谨慎深入的数据和方法应用以进一步验证结论。

深度阅读

金融研究报告详尽解析


报告题目: Income and emotional well-being: Evidence for well-being plateauing around \$200,000 per year
作者: Mikkel Bennedsen
发布日期: 2024年1月25日
研究主题: 个人收入水平与情感幸福感之间的关系,重点关注幸福感是否存在收入阈值后停滞的现象。

---

一、报告元数据与概览



本报告聚焦于探讨情感幸福感(emotional well-being)与收入的关系,特别是是否存在一个收入阈值后,额外收入已不再显著提升情感幸福感。此问题在学术界具有争议,前人研究(如Kahneman和Deaton,2010;Killingsworth等,2023)提出了不同观点。报告核心论点是:通过经济计量方法,数据驱动确定收入阈值,发现情感幸福感的增长在大约20万美元年收入处趋于平缓,挑战了此前以10万美元阈值为基准的结论。报告并非断言明确结论,而是呼吁进一步研究,并揭示此前研究结论对阈值预设的敏感性。报告用词审慎,强调结果依赖于假设条件。

---

二、逐节深度解读



1. 引言(Introduction)


  • 关键论点: 文章区分了两类幸福感:情感幸福感(日常体验)和评估幸福感(对人生的整体评判)。已有共识是评估幸福感随收入线性递增,情感幸福感是否如此则存在争议。

- 背景研究回顾:
- Kahneman和Deaton(2010)基于逾45万美国数据,发现情感幸福感随收入增长到约7.5万美元(通胀调整后约十万美元)后趋于停滞。
- Killingsworth(2021)利用手机实时采样数据反驳,认为情感幸福感在收入层面呈单调上升,无阈值停滞。
- Killingsworth等(2023)结合线性与分位数回归,区分不同幸福层次,提出对于一般人群情感幸福感随收入上升无停滞,但对于最不幸福群体,确实存在停滞,最幸福群体甚至呈加速增长。
  • 本文方法创新: 维持假设关系的线性分段模型,一个切点,但不预先设定该切点收入值,而用数据驱动确定。结果显示情感幸福感在17.5万至25万美元处出现停滞,远高于先前研究的10万美元阈值。并且不论分位数如何,均观察到停滞趋势。

- 意义: 挑战了此前基于固定阈值的结论,表明阈值选取对结论极具影响力,强调应谨慎处理阈值的预设。

2. 数据(Data)


  • 数据来源与特征:

- 使用Killingsworth等(2023)原始数据,包含1,725,944条实时情感幸福感采样数据,来自33,391名18-65岁美国雇佣成年人。
- 幸福感用尺度0-100连续数值表示,基于日常体验情绪即时评估。
- 收入以年均税前家庭收入为变量,被划分为15个收入组,具体区间从1.5万至62.5万美元不等。
  • 数据优势: 大样本,使用实时采样方式避免回忆偏差。

- 不足及限制: 收入变量被分组,产生区间截断风险,可能影响分析精确度。

3. 实证分析(Empirical analysis)



3.1 线性回归分析(Ordinary least squares regression)


  • 模型设定: 情感幸福感对数收入的条件均值服从分段线性关系,存在一个断点阈值$\tau$,阈值处截距和斜率均发生变化,形式为

$$
E(zi | xi) = (a + b xi) I(\exp(xi) \le \tau) + (c + d xi) I(\exp(xi) > \tau)
$$
其中$zi$为标准化幸福感(z-score),$xi$为对数收入。
  • 估计方法: 对不同阈值$\tau$计算残差平方和(RSS),选择使RSS最小的$\tau$作为最优断点,标准方法参考Bai和Perron(1998);Perron(2006)。

- 主要发现:
- 残差平方和曲线(图1左)表明最优阈值位于17.5万至25万美元之间,明显高于以往10万美元设定。
- 对比10万美元阈值回归(图1中)与约20万美元阈值回归(图1右),后者显示收入超过断点后幸福感曲线趋于平坦(斜率-0.002,且标准误较大,表明无显著变化)而非继续上涨。
  • 解读: 数据驱动阈值揭示高收入时幸福感停滞,反驳先前认为无论多少收入,幸福感持续提升的结论。


3.2 分位数回归分析(Quantile regression)


  • 模型设定: 类似均值回归模型,但目标变量为条件分位数,估计各个幸福感分布的不同位置$ p = 15\%, 30\%, 50\%, 70\%, 85\% $对应分位点的回归关系。

- 主要发现:
- 使用传统10万美元阈值,复制Killingsworth等(2023)结果,发现除了最低分位群体幸福感关乎的部分停滞外,整体幸福感随收入单调递增,且最高分位群体斜率反而上升。
- 应用数据驱动阈值约20万美元,所有分位数均出现截断后斜率趋于零的趋势,即幸福感均呈现收入停滞,无论幸福感水平高低。
  • 结论: 阈值选择影响对幸福感分布不同层面关系的判读,数据驱动阈值支持幸福感在高收入时普遍停滞。


4. 结论(Conclusion)


  • 核心论断: 幸福感与收入关系的单调上升结论依赖于预先设定的10万美元阈值;以数据驱动方法确定阈值后,情感幸福感在约20万美元收入处普遍停滞,无论幸福感分布位置如何。

- 样本代表性: 超过9%的样本年收入超过25万美元,收入分布接近美国人口普查数据,因此结果具有较好代表性。
  • 谨慎解释: 分析依赖于线性分段模型并假设一个结构断点,且收入数据按区间分组,可能存在模型设定及测量误差带来的偏差。

- 未来方向: 需要进一步研究考虑更多影响因素与非线性或多断点模型验证结论。

---

三、图表深度解读



图1:线性回归结果



| 面板 | 内容描述 |
| :--- | :--- |
| 左侧 | 残差平方和随阈值$\tau$变化曲线。显示在约17.5万-25万美元范围内残差平方和明显下降,为最优阈值区间。 |
| 中间 | 以10万美元阈值估计的回归结果图,红线表示低于阈值的回归斜率(0.112,标准误0.013),蓝线为高于阈值的斜率(0.109,标准误0.021)。反馈出持续上升趋势。 |
| 右侧 | 以20万美元阈值估计的回归结果。低于阈值斜率为0.111(标准误0.009),高于阈值斜率为-0.002(标准误0.054),倾向于平稳甚至 slight 下降,无统计显著。 |
  • 图表解读:

该图形直观呈现了阈值选择如何影响幸福感和收入的关系。数据驱动阈值使高收入者幸福感显著“停滞”,而传统阈值未显示这种停滞。黑点为组内样本幸福感均值,验证回归线拟合情况良好。

图2:分位数回归结果



| 面板 | 内容描述 |
| :--- | :--- |
| 左侧 | 使用10万美元阈值的多分位数回归结果,红线为低收入段,蓝线为高收入段,各分位数分别对应15%, 30%, 50%, 70%, 85%。斜率值及t统计量标注明显,显示大部分分位数在阈值后仍保持显著上升。 |
| 右侧 | 使用20万美元阈值的分位数回归结果,同样的分位数,此时高收入段蓝线斜率普遍接近零或负,t值低,统计不显著。 |
  • 图表解读:

图表显示,传统阈值下不同幸福感水平的人群,除了极低幸福感者外,高收入段仍有幸福感增长,但采用数据驱动的阈值后,不同幸福感分位的群体在高收入段均无显著幸福感增加,均呈停滞态势。表明阈值上调后,幸福感增长的普遍性下降。

---

四、关键模型与方法解析


  • 结构断点模型(Piecewise linear model):

设定对数收入与幸福感的关系为两段直线拼接,间断点为阈值$\tau$,承接两段分别有截距和斜率参数,能够捕捉阈值到来时关系的变化。
  • 残差平方和最小化法(Min RSS for threshold detection):

通过穷举多个阈值选项,进行最小二乘拟合,计算拟合残差平方和,阈值选在RSS最小的位置,这一方法源自经济计量学中的断点检测技术(Bai和Perron,1998)被广泛认可。
  • 分位数回归(Quantile regression):

取代传统均值回归,针对不同分位点估计响应变量的条件分布韧性,更细致地描述收入-幸福感关系在不同幸福分布层的异质性。
  • z-score标准化:

幸福感数值被标准化便于不同收入段统一比较,通过计算样本均值和样本标准差转换,消除量纲和分布偏差影响。

---

五、风险因素与局限性评估


  • 模型设定局限: 假设线性且仅一个断点,可能过于简化真实复杂关系,非线性趋势或多断点情况未考虑。

- 数据分组偏差: 收入变量被划分为区间组,可能造成信息损失和分析偏差。
  • 遗漏变量偏差: 幸福感受多维因素影响,单独用收入解释,无法揭示因果关系全貌。

- 样本与泛化风险: 数据为美国特定人群,可能限制外推至其他文化和社会环境。
  • 统计显著性限制: 高收入对应样本量较少,可能影响估计精度。


---

六、审慎视角与细节提醒


  • 报告作者多次强调结论依赖模型假设及阈值选择,体现谨慎科学态度。

- 分析表明以数据驱动方法重估阈值,效果与传统假设存在较大差异,提示学术研究在使用先验阈值时应谨慎。
  • 文中没有探讨情感幸福感的因果机制,仅做统计关联分析,不能直接推断收入提升因果必定会影响幸福感。

- 有关最幸福与最不幸福人群的不同增益模式在数据驱动阈值下不明显,可能受样本分布影响。

---

七、结论性综合



本报告深入分析了收入与情感幸福感的关系,重点突破了传统文献中预设固定阈值的限制,采用经济计量结构断点检测方法进行数据驱动阈值选择,发现情感幸福感在收入达到约20万美元后趋于饱和,停止增长。这一发现挑战了以10万美元阈值为基准、认为幸福感随收入无止境增长的观点,尤其是对不同幸福感水平分布的群体均表现出停滞趋势。

图表分析揭示的数据细节强化了这一核心结论:无论是普通的线性回归还是覆盖不同幸福感分位的分位数回归,数据驱动阈值均显示出幸福感的断点一致趋于较高收入段。尽管结果为研究者提供了更为合理的阈值估计,但报告也坦诚模型假设和数据限制,引发未来更多实证研究,尤其是考虑多因素和更灵活模型的必要性。

综上,作者通过科学严谨的分析手段,提出了一个具有重要政策含义和学术价值的假设修正视角,即收入提升对情感幸福感的边际效用在高收入区间内并非持续递增,而是存在较高阈值之后的停滞;这一视角为福利经济学和收入分配政策设计提供了理论指导和实证依据。

---

参考文献



因篇幅所限,此处不再赘述,可参见报告原文引用。

---

附:关键图示



图1 Ordinary least squares regression results

图1展示残差平方和与阈值的关系(左),基于10万美元阈值的回归结果(中),和基于约20万美元阈值的回归结果(右)。右侧图明显显示收入超过阈值后曲线平缓。

图2 Quantile regression results

图2反映了不同收入阈值下的分位数回归结果。左图为传统10万美元阈值,右图为数据驱动约20万美元阈值。蓝红线斜率差异清晰反映了阈值对不同幸福分位影响的不同。

---

[page::0], [page::1], [page::2], [page::3], [page::4], [page::5], [page::7], [page::8]

报告