`

Computational analysis of US Congressional speeches reveals a shift from evidence to intuition

创建于 更新于

摘要

本报告通过分析1879年至2022年美国国会发言,构建了Evidence-Minus-Intuition(EMI)指标,衡量证据基础语言与直觉基础语言的相对使用频率。研究发现,自20世纪70年代中期起,国会中证据基础语言持续下降,伴随党派极化和收入不平等加剧,以及国会立法生产力下降。EMI指标与党派极化呈负相关,且预测未来收入不平等,强调提高证据基础语言对民主健康的重要性 [page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11].

速读内容

  • EMI分数趋势与党派分化 [page::3][page::4][page::6]:


- EMI自1875年起总体保持稳定,20世纪40年代开始上升,达到70年代中期峰值后持续下降。
- 近年EMI降至历史最低点,2021-22年共和党EMI降幅大于民主党,差异显著。
- 随EMI下降,党派极化和收入不平等均呈上升趋势。
  • EMI与收入不平等的时序关系 [page::5][page::7]:


- EMI指标与未来两年内收入不平等(顶层1%收入份额)呈显著负相关,表明强调证据基础语言可减少不平等。
  • EMI对国会立法生产力的影响 [page::8][page::9]:


- EMI与三种立法生产力指标(重大立法指数MLI、立法生产力指数LPI、通过法律数量)均呈正相关。
- 公共舆论态度(对监管的支持)对生产力有调节作用,支持度高时生产力表现优于回归预期。
  • EMI与党派极化的因果关系分析 [page::5][page::31][page::32][page::33]:


- 极化对EMI有直接影响,极化强化导致国会话语中证据使用减少。
- EMI并未显著预测极化水平,说明极化是话语转变的驱动因素。
  • EMI指标构建方法与验证 [page::2][page::18][page::19][page::20][page::21][page::22][page::23]:

- 利用包含49个证据基础词汇和35个直觉词汇的词典库,结合Word2Vec训练的词向量进行语义匹配计算。
- EMI定义为文本与证据词典的相似度减去与直觉词典的相似度,正值代表证据语言占优。
- 通过人工标注验证,EMI指标AUC曲线达0.79,具备较好区分能力。
  • 国会发言话语特征与政治环境互动机制 [page::10][page::11]:

- 党派领导控制发言权,代表立场驱动语言倾向,有利于形成共识但也可能加剧统一口径。
- 媒体影响及不停歇的竞选氛围下,国会发言更多为媒体表演,减少深度理性对话。
- 证据基础语言减少影响立法质量和效率,尤其在高度极化的背景下更显著。

深度阅读

计算分析美国国会演讲揭示从证据到直觉的转变 —— 报告详尽分析



---

1. 元数据与报告概览


  • 报告标题:Computational analysis of US Congressional speeches reveals a shift from evidence to intuition

- 作者:Segun T. Aroyehun, Almog Simchon, Fabio Carrella, Jana Lasser, Stephan Lewandowsky, David Garcia
  • 发布机构:多所学术机构联合(康斯坦茨大学、贝尔谢巴大学、布里斯托大学、波茨坦大学、格拉茨工业大学以及维也纳复杂科学中心)

- 发布日期:2024年左右(根据引用年份和资助信息)
  • 研究主题:分析1879年至2022年美国国会演讲文本,考察政治话语中“追求真理”的语言表达,从基于证据的论证转向基于直觉的表达,并关联政治极化、收入不平等与国会立法效率等民主指标。


核心论点
  1. 自20世纪70年代中期以来,美国国会演讲中基于证据语言的使用持续下降,伴随国会立法效率的下降。

2. 这种语言转变与党派极化加剧和社会收入不平等上升相关联。
  1. 基于证据语言对民主健康至关重要,有助于理性辩论、建立共识,促进有效立法。

4. 通过计算语言分析,并结合政治社会学指标,揭示语言变化如何映射并影响民主制度运作。

报告的主要信息是发现了一条从“证据”向“直觉”的转变趋势,暗示政治话语中真理追求的方式发生了根本变化,对民主功能产生消极影响,呼吁关注并修复政治沟通质量。[page::0,1]

---

2. 逐节深度解读



2.1 引言与背景


  • 关键内容

- 诚实和真实对于民主问责至关重要,不同个体对“诚实”的理解存在连续体:一端是基于事实、数据的“证据型”,另一端是基于感情、直觉的“直觉型”。
- 证据型话语奠定理性辩论基础,直觉型话语带来情感和经验维度,二者应均衡,但过度依赖直觉可能破坏政治妥协和协商。
- 当前民主社会出现“真理衰退”,难以区分事实与虚构,导致社会极化和公共信任下降。
- 本研究通过计算语言分析方法,考察国会演讲中证据型与直觉型语言的相对使用。
- 分析关注两个民主倒退风险因素:党派极化加剧及收入不平等扩大,探讨其与语言趋势和立法产出间的关联。
  • 推理基础

- 利用大量言论数据进行量化分析,结合政治学与社会学理论,将语言风格变化视为政治社会现象的指标。
- 前期研究关于语言与政治极化、经济不平等的关系为本研究设定理论框架。
  • 重要数据点:理论模型提出语言风格(证据 vs 直觉)覆盖政治真理追求的连续体,非单一极端。[page::1]


2.2 证据性与直觉性语言的测度(EMI评分)


  • 核心内容

- 分析约800万条1879-2022年国会演讲文字。
- 使用词典嵌入与词向量模型(Word2Vec)结合的方法构造“证据型”和“直觉型”语言词典,分别包含49个和35个关键词。
- 用词向量表示语言风格,利用语料上下文训练Word2Vec模型,再计算演讲文本与词典词向量的余弦相似度差值,定义为“EvidenceMinus-Intuition (EMI)”评分。
- EMI>0表示证据语言占优,EMI<0表示倾向直觉语言。
- 该评分经过严格验证,相关与人类判断评分一致度较高。
  • 方法细节

- 采用词典扩展与人工评分结合保证词典质量。
- 文本表示通过平均词嵌入完成,避免因词数差异带来的偏差。
- 长度调整及标准化方法用于确保一致性和可比性。
  • 关键数据

- 字典及模型构建细节详见补充材料。
- 此评分体系为报告提供了时间序列定量化衡量政治话语中真理追求方式的工具。[page::2,18-23]

2.3 EMI时间趋势及政党差异


  • 发现总结

- 1875年至20世纪早期,EMI值较高且趋于稳定,表示证据语言占优。
- 1940年代至1970年代中期,EMI呈上升趋势,达到历史峰值(约1975-76年)。
- 自70年代中期起,EMI开始持续线性下降,直至2022年降至历史最低点,说明演讲中直觉语言比例大幅上升。
- 早期也有EMI显著下滑的时期(1899-1901和1933-1935),与美国镀金时代和大萧条有关,反映经济社会危机期直觉型语言使用增加。
- 两大党派(民主党与共和党)在EMI下降趋势上高度同步,尤其1970年代之后,但最近几年共和党EMI降幅更大、中位数显著低于民主党。
- 参议院和众议院均呈现相似趋势。
  • 与政治极化及收入不平等的关联

- EMI下降同时期国会党派极化指数(DW-NOMINATE差值)和社会收入不平等(顶层1%收入份额)均明显上升,三者形成鲜明的负相关关系。
  • 统计支持

- EMI与极化局跨相关为-0.615,且极化被发现在动态模型中显著影响EMI,表明极化可能是语言转变的驱动因素。
- EMI滞后于极化变化,且EMI预测未来两年内收入不平等程度,呈负相关关系,显示语言风格可能预示社会经济趋势。
  • 复杂社会背景解读

- 经济危机和社会动荡时期,政治话语更倾向于情感驱动的直觉语言。
- 当下极化激烈,推动了政治话语的“表演化”和媒体逻辑占据主导,影响理性讨论的空间。

2.4 语言风格与国会立法生产力的关系


  • 生产力指标

- 主要使用重大立法指数(MLI)、综合立法生产力指数(LPI)和通过法案数量三个指标衡量国会生产力。
- 这些指标均受到政治极化、政党控制和公众监管态度的影响。
  • EMI与立法生产力数据分析

- EMI与MLI(r=0.454)、LPI(r=0.836)、法案数对数转换后(r=0.796)均显著正相关,证据语言占优时立法生产力更高。
- 公众对监管政策的支持情绪(政策情绪)在其中发挥调节作用,高情绪时期立法产出高于回归平均线。
- 经回归模型严格控制极化、政策氛围、政党控制等变项后,EMI对重大立法和综合生产力指数的正向影响依然显著,提示语言风格对立法效率有独立影响。
  • 立法生产力驱动逻辑

- 采用证据语言有助于建立事实共识,推动跨党派协商,从而提高立法质量和数量。
- 直觉语言倾向激化对立,减少共识基础,妨碍法规制定。

2.5 结论段落


  • 全局总结

- 综述证据与直觉语言计算测度的发展与验证,分析涵盖150多年美国国会话语。
- 语言风格从1970年代达峰后持续转向直觉语言,两党呈同步变化。
- 证据语言比例下降与极化和收入不平等的上升密切相关,且与国会生产力下降同步。
- 极化似乎是语言变化背后的直接驱动力,而语言风格则可预测收入不平等未来走向。
- 基于哈贝马斯交往行动理论,证据语言是理性辩论及决策的基石,与立法产出正相关。
- 党内领导控制发言权、极化党派基础和媒体逻辑促进了政治话语的“表演化”,损害了理性和细致的政策讨论。
  • 政策建议

- 促进跨党派合作与对话,抑制极化,重建以事实为基础的民主话语环境。
- 加强公众和政治人物对证据语言价值的认可,有助于民主制度的恢复和持续健康发展。[page::9-11]

---

3. 图表深度解读



3.1 图1:EMI时间趋势、党派差异、极化与收入不平等及国会生产力


  • 图1A:1879-2022年国会EMI分数趋势

- 纵轴为EMI值(-0.5到+0.4),横轴为国会会期起始年份。
- 显示EMI在1940年代后上升,1975年达到峰值后持续下降。近十年降幅明显,表明证据语言使用比例大幅减少。
- 置信区间极窄,数据量巨大。
  • 图1B:按党派划分的EMI时间序列

- 蓝色为民主党,红色为共和党。
- 两党早期有分歧,但70年代后双双进入下降轨迹,表明两党语言风格趋向一致。
- 2021-2022年共和党EMI降幅显著大于民主党。
  • 图1C:极化指数与收入不平等趋势

- 极化(灰色方块,右轴)呈上升趋势,特别是70年代后持续加强。
- 收入不平等(橙色圆点,左轴)呈U形走势,70年代后亦快速上升。
- 两者与EMI走势满足负相关。
  • 图1D:国会生产力指标

- MLI(紫色线)与通过重要立法数量指标,20世纪中期至70年代达到高位,之后逐渐下降。
- 通过法规总数(淡棕色柱)也呈下降趋势。
- 与EMI趋势对应,支持证据语言与立法效率关系密切。
  • 数据质量与限制

- 使用据公开数据库和历史测量指标,数据覆盖广泛但早年数据量相对较少。
- 统计分析显示高度显著的线性和相关性趋势,但未剖析机构内外其他变量影响。
  • 图片链接



3.2 图2:前序EMI得分与随后两年顶端1%收入份额相关性


  • 横轴为前一届国会EMI分数,纵轴为随后两年顶端1%收入占比。

- 点代表年度,线条为局部加权回归拟合。
  • 可以看出EMI越高(证据语言多),随后收入不平等越低,且二者呈明显负相关。

- 2020年代前后EMI较低,收入顶端份额升高。
  • 说明语言风格可能是预测社会经济不平等变化的有效指标。
  • 图片链接



3.3 图3:EMI与国会生产力相关性


  • 包含三个散点图,分别对应MLI、LPI和过法案数量对数。

- 横轴为同期国会EMI得分,纵轴分别为三种生产力指标。
  • 点颜色根据公众对监管政策的支持情绪(深蓝为高红色为低)。

- 三图均显著呈正相关,指证据语言占优时立法产出更高。
  • 颜色分布显示政策情绪调节效应—公众态度与语言风格对生产力共同作用。

- 线性回归线及置信区间展示趋势强烈。
  • 支持创新观点,语言风格不仅是态度体现,也促进或阻碍立法效率。
  • 图片链接



---

4. 估值与模型分析


  • 报告核心为时间序列回归分析滞后相关性测试

- 利用AR模型控制自相关,探讨EMI、极化、收入不平等间的因果潜在联系。
- 极化似乎即时影响EMI,而EMI滞后预测不平等趋势。
- EMI和立法生产力的模型控制了政策情绪、政治控权变数,说明证据语言有独立影响。
  • 统计显著性强,全报告多处使用置信区间、滞后分析确认因果相关方向。

- 使用词向量模型Word2Vec,构建的EMI为创新的语言定量指标,融入社会科学模型。
  • 验证过程包含人类标注一致性和AUC指标确保计算方法可靠。

- 处理了多变量间共线性,增加了交互项(EMI×极化)以探查调节作用,结果显示交互效应弱或不显著。

---

5. 风险因素评估


  • 极端解读风险

- 报告指出极化是驱动语言变化的重要因素,但模型不能完全排除其他潜因,存在潜在混淆变量风险。
  • 语言方法局限性

- 词典构建和语义嵌入固有限制,无法完全捕捉语境和言外之意,尤其对政治话语复杂度存在一定简化。
  • 历史与数据完整性相关风险

- 早期数据缺失与质量问题可能影响结果稳定性。
  • 分析假设

- 假设语言变化与民主健康直接关联,但中间机制未完全明晰,可能过于简化多元社会现象。
  • 缓解策略

- 多种统计检验、敏感性分析和交叉验证在报告中加以使用,确保结论稳健。
  • 政策应用风险

- 如何将语言研究成果转化为实际政治改善途径还需进一步探讨。

---

6. 批判性视角与细微差别


  • 报告强调“证据语言”和“直觉语言”构成连续体,较好地平衡了政治语言复杂性,而非极端标签化。

- 但报告可能未充分讨论如何区分正当情感表达与非理性直觉对政治决策的不同影响。
  • 两党语言趋同呈同步下降趋势,暗示政治语境整体环境变迁而非单党派偏差,这一点值得更深入探讨。

- 极化可能既是语言变化的驱动,也被语言反作用,双向关系复杂,因果识别存在挑战。
  • 语言风格与社会经济指标关联紧密,但其机制尚需更多实验或定性研究支持。

- 报告及其方法新颖,但对“语言风格如何具体影响立法过程”环节未展开,未来工作空间巨大。

---

7. 结论性综合



该报告开拓性地结合计算语言学与政治社会学,首次长时间跨度量化分析了美国国会话语中从证据性向直觉性语言的历史演变。通过构建Evidence-Minus-Intuition(EMI)得分,报告统计显示:
  • 历史趋势:70年代后达高峰的证据语言使用逐渐回落,当前处于数十年最低。

- 党派共识:民主党与共和党语言风格同步变化,表明政治语境整体影响。
  • 与民主健康指标关联

- EMI下降伴随党派极化加剧,极化被视为语言走向直觉的直接推手。
- EMI低预示未来收入不平等加剧,显示语言风格可能影响或反映社会经济动态。
- EMI与国会立法生产力正相关,证据语言促进理性对话和有效立法。
  • 语言与制度交互

- 高度极化和媒体逻辑渗透下,政治话语趋向“表演”,伤害了公共理性和民主功能。
  • 政策启示

- 促进跨党派沟通、降低极化、提升证据语言价值是提升民主活力的重要策略。
- 监督和引导政治话语风格可助力政治生态改善。

总体上,报告系统阐明了政治语言风格变化不只是话语转型,更是美国民主健康与社会正义问题的关键窗口,为政治沟通品质的干预设计和民主制度优化提供了重要智力基础。

---

总体评价



本报告在方法论、数据量与理论构架上均达到国际领先水平,紧密结合语言学、政治学及社会学命题。其以EMI计量政治话语中的“真理追求”方式,跨越140年以上时段,详尽分析语言变迁对美国政治极化、经济不平等和国会工作效率的重大影响,为探讨民主衰退提供新视角。报告严谨使用统计模型验证结论,充分展示语言与政治社会现象的复杂动态,极具学术和现实意义。

---

参考溯源



文中关键论点及数据引用均精确标注如下:
  • 报告核心论点、背景及理论框架详见[page::0,1]

- EMI评分方法及验证详见[page::2,18-23]
  • EMI时间趋势及党派差异、极化与收入不平等关联见[page::3,4,5,30,31]

- EMI与国会生产力关系及统计模型见[page::8,9,39-42]
  • 语言转变的政治机制及媒体逻辑影响见[page::10,11]

- 图表详解见[page::6,7,9]
  • 对数据预处理与统计检验细节详见补充材料[page::18-23,29-38]


以上保证报告内容分析的完整性和溯源透明性。

报告