`

On Prior Confidence and Belief Updating

创建于 更新于

摘要

本报告通过实验研究信念分布内的置信度与对多个先验的置信度对信念更新的影响。结果显示,人们对多个先验的置信度导致过度保守更新,过度依赖先验而非信号,而对单一定义的先验信念置信度不敏感,表现出非贝叶斯行为,且存在显著的过度自信行为 [page::0][page::1][page::2][page::3][page::19][page::33].

速读内容

  • 实验设计基于Kahneman和Tversky的出租车难题,使用10x10黑白格子展示成功率,设置两个置信度处理:低置信度(0.25秒闪现)和高置信度(允许30秒观察)[page::6][page::7]。


- 先验通过格子白色比例体现,信号为关于随机选中格子颜色的测试结果,准确率为60%或80%。
- 置信度通过BDM机制激励采集,测量个体对所述概率猜测准确性的置信水平。
  • 置信度在多个先验上的差异显著:高置信度组表现出显著更高的自我置信,低置信度组报出较低置信水平[page::18].

  • 受试者对先验的准确度差异明显,低置信度处理下先验估计误差更大且波动性更高,高置信度下准确度提升明显[page::18].

  • 受试者普遍表现出保守偏差,低置信度组相比高置信度组更新更大,更接近贝叶斯标准,证实Hypothesis 1[page::19][page::20].

  • 工具变量回归显示,先验置信度与更新幅度负相关,置信度每增加1个百分点,过度更新减少0.175个百分点,支持Hypothesis 2[page::21][page::22].

- Grether模型估计表明,高置信度下个体对先验权重β显著提高,信号权重α则降低,体现更依赖先验、低依赖信号的更新行为,符合Hypothesis 3[page::23][page::24].
  • 个体层面分析发现约35%受试者在高置信度组根本不更新,α分布左移,β右移,显示高置信度提升先验影响力且压制对信号的响应[page::25][page::26].

  • 受试者更新幅度不随先验的接近50%而变化,呈固定幅度更新,反映对单一定义的置信度(置信分布扩散度)不敏感,与贝叶斯更新理论不符[page::28][page::29].

  • 过度自信普遍存在:受试者在先验信念上的置信度超过实际准确度,且在高置信度组表现显著更强的更新后信念过度自信,说明对信念更新能力的高估[page::30][page::31][page::32].



  • 信念置信度与更新置信度高度正相关,表明受试者错误地自认为为贝叶斯更新者,且置信范围控制在3个百分点内[page::33].

  • 理论上,贝叶斯更新对多个先验置信度无敏感,但受试者表现出对多个先验置信度的行为响应,是对现有贝叶斯模型的实证挑战[page::10][page::11].

- 实验提供的激励兼容置信度测量机制为未来实验设计与信念研究提供工具,推动对非贝叶斯信念更新机理的理解及建模[page::3][page::8].

深度阅读

金融与行为经济学研究报告详尽分析报告


报告题目: On Prior Confidence and Belief Updating
作者: Kenneth Chan, Gary Charness, Chetan Dave, J. Lucas Reddinger
发布日期: 2024年12月13日
发布机构: 未明确指出具体机构,但由加州大学圣塔芭芭拉分校收集验证数据。
研究领域及主题:
  • 领域:行为经济学、实验经济学、认知心理学

- 主题:贝叶斯信念更新,先验信心对更新行为的影响,实验验证,信念置信度的激励相容测量方法。

---

1. 元数据与报告概览



本报告探讨了两种不同的“置信度”对人类信念更新行为的影响以及与贝叶斯更新的理论关系:
  • 置信度一: 相信先验概率分布的“置信度”,实际为分布的离散程度(不确定性大小);贝叶斯理论认为,分布越离散(置信度越低),信念更新越充分。

- 置信度二: 不同先验的集合上的“置信度”,即在多个可能的先验之间的不确定性。理论表明,多个先验的均值决定了平均贝叶斯后验,实际置信度变化不应影响平均后验。

通过实验,他们操纵显示时长(0.25秒与30秒)来影响受试者对先验的置信度,并利用一个新开发的激励兼容机制测量受试者对先验信念的置信度。实验任务基于名著出租车问题(Taxi-cab problem),借由10x10黑白格子的比例构成先验概率。受试者依次报告先验概率、置信度、接收信号后的更新概率及对应的置信度。

核心发现为:
  • 人们对多个先验的置信度影响其更新行为,表现为在高置信度时更保守(低置信度时过度更新),这与贝叶斯理论相悖。

- 对单一先验分布内的置信度变化,受试者不敏感。
  • 受试者普遍表现出对自身信念的过度置信。

- 报告了激励兼容的置信度测量机制。

该报告不仅拓展贝叶斯信念更新的实证文献,也对认知机制提出挑战。[page::0][page::1][page::2][page::3]

---

2. 逐节深度解读



2.1 引言与理论框架(第1-3页)



主要论点与信息:
  • 贝叶斯定律为经济学模型中的信念更新标准,但行为实验发现普遍偏离该范式。

- 对先验信念的置信度,贝叶斯理论认为:置信度越高(先验分布越集中),更新时对先验权重越大。
  • 对多个先验的不确定性,贝叶斯理论则指出,平均后验等价于用平均先验进行更新,不受多个先验分布置信度的影响。

- 本文创设一实验设计,通过控制光栅图显示时长,操作信心变化;闪烁时间短促导致受试者形成多种可能先验(不确定性高),闪烁时间充足则相反。
  • 设计引入一个创新的激励兼容机制,测量受试者对信念的置信度,即受试者在多种概率公告下选择固定收益与随机赌注的切换点$q^$。


支撑逻辑:
通过实验变化可观察实际更新行为与贝叶斯预测是否一致,判断不同置信度对更新路径的影响。该机制兼顾了实验简便及理论激励相容性。

关键数据与假设:
  • 使用10x10黑白格子,白色代表成功。

- 设置两种信号准确度:60%与80%。
  • 先验由观察格子比例而定,由于显示时长差异造成对先验的置信度差异。


术语解释:
  • Bayesian Updating: 基于贝叶斯定理,组合先验概率和新信息以形成后验概率。

- Confidence Elicitation: 关于受试者对其概率判断的置信度的实验测量方法。
  • Incentive Compatible Mechanism: 确保实验中受试者诚实反映真实信念和置信度的奖励设计。


[page::1][page::2][page::3][page::6][page::8]

2.2 实验设计详述(第3.1-3.2节,第6-10页)



关键内容总结:
  • 实验任务:受试者作为“项目经理”,评估被随机选中项目成功(白色方格)的概率。任务中显示的白色托盘数目决定先验概率。

- 低置信度处理:格子仅闪现0.25秒;高置信度处理:格子持续显示30秒。任务先进行低置信度后再高置信度,以避免先入为主影响。
  • 信号是对所选项目状态的测试结果,且具有对称的不完全准确性(60%或80%)

- 对先验和更新信念,都要求受试者报出概率及置信度,置信度通过所设计的主观-客观赌注切换点$q^
$测量。
  • 采用BDM(Becker-DeGroot-Marschak)机制确定$q^$值,保证理论上的激励相容。

- 实验还设计严格的理解检验和低难度测试(一组全为失败项目的格子),验证被试对任务及机制的理解程度。

逻辑支撑:
  • 显示时长差异造成信息样本大小差异,引出不同置信度水平,探究其对更新行为的影响。

- 利用清晰简洁的激励兼容手段量化置信度,避免复杂评分规则带来的认知负担。

关键数据点:
  • 每个被试完成22个任务(11低置信,11高置信),包括先验报告、更新报告与对应置信度共4个概率报告。

- 置信度$q^
$取值介于0-100,代表愿意接受的客观赌注概率阈值。
  • 对偏好假设:工具理性且中性模糊厌恶,方可确保激励相容。


[page::6][page::7][page::8][page::9][page::10]

2.3 主要理论推导(第3.4节,第10-13页)



重点理论与推论:
  • 建模主体认为存在多个可能先验$\pi{0,i}$,带权重$k{0,i}$,组合成混合先验$\pi0$。

- 信号$\sigma$到达后,应更新每个先验及对应权重形成后验。
  • 命题1显示,用混合先验加权更新相当于直接用平均先验更新,二者结果完全一致。

- 理论表明,多个先验置信度(权重分布)不应影响最终平均贝叶斯更新的结果。
  • 证明确认了多个先验的不确定性对平均更新无影响的理论基础。


解析复杂表达式:
  • 形式化公式给出后验计算的权重加权和,证明利用Bayes公式转化,表明该加权与平均先验直接更新无差别。

- “二者抵消效应”:混合更新中权重变化和单一路径更新中曲率效应相互抵消。

[page::10][page::11][page::12]

2.4 量化更新偏差指标设计(第3.5节,第13页)



定义指标:
  • Over-update(过度更新): 衡量受试者的更新$\pi1$相比贝叶斯更新$\pi1^{Bayes}$是过度(向信号方向动作过大)还是不足。定义签号确保同向偏差记正。

- Over-update-ratio: 标准化过度更新金额,考虑贝叶斯调动大小差异,使评价更加精细。
  • 错误方向更新(向信号相反方向)被视为严重的负过度更新。约27%的数据表现为此,作者保留全体样本以确保稳健性。


关键假设:
  • 该指标为判断受试者偏离贝叶斯的行为特征提供量化工具。


[page::13]

2.5 扩展模型及回归框架(第3.6节,第14页)



模型内容:
  • 采用Grether (1980)模型,形式上调整贝叶斯更新,允许信号权重$\alpha$和先验权重$\beta$偏离1,以捕获过度或不足反应。

- 以对数几率比形式线性化便于回归估计。
  • 增加交互项区分高低置信处理的参数差异。

- 设计IV方法,利用“实际先验”作为工具变量,缓解自己报告先验倾向的测量误差。

假设精炼(第3.7节,第15页)
  • H1:低置信处理下过度更新及比率更高。

- H2:报告的置信度越高,过度更新越低。
  • H3:高置信处理下$\betaH > \betaL$,即更重视先验。


[page::14][page::15]

2.6 实验数据验证(第4.1节,第15-19页)



理解测验:
  • 设计了零成功项目任务作为理解核查。97.5%受试者正确回答,说明实验理解较好。

- 置信度报告测试中,多数受试者表现合格,剔除少数错误者后,结果稳健。
  • 大多数受试者认同“当置信度越高,更新应越保守”,符合预期。


先验准确性:
  • 低置信处理中,先验估计误差大,分布宽,反映信号弱。

- 高置信处理下先验更准确,误差更小。
  • 显示闪烁时长有效操纵先验置信度。


置信度报告差异:
  • 如图4所示,先验置信度明显高于低置信处理。结果经统计检验显著。


[page::15][page::16][page::17][page::18][page::19]

2.7 过度更新现象分析(第4.2节,第19-22页)



统计描述:
  • 受试者整体表现为“保守更新”,即对新信号反应不足。

- 低置信处理下,更新更接近贝叶斯(相对较少保守),反而显得更“过度更新”。
  • 高置信处理下,更新更保守,过度更新指标更低或负。


回归分析(表1-2):
  • 多元固定效应回归显示,高置信处理可显著降低过度更新指标,符合H1。

- 使用高置信处理作为乐器变量,IV回归表明,置信度提升每百分点导致过度更新减少约0.175个百分点,支持H2。
  • 说明高置信状态下,受试者更倚重先验,反应信号时更保守,且确实由置信度驱动。


[page::20][page::21][page::22]

2.8 Grether模型参数估计(第4.3节,第23-26页)


  • IV两阶段回归估计显示,高置信处理下,先验权重$\betaH$提高约0.113,信号权重$\alpha_H$降低约0.111(两者均显著)。

- 60%信号准确度时,差异更明显,解释为弱信号时受试者对信号依赖更多。
  • 部分受试者(约35%)在高置信处理下根本未更新信念($\alpha=0$反映)。

- 个体层面差异:高置信下$\beta$分布右移,$\alpha$分布左移,显示行为一致性。
  • 结论:高置信增加先验权重、降低信号权重,强化保守更新。强调信心通过调整权重影响更新。


[page::23][page::24][page::25][page::26]

2.9 噪声认知模型分析及局限(第4.4节,第27-28页)


  • 现有噪声认知模型(如 Woodford 2020)假设认知信号噪声会造成更新偏差,但平均更新仍为贝叶斯凸组合。

- 该模型预期高置信处理下,由于认知信号更精确,更新应更接近贝叶斯理想。
  • 实验结果与此矛盾,表明该模型无法解释受试者表现,即高置信处理误差反而增大。

- 作者提出改进方案:Grether模型中的先验权重$\beta$依赖置信度的函数,解释权重随置信度变化。

另一置信度维度的分析(第4.5节):
  • 考察置信度作为单一先验分布的离散程度,贝叶斯理论要求置信度最低(50%先验)时更新力度最大。

- 受试者更新力度呈平坦曲线,无论先验远近50%,更新幅度约定一致,违背贝叶斯逻辑。
  • 表明受试者对单一先验分布内部置信度不敏感,可能采用固定大小的启发式更新策略。


[page::27][page::28][page::29]

2.10 过度自信现象(第4.6节,第29-33页)


  • 按照统计置信区间,受试者普遍对先验和更新概率自信心过高。

- 低置信处理下,先验置信心显著高于实际准确率,表明过度自信。
  • 对更新置信度,两个处理均过度自信,高置信状态更甚(过度自信约73个百分点,而低置信约51个百分点)。

- 说明受试者对自己的信念更新能力过于乐观,即使客观表现不佳。
  • 置信度间呈显著线性正相关,受试者认为自己的更新置信度与先验置信度一致,误以为自己是完全理性的贝叶斯更新者,显示心理机制缺陷。


[page::29][page::30][page::31][page::32][page::33]

2.11 结论(第5节,第33-34页)


  • 实验首次明确区分了两种置信度对信念更新的影响,得出“多个先验置信影响更新,但不应如此;分布置信度不影响更新,实则应影响”的悖论结论。

- 实验中信念更新偏离贝叶斯预测明显,置信度影响更新权重分配。
  • 置信度测量机制构成该领域重要贡献。

- 过度置信普遍存在,且在更有确信度的条件下更加突出。
  • 研究挑战了常规视角,提示未来模型需考虑该双维置信度影响与认知偏差。


---

3. 关键图表详尽剖析



图1 示例格子(第7页)




  • 展示10x10黑白方格示例,明确各个小方格的颜色对应成功/失败项目。

- 通过这一视觉样本诱导先验概率。
  • 两种时间展示设计导致刹那或充分感知先验概率的差异,即置信度差异。

- 图形在文本中作为信念起点,支持实验设计核心。

图2 受试者对更新与置信度关系的自我报告(第17页)




  • 显示约82%的受试者认为高置信度应导致更少调整。

- 反映对核心假设的认知一致性与心理对应基础,增强理论可信度。

图3 先验准确率比较(第18页)




  • 左图:平均先验表达值与实际先验接近(尤其高置信度下)。

- 右图:先验值绝对误差明显在低置信条件下更大。
  • 支撑显示时间操控置信度有效,实验内部效度强。


图4 置信度分布差异(同页)




  • 低置信处理置信度显著低于高置信处理(置信区间未重叠)。

- 与实验设计对应,为后续分析提供保障。

图5 过度更新及比率按信号准确度和先验(第20页)




  • 各子图分别对应60%和80%信号准确度及合并数据。

- 低置信度(蓝点)在大部分先验位置均表现较右方高置信治疗(橙点)更高的过度更新数值(向右和向左两侧均明显差异)。
  • 过度更新比率表现出类似趋势,高置信条件下参试者偏离贝叶斯程度更大,反应更保守。

- 数据点及置信区间清晰表明显著处理效应。

表1 过度更新OLS回归(第21页)


  • 高置信处理作为二元变量明显负向影响过度更新及比率(分别-3.8个百分点和-0.25,比三次标准误水平显著)。

- 控制受试者固定效应后结果依旧稳健。
  • 统计显著性非常高,反映处理效应可靠。


表2 置信度为内生变量的IV回归(第22页)


  • 使用高置信处理作为工具变量,提高识别可信度。

- 增加1个百分点置信度引致过度更新减小约0.175个百分点,过度更新比率减小0.012。
  • 说明置信度确实驱动保守性更新。


表3 Grether模型两阶段最小二乘估计(第23-24页)


  • 高置信处理$\beta$(先验权重)比低置信明显提升0.113

- $\alpha$(信号权重)对应降低约0.111
  • 参数随信号强度调整更明显,低强度下$\alpha$差异加剧。

- 统计结构严谨,首阶段F值充足,稳健验证参数差异显著。

图6 Grether模型个体层面估计(第26页)




  • CDF显示,高置信下$\beta$右移,$\alpha$左移,个体表现一致。

- 右侧差异图展示大多数人的$\beta$增加,$\alpha$减少。
  • 有35%受试者高置信组无更新($\alpha=0$点质量)。

- 反映群体共性外,存在无更新极端行为。

图7 平均更新幅度与先验的关系(第29页)




  • 贝叶斯更新呈现“倒U型”:先验50%时更新最大,其他处递减。

- 受试者更新幅度差异微弱,无显著先验依赖,呈平坦曲线。
  • 说明对单一先验置信度知觉不足,更新策略可能为固定增量。


图8-11 过度自信相关(第30-33页)


  • 图8-9显示大部分受试者在先验和后验置信度均表现过度自信。高置信处理下后验过度自信更为显著。

- 图10展示连续过度自信量(平均置信减去实际准确率),前者约37个百分点,后者达70%以上。
  • 图11反映先验与更新置信度强相关($R^2=0.92$),受试者认为自我更新能力接近完美贝叶斯。


---

4. 估值分析



本报告聚焦于行为层面的信念更新,无直接金融估值分析,因此本项不适用。报告的估值“模型”为基于Grether(1980)构建的行为估计模型,其估计明确而完整。其参数准确表征更新过程中对先验及信号的权重调整,形成本质上的“估值”——对信念加权的解读。上述章节已详述。

---

5. 风险因素评估



报告未明确讨论相关风险,主要聚焦置信度对信念更新行为影响的实证及理论挑战。但可隐含的风险包括:
  • 受试者对置信度和更新的误判导致决策偏差,风险为决策失误加剧。

- 实验环境对真实世界的外部效度风险,受限于实验参与者特征(大学生主体)和任务抽象性。
  • 机制理解风险低,但仍有少部分被试理解偏差可能影响数据质量。


以上风险通过设计中的理解检验、激励相容机制及内生性控制得以缓解。

---

6. 批判性视角与细微差别


  • 实验内循环顺序的潜在问题:所有被试均先经历低置信后再高置信任务,可能存在顺序效应影响高置信表现。

- 先验测量误差:尽管引入IV策略缓解,该误差仍可能传导至更新的估计,尤其在低置信条件。
  • 无更新个体比率较高:35%的受试者高置信条件不更新,提示置信度与认知惰性存在未明动力,值得深究。

- 报酬结构理解的异质性:部分受试主观概率介入其激励理解,可能存在激励不完全兼容的隐患。
  • 单一先验置信度未被捕捉:受试者忽视该维度说明现有人类认知机制深层次不足,也可能由任务设计简化导致。


整体而言,报告严谨且稳健,创新性的置信度测量方法具实用价值,实验设计周到,但对认知差异与心理机制解释仍略缺详尽。

---

7. 结论性综合



本报告系统揭示了两类置信度对人类信念更新的截然不同影响,挑战经典贝叶斯预期:
  • 置信度维度差异显著,行为非理性。 受试者对多先验置信度反应明显但违背贝叶斯,不对单一先验的分布置信度做合理调整。

- 实验创新在于设计独特的格子视觉刺激及简明激励兼容机制,有效测量置信度。
  • 更新过程中的“保守偏差”由置信度高低显著调节,高置信度受试者更依赖先验、更新更保守。

- 受试者对自身信念及更新水平存在显著过度自信,且高置信度处理下过度自信更甚。
  • 统计分析(OLS、IV、Grether回归)严密,兼容处理先验报告误差,结论统计显著。

- 当前主流噪声认知模型不足以解释本实验数据,后续需根据置信度设计更新权重的模型。

综上,本报告为理解信念形成与认知偏差提供重要实验证据和方法论支持,推动行为经济和认知科学对置信度层次细分及其影响机制的系统研究。

---

(全文引用页码均已标明,图片引用已按要求附加markdown格式示例。)

# END

报告

%