`

Words or Numbers? How Framing Uncertainties Affects Risk Assessment and DecisionMaking

创建于 更新于

摘要

本论文通过在线实验比较了口头概率(如“likely”)与数值概率(如75%)的沟通方式对后续决策的影响,发现当概率以口头形式传达时,参与者在中等与较高发生概率下给不确定选项设定的最低接受价显著更低,且在高概率情形下导致更不理性的决策(与期望值偏离更大);该效应在控制并匹配参与者对口头短语的数值翻译后依然存在,表明行为偏差并非完全由误译引起,而是源于口头表达所带来的额外模糊性与歧义 [page::1][page::18][page::20]

速读内容


1) 口头概率存在显著翻译异质性与模糊性 [page::15]


  • 密度图显示五个口头短语的数值翻译峰值靠近预期数值,但个体翻译存在大幅分散,标准差通常在~12点左右,表明口头概率含义不确定且异质性高 [page::14][page::15].

- 为改善可比性,作者对口头组与数值组实施了共分粗匹配(CEM),匹配后总体翻译标准差从12.77降至2.37,范围从85.6缩至8.26个百分点,代价为部分样本丢失 [page::15][page::16].

2) 口头 vs 数值:平均最低接受价与期望值比较(核心发现) [page::17][page::18]


  • 不同概率水平下,参与者的最低接受价随概率上升而上升,但上升幅度不及期望值变化(低概率表现出风险偏好,高概率表现出风险厌恶)[page::16][page::17]。

- 未匹配样本的Mann-Whitney检验显示,在中等(50%)、高(75%)和极高(99%)概率处,口头组与数值组的最低接受价存在弱到中等显著差异(p≈0.07–0.10)[page::17][page::18]。
  • 回归(匹配后)显示:在“about as likely as not”(50%)与“likely”(75%)两档,口头沟通对应的最低接受价分别显著低于数值沟通约13.95和23.48便士(控制协变量后)——表明口头表达降低对不确定选项的估值 [page::18][page::19].


3) 匹配(CEM)、方法与若干量化统计摘要 [page::9][page::15]


| 指标 | 匹配前 | 匹配后 |
|------|--------:|-------:|
| 翻译标准差(平均) | 12.77 | 2.37 |
| 翻译范围(平均) | 85.60 | 8.26 |
| 口头组样本N(示例) | 149 | 约92(平均) |
  • 实验采用基于10张彩票的两阶段设计(选票 + Becker–DeGroot–Marschak机制来揭示保留价格),五轮对应五个概率水平,随机支付一轮以激励真实选择 [page::10][page::34].

- 为消除“误译”驱动的差异,作者使用CEM在翻译、年龄和性别上匹配并加权回归,结果表明中高概率情形下口头效应在匹配前后均稳健(见森林图)[page::13][page::20].

4) 分布特征与可解释机制(歧义与方向性) [page::21][page::22]


  • 对最低接受价的密度分析显示:在50%处,口头组在极端值(接近0或接近200)上的比重更高;在75%处,数值组更集中于期望值(150便士),而口头组分布更分散,缺乏共识,暗示口头表达增加决策变异性 [page::21][page::22].

- 解释上,作者将结果归因于口头短语的“二阶不确定性”(ambiguity)与语言“方向性”可能的交互作用:口头表达在中高概率下引发回避(较低估值),在低概率下的风险偏好可能受到方向性与模糊性的相互抵消影响 [page::24][page::25].

深度阅读

引言与报告概览(元数据)
  • 报告标题:Words or Numbers? How Framing Uncertainties Affects Risk Assessment and Decision-Making;作者:Robin Bodenberger 与 Kirsten Thommes;所属机构:Paderborn University, Chair of Organizational Behavior;通讯作者:Robin Bodenberger。 [page::0]

- 主题与核心议题:研究“以文字(verbal)或数字(numerical)方式表述不确定性”对接收者如何评估风险与做出决策的影响,重点考察(1)两种沟通方式是否导致决策差异,及(2)即便当受试者能准确将文字短语翻译为作者意图的数值时,这些差异是否仍然存在。 [page::1]
  • 报告主要结论与建议(作者立场):实验结果显示,当不确定性以文字表述时(尤其在中等和高概率区间),参与者对不确定选项的估价(reservation price)显著低于以数字表述时,且这种效应在参与者确实正确翻译文字短语为期望数值的情况下仍然存在;作者据此建议管理者在需要中立清晰沟通时应优先使用数值概率。 [page::1] [page::25]


逐节深度解读

1) 引言(Introduction)
  • 要点概述:作者指出发送者倾向用文字表达不确定性以保留灵活性与信誉,而接收者更偏好数值表达以获得明确性;这种偏好不匹配被称为“communication mode preference paradox”。报告以IPCC使用文字概率的实践为现实动机。 [page::2]

- 推理与假设基础:基于既有证据(发送者偏好文字、接收者偏好数字)以及文字短语的模糊性,作者提出研究问题并设定实验以检验文字 vs 数字对行为后果的影响。 [page::2] [page::3]

2) 文献回顾(Related literature)
  • 要点概述:将文字概率的模糊性置于模糊性(ambiguity)与风险(risk)区分的理论框架下,借用Ellsberg(1961)关于风险与模糊性的经典定义来解释接受者对文字概率可能表现出的“模糊厌恶”。 [page::4]

- 关键参考与理论链接:作者引用Halevy(2007)、Borghans等(2009)等以BDM机制测量reservation price的研究,指出这些先行研究把模糊性通常以数值区间或丢失概率来实现,而未把“文字概率”作为模糊性的操作化来源,从而留下研究空白。 [page::4] [page::5]
  • 由此提出的四个假设(H1–H4):(H1,H3)在文字(vs 数字)表达下,接收者会给不确定选项更低的估价(总体与在正确翻译条件下);(H2,H4)文字表达下接收者表现为更不理性的行为(总体与在正确翻译条件下)。 [page::6] [page::7]


3) 方法(Method)
  • 实验总体设计:在线随机实验(SoSci Survey)+问卷,受试者来自Prolific(英国),共200名完成者;每位参与者进行5轮基于10张“彩票票券”的抽取决策,每票“Win = 200 pence”或“Loss = 0”,5轮分别对应五档概率(1%,25%,50%,75%,99%),概率信息以文字或数值形式随机呈现;随后使用Becker–DeGroot–Marschak(BDM)机制诱导性揭示reservation price。 [page::7] [page::10]

- 关键变量定义:因变量为各轮的reservation prices;主要自变量为“沟通形式(verbal=1 vs numerical=0)”;协变量包括性别、年龄、Berlin Numeracy Test (BNT)分数与响应时间(用于衡量注意力)。 [page::11] [page::12]
  • 文字与数值对应的设置(Table 1):作者从IPCC常用短语选取五个代表性文字短语,并为数值组设定对应的精确概率:Exceptionally unlikely (1%), Unlikely (25%), About as likely as not (50%), Likely (75%), Virtually certain (99%),并说明了选择这些数值的理由与挑战(文字翻译在个体间差异大)。 [page::8] [page::9]

- 关键方法论挑战与应对:由于文字短语被不同个体以不同数值解读,报告采用Coarsened Exact Matching (CEM) 来在“翻译准确度、年龄、性别”等维度上对文字组与数字组进行匹配并加权,以便在控制翻译误差后研究“沟通形式本身”的因果效应。作者还为文字组单独要求事后报告其对短语的数值翻译,以便匹配与检验。 [page::12] [page::13] [page::14]

图表与图像的详细解读(关键环节)
  • Table 1(表中五档概率与对应短语)描述:表1展示五个likelihood level及其对应的数值与IPCC解释区间(例如“Likely”对应75%,IPCC区间66–100%)。该表明确了实验内“数值组”的处理基线并为后续比较提供参照。解读意义:作者以这些对应值作为“控制组”的精确概率,使得后续比较能把文字表述(及其翻译分布)映射到具体数值上并检验差异。 [page::9]

- Figure 1(密度函数:文字短语的数值翻译分布):请参见图:

描述與解读:图1为5条核密度曲线,分别表示参与者对5个文字短语的数值翻译分布。总体上三条(“unlikely”, “about as likely as not”, “likely”)密度峰位接近作者为数值组设定的对应值,而“exceptionally unlikely”和“virtually certain”也分别接近1%与99%但仍有离散分布。关键洞察是:虽然群体中位数接近目标值,但每条曲线呈现宽阔的尾部与多峰,显示文字翻译具有显著个体异质性与模糊性,这正是作者对“第二阶不确定性(即对概率本身的不确定)”的核心描述证据。 [page::14] [page::15]
  • Table 2(文字翻译的描述性统计,匹配前后对比):表2定量显示匹配前后翻译分布的变化,例如“Before”中5种短语标准差在11.41–16.55之间,range最长达95;“After”应用CEM后平均标准差降至约2.37,range降至约8.26;但匹配也造成数据损失(平均每短语从文字组丢弃约57个观察值)。解读:CEM大幅缩减翻译异质性提高可比性,但以牺牲样本规模为代价,作者已知并报告了这一权衡。 [page::15] [page::16]

- Figure 2(平均 reservation prices 条形图,含未匹配/匹配后的文字组对比):请参见图:

描述與解读:图2以深色柱(数值组)、蓝色(文字组所有观察)与灰色(文字组经正确翻译后匹配样本)并列展示五档likelihood下的平均reservation price与误差棒,并用红色虚线标出每档的理论期望值(expected lottery value)。主要观察:reservation price 随likelihood上升而上升,但上升幅度小于期望值增长幅度——低probability区间表现出相对风险寻求(reservation price 高于期望值),而高probability区间表现出相对风险厌恶(reservation price 低于期望值);在中高概率(50%、75%)处,文字组(即便在“正确翻译”子样本中)平均reservation price 持续低于数值组,暗示文字措辞造成了估价偏低。统计检验(非参数Mann–Whitney)在中到很高概率处显示显著差异(接近或小于10%水平)。 [page::16] [page::17]
  • Table 3(Mann–Whitney检验结果):表3给出五档likelihood下数值组与文字组的均值与p值,显示在50%、75%、99%三档下p < 0.10(即在10%显著性水平可拒绝同分布),但在1%和25%下无显著差异。解读:非参数检验初步支持在中高概率时沟通形式影响决策的命题,但由于CEM匹配后分析需要权重,该检验仅作为未加权的初步对照。 [page::17] [page::18]

- Table 4(加权回归:匹配后模型,按每档likelihood分别回归reservation price):表4展示了在应用CEM权重后的回归结果(每一列为一档likelihood的模型),核心系数是“Verbal”(相对于numerical的差异)。结果显示:在中等likelihood(50%)与高likelihood(75%)中,“Verbal”对应的系数分别约为 −13.95 pence(p<0.05或接近)与 −23.48 pence(p<0.05或接近),表明在这些概率层级下文字沟通显著降低reservation price;其他层级系数不显著。该表还显示BNT(数字素养/流动智力)在低概率层级对reservation price有显著负向影响(即高BNT个体在低概率时更理性)。详见表格与括号内鲁棒标准误。 [page::18] [page::19]
  • Figure 3(森林图:文字效应在匹配前/后的一致性):请参见图:


描述與解读:图3展示文字沟通效应(在各概率水平)并列显示“全部观察”与“正确翻译匹配后”两种估计及其置信区间,发现中、高概率的负效应在匹配前后方向与幅度相对一致,表明效应并非仅由文字被误译导致,而是文字表述本身(其内在模糊/第二阶不确定)对行为有额外影响。作者据此确认H1/H3(赋值更低)与H2/H4(更不理性,至少在高概率层)在中高概率处成立。 [page::20] [page::19]
  • Figure 4(reservation price 的密度分布,按概率层级比较数值/文字):请参见图:


描述與解读:图4将各档概率下三条密度(数值组、文字组全部样本、文字组匹配样本)并排显示。中等概率(50%)时,三条曲线在100pence处均有明显峰值,但文字组在两端(非常低与非常高的reservation price)更有尾重,表明文字沟通增加了极端估价的频率;在高概率(75%及99%)时,数值组更集中靠近期望值(150p、198p)的峰值,而文字组分布更分散、缺少在期望值附近的明显峰,支持“文字沟通引入更高决策异质性与较差一致性”的结论;且这种差异在匹配后依然存在,进一步证明非仅由误译造成。 [page::21] [page::22]

估值与统计方法分析(关于BDM与回归的技术解读)
  • BDM机制说明:参与者为其选票设定reservation price,随后若随机生成的offer高于该价则卖票并获得保证金,否则保留票由彩票结果决定;该机制可用来测量参与者对不确定选项的即时金钱估价(隐含效用值)。该方法能够揭示相较仅作二选选择(如Ellsberg的原始设计)更精细的价值偏差。 [page::10]

- 回归/匹配策略与关键假设:作者为识别“沟通形式本身”的效应,先在描述性分析中用非参数检验(Mann–Whitney),再用回归在CEM权重下估计并控制协变量(性别、年龄、BNT分位、响应时间);核心识别假设是:在匹配后,文字组与数值组在翻译准确性与其他协变量上可比,从而估计文本效应近似因果。作者也直接比较加权(匹配后)与非加权模型以展示稳健性。 [page::13] [page::18] [page::20]

风险因素与方法论限制(作者识别与我方评价)
  • 报告已识别并讨论的限制:

- 文字翻译的高异质性导致必须采用匹配并牺牲样本量,这影响外推性與估计精度。 [page::15]
- 实验为在线、低注资、简化情境(10张票、一次随机付酬),因此需要外部场景与高赌注验证以评估现实世界适用性。 [page::14] [page::26]
- 文字概率的“方向性(directionality)”可能与模糊性交互影响行为,作者未能在本实验中完全区分二者。 [page::24] [page::25]
  • 我方对潜在偏差与额外注意点(基于报告内容审慎判断):

- CEM匹配降低了样本异质性但同时可能引入选择性样本偏差(只有能被匹配的文字参与者被用于“正确翻译”的比较),因此匹配后结论主要适用于那些能且确实将文字短语翻译到接近作者指定数值的参与者,而非所有接受到文字短语的受众。作者也指出了数据损失并报出匹配后样本规模。 [page::15] [page::13]
- 因为实验只在英语母语的英国样本上实施,跨文化/语言环境下文字概率的翻译分布与行为效应可能不同,作者在文中建议未来研究需外部验证。 [page::8] [page::26]
- 文字表述带来更大分散性的发现与“更不理性”的结论在统计上主要在中高概率显著;对低概率层面(1%、25%)的行为并不存在一致的文字与数值差异,说明效应并非全域一致,应谨慎陈述普遍化结论。 [page::17] [page::16]

结论性综合(报告的关键发现与实务含义)
  • 关键发现汇总:

- 参与者对IPCC式文字概率的数值翻译在群体中位数通常接近作者为数值组设定的目标值,但个体间差异显著,密度曲线呈长尾与多峰,证明文字概率具有显著的模糊性(第二阶不确定)。 [page::14] [page::15]
- 即便在控制翻译准确性(通过CEM匹配并加权)之后,文字沟通在中等(50%)和高(75%)概率层次仍会导致显著较低的reservation price(约 −13.95 pence 与 −23.48 pence),并在高概率层使得行为更偏离期望值(即 “不够理性”),说明负面效应并非仅由误译引起,而是文字形式自身引入的模糊性或认知干扰所致。 [page::18] [page::20]
- 文字沟通同时带来更高的决策异质性(reservation prices 更分散),尤其在高概率区间,数值沟通倾向使得群体更一致地靠近理论期望值。 [page::21]
- 高BNT分数(较强的数理推理能力)在低概率层帮助参与者减少对期望值的偏离,显示个体认知能力会调节在不确定性下的估值偏差。 [page::22]
  • 实务建议(作者结论):在需要使决策基于实际概率而减少沟通引入的偏差时,应优先使用明确数值概率;在组织决策、政策传播或AI向人类呈现不确定性时,尽量避免仅用文字概率,或在文字后补充精确数值以减少误导。 [page::25] [page::26]

- 对未来研究的建议(报告中提出):作者建议进行外部与高赌注情境验证,研究方向性(directionality)与模糊性(ambiguity)之间的交互,以及在不同文化语境下的外推性检验。 [page::26]

附:关键图表/图像索引(报告中提及并已展示)
  • Figure 1(文字短语数值翻译密度): [page::15]

- Figure 2(平均reservation price 比较): [page::17]
  • Figure 3(效果森林图:匹配前后比较): [page::20]

- Figure 4(五档概率下reservation price 密度对比): [page::22]
  • Appendix A(实验流程图): [page::34]

- Appendix B(BNT 流程图): [page::35]
  • Appendix D(CEM 匹配散点示意): [page::37]


總結性点评(客观、基于报告内容)
  • 报告以严谨的实验设计与匹配方法系统地检验了文字 vs 数字概率表述对行为估价的影响,并提供多层次证据支持“文字表述在中高概率层会导致保守(低)估价且增加群体异质性”的结论;作者同时诚实披露了样本限制、匹配带来的数据损失与实验外部效度需进一步验证的问题。 [page::10] [page::15] [page::26]

- 对决策实践的含义清晰:若目标为减少沟通引发的二阶不确定性与确保群体按概率作出一致决策,建议以数值概率为主并在必要时将文字短语与数值范围并列呈现。 [page::25]

(以上分析均基于报告各章节、表格与图形内容逐处梳理与解读,并在每处来源陈述后标注了对应页码以便溯源。)

报告