Ranking concerns or reference points: The impact of communicating expected payoffs in experimental studies
创建于 更新于
摘要
本文通过设计在线实验,揭示了实验参与者对被告知的平均期望收益作为参照点,对风险承担行为产生显著混淆效应。实验结果表明,在控制排名的情况下,参照点以下的参与者风险承担显著高于参照点以上者,而排名本身在控制参照点距离后未表现出显著影响。非社交场景及多种风险测度的鲁棒性验证进一步支持该结论,凸显在线实验设计中期望收益传达对行为的深远影响[page::0][page::3][page::6][page::7][page::14][page::16][page::24][page::29][page::30]
速读内容
实验设计与处理分组 [page::9][page::10][page::11][page::12]
- 实验在亚马逊MTurk平台上开展,参与者被随机分组(3人组),排序形成排名1~3,排名决定不同的初始资金额度。
- 设计两大处理:Reference value(明确告知平均期望收益5美元)与No reference value(不告知具体期望收益),且均分配到TreatmentLO(低于平均期望收益)和TreatmentHI(高于平均期望收益)。
- 图示展示TreatmentHI和TreatmentLO内不同排名对应的资金额(见封面图)。
主要实证发现:参照点效应显著 [page::14][page::15][page::16][page::17][page::18][page::19]
- 在Reference value处理中,处于参照点以下(TreatmentLO)的参与者风险投资份额明显高于参照点以上(TreatmentHI),两组差异达14.25百分点(p<0.001)。
- 控制排名条件下,TreatmentLO组在排名第二的情况下投资风险份额显著高于TreatmentHI。
- No reference value处理中,风险承担在TreatmentLO与TreatmentHI间无显著差异,排名效应较弱。


回归分析验证参照点与排名效应 [page::18][page::19][page::20]
- 线性回归中,参照点以下(TreatmentLO)显著增加风险承担,但该效应主要驱动于Reference value处理。
- 排名较低组风险承担提升明显,在Reference value中体现更强,No reference value中排名效应减弱且不显著。
- 交互效应揭示TreatmentLO下低排名参与者风险承担增强为核心驱动力。
非社交环境下参照点效应及距离效应 [page::23][page::24][page::27][page::29]
- Nonsocial处理去除社交排名,仅根据表现形成奖励差异。
- 通过断点回归发现,在Reference value条件下,风险承担随资金额低于5美元参照点的增大而明显增加,参照点以上无明显变化。
- No reference value条件下无明显参照点断点效应,但观察到可能与最低工资参照相关的其他断点。


替代风险测度的鲁棒性验证 [page::26][page::28]
- 使用Dohmen等(2011)非激励自我报告风险偏好测量,结果一致显示参照点以下更高风险承担。
- 实验者效应排除,参与者对研究目的理解有限。
研究贡献与实验设计启示 [page::30][page::31]
- 明确揭示在线实验中平均期望收益作为参照点对风险承担行为的重要影响,挑战纯粹排名影响的解释。
- 强调实验设计中信息传递对行为的混淆作用,建议实验平台重新考虑期望收益告知要求。
- 研究拓展了行为金融及决策实验设计在理解风险行为时的框架。[page::0][page::6][page::30]
深度阅读
金融研究报告《Ranking concerns or reference points: The impact of communicating expected payoffs in experimental studies》详尽分析报告
---
1. 元数据与概览
- 报告标题: Ranking concerns or reference points: The impact of communicating expected payoffs in experimental studies
- 作者: Sebastian Krull, Matthias Pelster
- 发布机构: 未明确披露,文中涉及多个知名学术文献及实验平台,推测为学术研究论文
- 时间: 相关研究时间节点介于2024-2025年
- 主题: 探讨在在线实验中,告知参与者预期平均收益(expected payoffs)对风险偏好实验的影响,特别关注排名(rankings)效应与参照点(reference points)效应的区分
- 研究核心论点: 在线实验中,当研究人员向参与者传达预期平均收益时,这一信息可能被参与者作为决策的参照点,从而干扰对社会比较中“低排名者更偏好冒险”效果的测量。通过设计实验,研究发现相对于排名,参照点对风险偏好的影响更为显著。具体地说,控制排名条件下,位于参照点以下的个体平均风险偏好高出18.23个百分点;控制参照点距离时,排名对风险偏好无显著影响。本研究证明在线实验平台(如Amazon MTurk)传达预期收益的做法可能会引入混淆效应。
---
2. 逐节深度解读
2.1 摘要(Abstract)
- 明确指出在线平台(CloudResearch,Amazon MTurk,Prolific)要求实验者告知参与者平均预期收益。
- 传达的预期收益构成了参照点,影响参与者的风险选择,特别是将风险偏好混淆为排名效应。
- 研究通过实验设计区分排名效应和参照点效应,发现参照点效应更为强烈且稳健。
- 关键发现:排名固定时,出于参照点以下个体的风险偏好高出18.23个百分点;参照点距离固定时,排名对风险偏好无显著影响。[page::0]
2.2 引言(Introduction)
- 阐述在线实验广泛采用平台,参与者必须知晓平均预期收益。
- 基于前述,提出实验参与者或将此平均收益视为参照点(reference point)。
- 概述 前景理论(Prospect Theory, PT),指出风险偏好依赖于相对参照点的收益或损失域:收益域表现为风险规避,损失域表现为风险寻求。
- 综述相关研究表明,社会比较和排名影响风险偏好,低排名者倾向更高风险偏好。
- 结合社会比较与参照点理论,指出实验中的排名效应可能被参照点效应所掩盖。[page::1-2]
2.3 文献综述、实验设计背景(Literature & Experimental Design Background)
- 梳理两大相关文献体系:
- 参考点依赖偏好:个体期望作为参照点影响决策(Kőszegi 和 Rabin 2006, 2007)。
- 社会比较与风险:排名影响个体风险选择,尤其是向上比较(Andraszewicz 等,2023)。
- 提出实验问题:对低排名者风险选择的提升,究竟是因为排名还是参照点(平均预期收益)引起?
- 设计亮点:能够对同一排名个体分为参照点以下与以上,及对同一参照点距离个体分为不同排名进行观察。[page::2-3]
2.4 实验设计(Research Design)
- 核心设计采用随机分组(三人组),真实工作量任务测试效能,基于表现生成排名(Rank1至Rank3)。
- 两个关键的“预期收益”沟通设置:
- Reference value treatment:明确告知参与者平均预期收益为\$5,参与者在注册页面和实验中反复获得该信息。
- No reference value treatment:不对预期收益进行明确沟通,使用无历史的新账户以减少信息泄漏,提示基本底薪1美元及潜在奖金。
- 在两个处理均包含的TreatmentLO(低于预期收益)和TreatmentHI(高于预期收益)组:
- TreatmentLO中,排名2获得\$3,排名3获得\$1,排在Reference value平均预期收益\$5以下。
- TreatmentHI中,排名2获得\$7,排名1获得\$9,都高于预期收益。
- 参与者可基于回报概率为50%获得2.5倍报酬或失去投资的Gneezy和Potters (1997)风险投资任务进行投资决策。
- 设计特点允许分离排名效应和参照点效应。[page::3-6, 9-12]
2.5 变量定义(Variables)
- Risky share:主要因变量,表示参与者将多少比例的初始资金投资到风险资产中。
- 核心自变量包括:Reference value treatment,TreatmentLO,Rank(1-3)。
- 控制变量包括努力程度、个体风险偏好(Dohmen等2011),年龄、性别、教育背景、金融及统计知识、投资经验等。[page::13]
---
3. 图表深度解读
图2 & 图3(Turkerview.com平台截图,page 5)
- 展示了MTurk的辅助信息获取渠道Turkerview.com,包括任务历史、评价、报酬率等。
- 说明即使实验者不明示,参与者仍可能通过第三方平台知道对应任务的预期收益状况,强化“预期收益已知”的假设。[page::5]
图4(实验处理结构,page 12)
- 该流程图清晰展示了Reference value treatment中“预期收益(\$5)”作为参照点,包含TreatmentLO和TreatmentHI两个分支,每个分支内的三人组中排名对应不同的支付:
- TreatmentHI:Rank1 \$9,Rank2 \$7,Rank3 \$5
- TreatmentLO:Rank1 \$5,Rank2 \$3,Rank3 \$1
- 图中通过颜色编码(红、绿、蓝)区别对待,凸显同一排名对应不同参照点距离的设计,可支持后续区分排名效应与参照点效应。[page::12]
图5(风险偏好分布箱线图,page 16)
- Panel (a) 比较相同端owment(\$5)但不同排名(Rank1 vs Rank3)参与者的风险投资份额在Reference value和No reference value中差异:
- Reference value中Rank1和Rank3风险投资分布几乎一致,差异无显著性。
- No reference value中Rank3相比Rank1风险投资分布右移,但均值差异不显著。
- Panel (b) 比较相同排名下不同endowment(TreatmentLO vs TreatmentHI)个体风险投资:
- Reference value中,TreatmentLO(低于预期收益)明显高于TreatmentHI风险投资,差异显著。
- No reference value中,差异无显著。
- 该图支持预期收益传递引入参照点效应,影响参与者风险投资行为。[page::16]
表1(风险投资份额汇总统计,page 17)
- Panel A (Reference value,按endowment分组):低于预期收益组(TreatmentLO)平均风险投资达62%,高于预期收益组仅38%,两者存在显著差异。
- Panel B (Reference value,按rank分组):TreatmentLO中风险投资随着排名下降显著增加(Rank1:42%,Rank3:67%),TreatmentHI中变化幅度较小。
- Panel C、D(No reference value对应Panel A、B):未发现endowment对风险投资份额的显著影响,但发现排名效应较为显著,但幅度小于Reference value。
- 总体结果表现出预期收益告知强化了参照点效应,并使排名效应相对减弱。[page::17]
表2(回归分析:Reference value vs No reference value,page 18-19)
- 采用OLS回归控件变量后发现:
- 在全样本回归中,TreatmentLO(低于预期收益)变量正向、显著影响风险投资份额,增幅约8.65pp。
- 交互项表明,TreatmentLO效应仅在Reference value条件下显著(增幅 ~11.2pp),No reference value条件无显著效应。
- 控制排名变量后:
- 在Reference value中,排名2、排名3与排名1相比均显著正向影响风险投资,且TreatmentLO与排名交互项显示TreatmentLO组低排名者风险投资显著提升。
- 在No reference value中,排名影响较弱且TreatmentLO无显著影响。
- 结果表明传递的平均预期收益作为参照点在风险选择中起关键作用,混淆了排名效应。[page::18-21]
表4(变量均衡性检验,page 25-26)
- 对照Reference value与No reference value组,基本上随机分配均衡,唯一性别略有差异(Reference value男性比例更高)。
- 统计知识、投资经验等少数变量有微弱差异,后续分析中有控制。
- 综上,样本选择偏差可能性较低。[page::25-26]
图6 & 图7(非社交实验的RDD分析,page 27, 29)
- 图6展示不同断点下的RDD斜率差异,Reference value组在\$5附近最明显,表明\$5作为参照点区分风险偏好行为。
- 图7实地展示风险投资份额随内生变量endowment的变化:
- Reference value下,endowment低于\$5时风险投资显著随endowment下降而增加(负相关),超过\$5则基本平稳(无显著变化)。
- No reference value中断点为\$6.1,但风险投资呈缓慢下降趋势,未表现参照点效应模式。
- 该RDD证实参照点效应符合前景理论关于损失域风险偏好的预期,排除了社会比较的影响。[page::27,29]
表5(替代理性风险偏好测量,page 28)
- 使用Dohmen等2011的自评风险偏好替代Gneezy和Potters的实验风险投资结果,验证风险偏好测量稳健性。
- 结果显示TreatmentLO组(低于预期收益)在替代测量下依然表现出显著更高的风险偏好。
- 进一步减小了风险偏好测量误差或任务理解偏差的担忧。[page::28]
---
4. 估值分析
本研究非传统财务估值报告,而是实验经济学实证研究,无需现金流折现(DCF)等估值模型。
实验设计的“估值”部分主要体现在参照点的确立、排名及预期收益的设定,及通过设计内生变量(Endowment、Rank)的操控,实现变量对风险偏好投资份额的因果推断。研究设计严密,主要通过回归分析及RDD手段挖掘因果效应。
---
5. 风险因素评估
- 实验环境风险: 线上众包平台信息高度公开与共享,参与者容易接触或推断平均预期收益,导致参照点信息非随机。
- 自选样本风险: No reference value组可能吸引风险偏好不同的参与者,作者通过控制变量及风险问卷检测未发现显著差异,缓解了该担忧。
- 问卷理解风险: 通过替代风险测量和注意力测试控制,确保实验任务被理解。
- 实验需求偏差(experimenter demand effects)风险: 通过匿名问卷调查参与者对研究目的的认知,找到少数知晓研究假设者,排除大虚假影响。
- 信息泄漏风险: 虽No reference value小心设计新账户以回避信息泄漏,但仍不可完全排除旧信息或社交信息的影响。
---
6. 批判性视角与细微差别
- 本文指出在线众包平台对预期收益的强制告知会带来干扰,但未讨论完全隐瞒预期收益对参与者招募效率及代表性的潜在损失。
- 实验设计虽控制了社交比较和参照点的交互,但对排名的心理机制(是否完全为社会比较)未作新机制探索。
- 部分No reference value群体依然存在对预期收益的猜测,该部分可能体现实际环境中“不确定参照点”的混淆,未来需深化此类不确定条件的研究。
- 对参照点界定为平均预期收益的直接证明主要间接推断,实际心理过程可能更复杂。
- Causal识别依赖于实验随机,可在后续通过多平台多样化样本验证普适性。
---
7. 结论性综合
本研究深刻揭示了当前在在线众包平台上进行风险偏好实验时,由于平台规范要求必须向参与者显性传达“平均预期收益”,导致该数值被内化为决策参照点,从而在实验中形成了参照点效应,显著地改变了风险偏好行为。经严谨的实验设计,作者成功将因参照点效应而产生的风险选择变化与传统文献中社会排名引起的风险偏好变化区分开。
主要发现包括:
- 参照点效应强于排名效应。 在控制排名时,参照点以下的参与者风险投资份额平均多出18.23个百分点;而在保持参照点距离一致时,排名对风险投资无显著影响。
- 预期收益信息的传达是关键。 Reference value条件(明确告知)下发现显著差异,No reference value条件无此效应。
- 参照点效应符合前景理论。 损失域(参照点以下)风险偏好增强;而收益域(参照点以上)则无明显升高,风险投资呈平稳趋势。
- 非社交实验支持参照点效应。 即使在没有社会比较的情况下,预期收益作为参照点的影响依然存在,说明其为稳健的心理机制。
- 风险偏好测量多样稳健。 实验中既用实际激励投资任务,也借助自评问卷测量风险偏好,均获得一致结论。
- 现实应用提醒。 研究提示在线实验设计者及平台方应警惕告知平均预期收益可能对实验结果产生的实质性影响。建议认真权衡告知预期收益的必要性,或在实验设计中主动控制和校正参照点效应。
本报告中涉及的所有关键图表包括:
- Turkerview.com呈现的任务评价及薪酬信息(图2,3)。
- 实验设计结构示意(图4)。
- 风险投资份额分布比较(图5)。
- 风险投资汇总统计表(表1)。
- 多元回归结果(表2、3)。
- 变量均衡性检验(表4)。
- 非社交任务的回归不连续设计结果(图6、7)。
- 替代风险测量回归结果(表5)。
以上图表均清晰呈现了传递预期收益对风险偏好产生的实证影响,并支持了作者提出的核心论点。
---
综上所述,作者通过严谨且创新性的实验方法揭示了在线众包平台告知平均预期收益所引发的心理参照点效应,指出了此前排名风险偏好研究中可能忽视的混淆因素,为未来实证研究设计提供了重要的理论与方法论指导。[page::0,1,2,3,5,6,9,10,12,13,14,15,16,18,19,20,21,23,24,25,26,27,28,29,30,31]
---
附:关键图表Markdown格式示例
- 图2:

- 图4:

- 图5:


- 图6:

- 图7:

---
以上为本报告的详尽分析。