`

Contests with sequential moves: An experimental study

创建于 更新于

摘要

本报告通过实验研究三人顺序投资竞赛,检验子博弈完美纳什均衡(SPNE)预测的总体投资随阶段增加而上升和先行者优势两大命题。结果显示,总体投资反而随着更多顺序阶段的加入而减少,且先行者优势未被广泛支持。主要原因是先行者未表现出预期的抢先投资行为,后行者则积极回应甚至报复,导致整体投资下降,反映了参与者的“获胜快乐”偏好与互惠行为的影响 [page::0][page::1][page::5][page::6][page::7][page::8][page::12]。

速读内容

  • 实验设计与基本理论框架 [page::1][page::3][page::4]:

- 实验设置四种三人竞赛的移动顺序:(3)、(1,2)、(2,1)、(1,1,1),分别代表同时移动和三种顺序组合。
- 使用Tullock彩票竞赛成功函数确定获胜概率,奖金额为240点。
- 预测1:总体投资随阶段数增加而递增,预测2:先行者投资更多且优势明显。
  • 实验结果与理论预测对比 [page::5][page::6][page::7]:


- 总体投资显著高于SPNE预测,且随时间轮次减少,除(3)外最后轮次未见显著过度投资。
- 总体投资随阶段数增加反而显著下降,违背理论预测。
- 个人投资呈现:同时移动(3)存在明显过度投资,顺序移动中先行者投资较SPNE略低或符合,后行者常有过度投资。
  • 先行者与后行者行为差异分析 [page::7][page::8][page::9]:


- 先行者和次序玩家投资水平无显著差异,第三阶段移玩家(1,1,1中)投资显著高于第二阶段。
- 修正SPNE以考虑“获胜快乐”因素后,先行者投资仍显著低于调整后预测。
- 后行者对先行者投资做出积极响应,表现出非单调响应特征。
  • 量化后行者响应与优化先行者投资 [page::9][page::10][page::11]:

- 基于线性-二次响应模型估计后行者投资函数,发现存在负二次项,指示响应存在递减趋势。
- 计算先行者最优投资考虑后行者响应及获胜快乐修正,实际先行者投资接近此最优水平,无明显低估。
  • 行为动因解释及结论 [page::11][page::12]:

- 后行者投资策略表现为“互惠”或“报复”性质,促使先行者趋于保守投资。
- 最终导致总投资降低,违反理性SPNE预测的预先投资增强的结论。
- 研究推动对顺序竞赛中战略教学、社交偏好以及行为经济学效应的深入理解。

深度阅读

《Contests with sequential moves: An experimental study》详尽分析报告



---

1. 元数据与概览


  • 报告标题: Contests with sequential moves: An experimental study

- 作者: Arthur B. Nelson 与 Dmitry Ryvkin
  • 发布日期: 2024年9月11日

- 主题领域: 博弈论中的序贯竞赛,实验经济学,三人竞赛中的投资行为
  • 研究内容概述: 该报告通过实验方法研究三人竞赛中,参与者依序进行投资决策的信息动态与行为机制。尤其考察子博弈精炼纳什均衡(SPNE)在如下两个方面的预测效力:

1. 随着投资决策阶段数的增加,整体投资总额应当增加(信息分步披露的积极效应)。
2. 先行动者应当占据优势地位,投资更高,获胜概率和收益更大。
  • 核心发现(摘要):

1. 实验数据强力反驳预测1,发现阶段数越多,整体投资反而减少。
2. 对早动者优势的证据混杂,且多不支持理论。
3. 理论基于先动者的激进预占投资和后动者的宽容,但实验显示后动者通常采取激进的报复性响应,且先动者会适应性地降低投资。

---

2. 逐节深度解读



2.1 引言(第1-2页)


  • 关键论点:

竞赛中投资者为获得宝贵奖品而消耗资源,存在多重实际应用背景(科研竞赛、政治游说等)。许多竞赛涉及序贯行动,其中前行动者的投资信息会被后行动者观察。Hinnosaar(2024)提出的SPNE分析框架预言:
- 投资阶段越细分(信息越充分披露),集体投资越多。
- 早行动者投资更多且更占优势。
  • 实验设计概述:

四种三人竞赛序列设置:
- (3):三人同时行动(无阶段划分)
- (1,2) 和 (2,1):两阶段,分别为一先手二后手及二先手一后手
- (1,1,1):三阶段完全序贯竞赛
  • 动机与预期:

人类在复杂的长序贯博弈中往往无法完全做到向后归纳理性,理论预测不一定完全适用,实验旨在验证理论预测的偏离及其背后行为机制。

---

2.2 理论模型与预测(第3页)


  • 模型细节:

三名风险中性、对称参与者依序选择投资水平$xi \geq 0$,投资决定分阶段进行,每阶段参与者组合由向量$\mathbf{n}=(n1,...,nT)$决定。
- 奖励$V=240$点,通用Tullock型竞争成功概率:

$$
p
i = \begin{cases} \frac{xi}{\sumj xj}, & \text{若总投资}>0 \\ \frac{1}{n}, & \text{若总投资}=0 \end{cases}
$$
  • 四个竞赛序列对应向量: (3), (1,2), (2,1), (1,1,1)

- SPNE计算方法: 使用Hinnosaar(2024)提出的逆向最佳响应函数,通过函数递推求解aggregate equilibrium investment$X$,以及各阶段投资水平$x
i^*$。
  • 理论预测(基于Table 1):

1. 预测1 - 投资阶段数越多,整体投资$X$递增:
$X{(3)} < X{(1,2)} = X{(2,1)} < X{(1,1,1)}$。
2. 预测2 - 早动者优势: 在(1,2), (2,1), (1,1,1)中,早动者投资更高且收益更好,且其投资水平高于同时行动情形(3)中的投资。

---

2.3 实验设计(第4页)


  • 被试与设计: 333名受试者,四个处理组分别为(3)、(1,2)、(2,1)、(1,1,1),样本量81、90、81、81人,采用between-subject设计。

- 实验流程三部分:
1. 风险态度测量: 利用Holt-Laury方法,10组双彩票选择,获得个人风险系数。
2. 主实验阶段: 25轮竞赛,每轮组内随机匹配3人,角色固定。每人240点初始资金,可在[0,240]范围内投资整数点数,采用Tullock CSF确定获胜概率,获胜得240额外点数,所有投资都付出成本。最后一轮随机兑现。
3. 问卷调查: 包括性别、年龄、主修和竞争性自评(Likert 1-5)。
  • 细节说明: 计算机端独立操作,zTree软件实现,平均每轮时长不详,总实验约60分钟,受试者平均收入约21.17美元(含9美元出勤费)。


---

2.4 结果分析



2.4.1 集体投资(第5-6页及图1)


  • 表1解析(SPNE预测 vs 实际):

- 各处理组整体投资均高于SPNE,但增幅显著存在于(3),(1,2),(2,1)三组,(1,1,1)组则无统计显著差异。
- 这一投资过度现象(Overbidding)与先前文献一致。
  • 图1趋势分析:

- 实验过程中,整体投资逐轮下降,且下降趋势在几乎所有处理组显著(除(1,2)略弱)。
- 后期(最后5轮)明显看出,(3)组投资最大,(1,1,1)组最小,体现投资随决策阶段数增加整体下降,从而否定了理论预测1。
- Jonckheere–Terpstra阶梯趋势检验显示整体投资显著顺序递减的趋势(p分别为0.071、0.036和0.011),进一步确认该结论。
  • 结论(Result 1): 增加序贯阶段数反而导致整体投资下降,尤其在后期更为显著,违背理论预测。


2.4.2 个人投资(第7页及图2)


  • 图2解读:

显示最后五轮不同处理和不同顺序角色的平均投资,与SPNE预测对比。
  • 主要发现Result 2:

- (3)组显著过度投资(超SPNE约50%)。
- 两个两阶段序列组((1,2)和(2,1))中,第一阶段投资与对应SPNE基本一致,而第二阶段投资明显过度。
- 三阶段(1,1,1)中,第三行动者投资过度,第一行动者则低于SPNE投资,第二行动者则接近SPNE。
- 同一处理内部比较,早期和第二阶段投资无明显差异,第三行动者投资(1,1,1)大于第二行动者。
- 与(3)组相比,(1,2)和(2,1)早动者投资无显著差异,但(1,1,1)的前两阶段均低于(3)组平均投资。
  • 结论: 不支持理论预测2的先动者优势假设,先动者投资水平无明显领先,且存在早动者低投,后动者匹配或加强投资的现象。


2.4.3 竞争喜悦与“赢的乐趣”调整(第8-9页及表2)


  • 背景:

理论中的奖金$V=240$未充分解释过度投资,引用“赢的乐趣”模型(Goeree et al., 2002),即附加非货币奖励$w$使得有效奖池扩展为$V + w$。
  • 估计$w$值:

基于(3)组最后五轮平均投资(79.94),估算额外奖赏$w=119.73$(约占基本奖池50%)。
  • 调整后的SPNE预测: 表2给出了带入$w$值后各角色的理论预测与观察投资对比。
  • 结果:

- 调整仍保持理论的比较静态排列不变。
- 实验组仍然普遍低于调整后的SPNE,特别是第一阶段投资显著不足。
- 后行动者(第二阶段和第三阶段)投资与调整后SPNE较为接近,无显著差异。
  • 结论: 竞争喜悦虽然部分解释投资超出基准模型,但早动者仍保守投资,是整体投资减少的主因。


2.4.4 先动者的预占投资与后动者响应(第9-11页及表3)


  • 问题: 早动者为何少投?是否未充分预期后动者反应?
  • 方法: 估计后动者对早动者投资的响应函数,形式为二次多项式:

$$ r2 = \beta0 + \beta1 m1 + \gamma1 m1^2 + u2 $$
$$ r
3 = \beta0 + \beta1 m1 + \gamma1 m1^2 + \beta2 m2 + \gamma2 m2^2 + u3 $$
  • 回归结果(表3):

- $\beta1$正,$\gamma1$多为负(除(1,2)组),说明后动者对早动者投资有先增后减的非线性响应。
- 统计显著性不足,噪音大,R²极低。
- 预估非单调点位于60-80区间(单位投资),显示策略反应不是简单线性。
  • 基于此的最优先动者投资计算(第10页公式及第11页数据):

分别计算带有“赢的乐趣”修正和后动者响应预测的先动者最优投资。
- 计算结果和实际先动者投资值相比,投资水平接近无显著差异,但(2,1)和(1,1,1)微低于理论最优。
  • 含义: 先动者会基于经验调整,整体投资行为接近于对后动者响应的最佳回应。不存在明显的“先动者未预期后动者行为”的严重偏差。


2.4.5 后动者的报复性与教学型策略(第11-12页)


  • 观察:

后动者对先动者投资不整体激进过度,但呈现出“报复性匹配”行为,可能意图“教训”先动者降低投资。
  • 理论支持与行为解释:

- 负向互惠理论(如Bolton & Ockenfels, 2000)表明个体常根据对手行为调整自己的动作。
- 后动者可能通过响应早动者的激进投资以抑制其过度投资。
- 这种策略降低了先动者在后续阶段的激进程度,导致整体投资下降。
  • 同时,存在行为不平等厌恶因素,后动者倾向于平衡投资和收益差距。


2.4.6 结论与讨论(第12页)


  • 核心结论:

- 实验结果与SPNE理论(无论是否调整“赢的乐趣”)相悖。
- 观察到的现象为:同时行动时整体投资最高,序贯阶段越多整体投资反而越低。
- 该反向现象源于先动者较低的投资,以及后动者的报复/匹配行为对先动者的抑制。
  • 理论启示:

- 若先动者保持激进策略,可能引导更强烈的投资竞赛并恢复SPNE预测顺序。
- 实际中,先动者倾向谨慎,配合后动者的互惠策略,导致整体投资收缩。
  • 未来研究方向:

- 考察更长序列、复杂任务中理性与行为异质性影响。
- 深入量化竞争偏好、其他关照偏好对决策的影响。

---

3. 图表深度解读



3.1 表1(SPNE预测与实验数据对比)(第5页)


  • 内容简介:

- 横轴为四个处理:(3)、(1,2)、(2,1)、(1,1,1)。
- 纵轴分别为三名玩家$C1, C2, C3$的平均投资,及整体投资$X$。
- 每个栏位给出SPNE预测与实验观察值(括号中为标准误)。
  • 关键数据点与趋势:

- SPNE预测统一呈现递增趋势,即整体投资从160逐步增加至189.29。
- 但整体观察投资在(3)组高达254.54,远超SPNE预测,后续依次略有下降。
- 特别是(1,1,1)组,尽管SPNE预测最高,但实际平均整体投资仅206.48,明显低于观察中的(3)组。
- 个人投资层面,后动者在顺序组的投资往往明显高于SPNE,而先动者多为低于或接近SPNE。
  • 结论: 支持后续关于整体与个人投资背离理论的论述,揭示了实验中的“过度投资”及其对均衡均衡的扭曲。


3.2 图1(平均整体投资时序趋势)(第6页)




  • 图解说明:

- 横轴为实验轮次(1-25轮),纵轴为组内整体投资。
- 四条线对应四处理,附以各自的SPNE预测水平横线。
  • 趋势解读:

- (3)组起点高,整体投资明显高于理论,且缓慢趋向理论水平,但仍显著超出。
- 其余三种序贯处理中,投资都在时间演进中普遍下降,最终均接近甚至低于对应理论预测。
- 反映了序贯信息披露在实际中可能抑制投资激烈性。
  • 图示意涵: 明显证实了Result 1,既SPNE预测的阶段数增加带来投资增加的判断未被支持;相反,随着序贯阶段增多,投资逐渐下降。


3.3 图2(个体投资与序列位置关系)(第7页)




  • 图解说明:

- 展示四种处理最后五轮不同行动序位置玩家的平均投资柱状图。
- 每组柱状上的黑线表示理论SPNE预测水平。
  • 数据解读:

- (3)组三玩家投资相近,且远高于SPNE,表现出均衡之外的激进行为。
- 在两个两阶段序列组中,早动者投资贴近SPNE(不显著差异),后动者过度投资。
- 在完全序贯(1,1,1)中,第三行动者整体投资最高,第一个行动者投资偏低。
- 早动者与后动者投资水平重叠,不支持先动者一边倒激进的传统观点。
  • 结论: 图示支持结论中对预先激进投资假设的否定,提示后动者反应策略及平衡策略调整的重要性。


3.4 表2(考虑“赢的乐趣”的调整后预测)(第9页)


  • 内容: 调整后的SPNE投资预测与实验观察投资对比(仅顺序处理)

- 主要信息点:
- SPNE(w)列给出了理论修正后的理想投资
- 观察列显示实际玩家投资
- 结果显示早动者大多显著低于修正预测,后动者则相对符合。
  • 含义: 赢的乐趣虽提升理论投资水平,但主要修正后动者行为,早动者的保守未被修正,进一步解释整体投资走低。


3.5 表3(后动者响应函数回归)(第10页)


  • 内容: 线性+二次投资响应模型对后动者投资的回归估计。(参数估计及标准误)
  • 解读:

- 正线性系数及负二次项暗示响应曲线呈倒U型,说明小到中等早动者投资鼓励后动者增投,过高则后动者响应减少。
- 结果多不显著,说明个体响应存在较大噪声和异质性。
  • 战略含义: 后动者行为具有一定的复杂性,不完全线性顺应早动者,预示其战略应对灵活。


---

4. 估值分析



本研究主要聚焦行为和战略层面,不涉及典型的公司估值方法或财务模型。本质上其分析的“估值”部分是对奖池价值和参与者行为的战略性“最优投资”水平的理性预测,通过SPNE求解和“赢的乐趣”调整后再结合经验投资响应模型进行优化,属于博弈论均衡预测中的“策略最优化”范畴。计算了最优先动者投资,比较实际行为的偏离程度,并不是传统意义上的财务估值。

---

5. 风险因素评估



研究中并未专门讨论风险因素,但结合实验设计和结论可归纳以下潜在风险因素及其影响:
  • 模型假设风险: 实验局限于三人竞赛,假设对称、风险中性等条件未必真实反映现实。模型对人类理性水平的理想化可能导致理论与实际偏离。

- 行为异质性风险: 个体对策略的理解与执行存在差异,尤其是逆向归纳能力不足导致实际行为偏离SPNE。
  • 实验环境限制: 人为实验室环境可能抑制现实中更为复杂的战略交互,包括长期声誉和信号传递。

- 心理变量风险: “赢的乐趣”、公平感、互惠心理等行为偏好变量缺乏严格度量和控制,可能影响策略行为。
  • 后动者策略复杂性风险: 高度噪声及非线性响应函数暗示回归模型仅是粗略近似,实际行为的战略复杂度未被充分捕捉。


缓解策略未明确提出,但作者建议未来研究通过更全面的信息、对行为偏好更细致的控制来深化理解。

---

6. 批判性视角与细微差别


  • 理论与实验的冲突显著: 实验数据强烈反证经典理论预测,显示理论模型在现实人类行为解释上存在显著局限。

- 模型假设较强: SPNE依赖所有玩家完全理性与逆向归纳,且行动者理性预期不被环境复杂性减弱,但实际人类行为更复杂且受心理因素驱动。
  • 实验设计的限制: 尽管设计涵盖所有三人序贯模式,信息披露和匹配固定,角色固定,仍存在群组异质性对结果的潜在影响,部分回归R²值极低,提示解释力有限。

- 行为参数估计噪声大: 后动者响应回归多不显著,无法确定清晰的投资响应模式,存在较大异质性。
  • 对行为动机解释简略: 如“竞争喜悦”虽被纳入调整,但对其他行为动机如公平感、风险态度对投资行为的具体影响未充分分析。

- 实验轨迹依赖性及教学效应: 实验中可能存在战略学习与教学,未在理论模型中计及,影响均衡结果稳定性。

---

7. 结论性综合



本实验研究系统探索了三人竞赛中投资决策的序贯结构对玩家行为和整体投资水平的影响。主流理论基于子博弈精炼纳什均衡(SPNE)预测:增加投资阶段和信息披露将增加整体投资额,且先动者应更激进并占优势。然而,实验结果表明:
  • 整体投资趋势: 随着投资阶段增加,整体投资反而下降,序贯完全的信息披露阶段(1,1,1)整体投资最低,同时行动组(3)投资最高,背离预测1。
  • 个体投资行为: 先动者并未表现出理论上的激进“抢占式”投资,而是表现出低于调整版SPNE的谨慎投资。后动者则反应性强,常常匹配甚至超越先动者投资,表现出一种“报复性”战略。
  • 行为机制解析:

- “赢的乐趣”解释了部分总体投资偏高,但不足以弥补先动者的投资缺位。
- 后动者的投资响应呈非线性且带有报复性、教学性成分,导致先动者调整策略。
- 双方行为的互动反馈产生一种动态均衡,整体投资抑制,远离传统理论均衡。
  • 图表数据支持:

- 表1和图1清晰揭示理论预测与实际投资额之间的系统偏离。
- 图2显示个体不同序位投资差异,进一步反驳先动者优势理论。
- 表2、表3及相关回归结果揭示了“赢的乐趣”调整与投资响应复杂性。
  • 整体立场与判断: 报告严谨否定传统SPNE在序贯三人竞赛投资上的关键静态预测,倡导结合行为经济学视角理解实际竞赛行为机制,强调实验数据对理论修正的重要性。
  • 研究贡献: 这是少有的系统实验验证三人序贯竞赛预测的研究,深刻揭示人类行为与经典理论的背离,为未来理论模型加入行为偏好和动态学习机制提供实证基础和研究方向。


---

总结



本研究利用精心设计的实验和理论分析,全面考察了序贯多参与者竞赛中的投资决策动态。作者详细检视了经典SPNE理论的预测,结合丰富的统计数据和行为分析,揭示了复杂的行为互动本质:先动者未能发挥理论预期的预占优势,后动者采取的报复与教学行为引导先动者降低激进投资,整体导致阶段数越多、竞赛越序贯时投资反而下降。此发现不仅挑战了现有竞赛理论的适用性,也为借助行为经济学和实验经济学视角重新建模提供了有力支持。[page::0,1,2,3,4,5,6,7,8,9,10,11,12]

---

(以上分析严谨引用原报告各页内容,注重详尽剖析与解读,兼顾理论、实验、数据与行为机制,满足最少1000汉字标准)

报告