`

Efficient Portfolio Selection through Preference Aggregation with Quicksort and the Bradley–Terry Model

创建于 更新于

摘要

本报告针对有限资源配置下不确定项目选择问题,提出结合快速排序算法和Bradley-Terry模型的项目偏好聚合方法。通过建立基于成对比较的胜率概率矩阵,利用Newman迭代优化项目排名,并辅以采样策略大幅减少比较次数,从而提高组合选择效率和准确性。数值模拟表明,所提方法在知识广度较大时显著优于传统的算术平均和Borda计数方法,为多主体决策与参与式预算提供有效的量化工具 [page::0][page::3][page::6][page::9][page::12]。

速读内容

  • 研究背景与问题定义 [page::0][page::1][page::3]

- 资源有限时,需基于不确定的长期收益对大量项目进行优选。
- 多代理的主观评估存在噪声和多样性,传统排序算法难以直接适用。
- 使用快速排序和Bradley–Terry模型结合成对比较胜率,请求结果与真实排名的概率关联。
  • Bradley–Terry模型核心机制 [page::2][page::3][page::6]

- 模型通过“强度参数”表示每个项目的相对优势,胜率定义为两个项目强度比值的函数。
- 参数通过最大似然估计求解,Newman迭代算法显著加速收敛。
- 模型允许形成实数值的胜率概率矩阵,可用于构建排名。
  • 项目评估建模与胜率计算 [page::3][page::4]

- 项目类型与代理专业能力分布定义专家知识广度$\beta$。
- 评估误差服从均值为零、方差与专业匹配度相关的正态分布。
- 胜率由代理主观估计差除以联合标准差的正态累积分布函数计算,

\[
w{ij}^\ell = \Phi\left(\frac{\nu{i\ell} - \nu{j\ell}}{\sqrt{\sigma{i\ell}^2 + \sigma_{j\ell}^2}}\right)
\]
  • 六种聚合方法比较及其性质 [page::5][page::6]

- (a) 算术平均:直接求代理估值均值,易受异常值影响。
- (b) Borda计数:基于排序分数,鲁棒异常值但无强度区分。
- (c) 快速排序:利用平均胜率构建排序,计算复杂度$O(n\log n)$。
- (d) Bradley–Terry:用Newman迭代处理完整胜率矩阵,复杂度$O(n^2)$。
- (e) Two-Phase Bradley–Terry:采样子图$O(n)$次比较后二次迭代优化。
- (f) Two-Phase Quicksort:快速排序初排后基于采样子图用Newman迭代细化。
  • 采样策略与循环图采样 [page::7][page::8]

- 通过只对循环子图中的相邻项目进行比较,有效降低比较次数至$O(n)$。
- 两阶段方法使用此采样策略先构建初步排序再细化,兼顾性能与成本。
- 通过示例展示不同比较组合影响排序结果。
  • 数值模拟结果 [page::9][page::10][page::11]


- 在知识广度$\beta$范围内,快速排序及Bradley–Terry基方法性能优于算术均值和Borda计数。
- Two-Phase Quicksort表现最佳,能在较少比较次数下维持高性能。

- 离散化的胜率集合轻微影响性能排序,依旧保持一致的方法优先级。

- 比较次数统计显示Two-Phase Bradley–Terry和Two-Phase Quicksort大幅减少计算量,适合实际应用。
  • 量化策略特色和实用意义 [page::6][page::7][page::8][page::11][page::12]

- 建立成对比较胜率的概率评估模型减弱单点异常影响,体现个体偏好强弱。
- Newman迭代结合采样方法,实现快速、稳定的项目强度估计。
- Two-Phase策略在有限比较下兼具准确性与效率,具推广潜力,适合参与式预算等场景。
- 提出未来研究方向:引入委托机制、非均匀项目成本、多分布类型及社交网络影响。

深度阅读

报告详尽分析报告



---

1. 元数据与概览(引言与报告概览)


  • 报告标题:Efficient Portfolio Selection through Preference Aggregation with Quicksort and the Bradley–Terry Model

- 作者:Yurun Ge、Lucas Böttcher、Tom Chou、Maria R. D’Orsogna
  • 所属机构

- 加州州立大学北岭数学系(a)
- 加州大学洛杉矶分校计算医学系(b)、数学系(e)
- 法兰克福金融管理学院计算科学与哲学系(c)
- 佛罗里达大学系统医学实验室(d)
  • 发布日期:未明确指出具体日期,但引用资料更新至2024年。

- 研究主题:多代理环境下不确定性项目组合选择问题,提出基于排序算法(Quicksort)和Bradley–Terry统计模型的决策偏好聚合方法,以高效选择具有最大长期预期收益的项目。
  • 核心论点及目的

- 项目组合选择面临的挑战主要在于如何处理评估项目长期价值时的多代理异质、不确定信息。
- 通过构建基于成对比较的偏好聚合框架,利用Bradley–Terry模型连接“胜率”概率与排名,从而克服传统排序方法在不确定性环境下的不足,尤其减少参与评价的认知负荷,提升选择效率。
- 所提算法不仅在理论上优于现有主流聚合方法,且支持结合采样降低成对比较次数,具备实用推广价值。
  • 主要贡献:提出数种结合Quicksort和Bradley–Terry模型的偏好聚合策略,比传统算术均值和Borda计数等方法表现更优;介绍如何用采样减少计算量;实证验证方法优越性并讨论实际应用展望。[page::0,1]


---

2. 逐节深度解读



2.1. 引言(第1节)


  • 讨论资源有限情况下如何从众多具长远价值不确定的项目中选取最优组合。

- 多代理评估时存在高估计差异,致使传统直接评估或排序认知成本巨大。
  • 提出成对比较作为替代,可有效缓解认知负担且更适合实务应用。

- 针对现有少有成对比较偏好聚合研究的空白,作者致力于采用Bradley–Terry模型结合Quicksort实现有效排序与组合选择。[page::0]

2.2. 文献综述(第2节)


  • Bradley–Terry模型

- 是一种基于成对比较数据估计各项“强度”参数的统计模型,概率形式为一个项目i赢过j的概率为 \(\pii/(\pii+\pij)\)。
- 模型自1929年Zermelo提出,1952年Bradley和Terry详细推广之后广泛应用于体育排名、社会选择、机器学习、人机交互等领域。
- 近年来,算法不断优化(如Newman迭代),扩展到处理平局、多方比较等问题。
  • 群体决策与组合选择

- 多种传统聚合方法(均值、投票、专家代表等)讨论其合理性及局限。
- 特别介绍基于代理专业度与项目类型差异产生估值不确定性的组合选择模型。
  • 排序算法的适应性问题

- 标准排序假设数据准确,难以适用于多源噪声的真实评估环境。
- 现有处理“脏数据”的排序策略及复杂度界下界的研究也被提及。
  • 作者基于上述背景引出了结合Bradley–Terry模型求解排序及组合选择问题的重要性。[page::1,2]


2.3. Bradley–Terry模型数学细解(第3节)


  • 定义并详细推导了Bradley–Terry模型的强度参数 \(\pii\) ,胜率概率 \(\pii/(\pii + \pij)\)。

- 通过最大似然估计获得参数解,存在唯一解的理论保证。
  • 描述Zermelo迭代公式以及后续Newman提出的收敛更优迭代方案,加速求解强度参数。

- 说明算法存在数值边界情况,如没人输或没人赢导致参数发散。
  • 提出基于迭代法计算胜率的核心数学原理和算法细节,为后续聚合排序奠定理论基础。[page::2,3]


2.4. 组合选择模型构建(第4节)


  • 扩展先前组合选择框架,每个项目有类型 \(ti\) 和真实价值 \(\nui\),代理有专业度 \(e\ell\)。

- 代理评估受到专家度与项目类型差异的影响,噪声服从均值0、方差为两者差绝对值的正态分布,噪声独立同分布。
  • 定义代理对项目的感知值 \(\nu{i\ell}\),噪声 \(\eta{i\ell} = \nu{i\ell} - \nui\)。

- 构造基于噪声项推导成对比较胜率概率公式:
\[
w{ij}^\ell = \Phi\left(\frac{\nu{i\ell} - \nu{j\ell}}{\sqrt{\sigma{i\ell}^2 + \sigma{j\ell}^2}}\right)
\]
其中 \(\Phi\) 为标准正态分布的累计分布函数。
  • 引入知识广度参数 \(\beta\) 控制代理专业度多样性。

- 固定选择项目数量 \(n^ < n\),最终目标为最大化选中项目的期望值。
  • 以表格形式总结模型参数含义,清晰规范为后续计算做准备。[page::3,4]


2.5. 聚合方法设计(第5节)


  • 介绍四类核心聚合方法与两阶段采样改进策略。

- a) 算术均值 将代理感知值直接平均求聚合值,选取前 \(n^
\) 项。
  • b) Borda计数 代理根据感知值排序,给出倒数排名积分,积分最高者入选。相较算术均值,Borda计数更鲁棒于离群评估。

- c) Quicksort算法改造:基于聚合后的胜率矩阵 \(W'\),以概率大于0.5判定优势关系,执行经典快速排序,得到增序排列,选取最后 \(n^\) 个项目。复杂度 \(O(n \log n)\) 。
  • d) Bradley–Terry迭代法

- 每代理给出全对成对胜率矩阵 \(W^\ell\),通过算术均值聚合为 \(W'\)。
- 利用Newman迭代计算强度参数向量 \(\pi\)。
- 按强度降序选择 \(n^
\) 项。
  • 论述胜率聚合较均值和Borda的优势:

- 对离群点有天然缓冲效果。
- 捕捉偏好强度,区别表现相近的排名。
  • e) 两阶段Bradley–Terry方法(采样方案):

- 初阶段随机生成项目序列,基于循环图采样计算部分胜率,完成Newman迭代获得初步排序。
- 次阶段用此排序更新采样及迭代,实现排序精调,未采样对置为0。
  • f) 两阶段Quicksort方法

- 初阶段用Quicksort生成粗排序,只采样必要节点,复杂度为 \(O(n\log n)\)。
- 次阶段基于循环图采样计算胜率矩阵,结合Newman迭代精调。
  • 详细算法流程(Algorithm 1)描述Quicksort改造核心步骤及胜率判断方法。

- 强调采样可大幅降低比较负担,同时维持较好效果。[page::5,6,7]

2.6. 采样策略与实例说明(第5.3节及图例第7页)


  • 给出具体代理评价三项目的小规模演示(图1),展示不同采样策略导致不同排名结果。

- 介绍循环图采样法:将项目列表视作循环图,仅比较连续邻接项目成对胜率,减少从 \(O(n^2)\) 到 \(O(n)\) 的比较次数。
  • 应用两阶段算法分别利用随机排序及Quicksort算法初始近似,后续基于循环图采样精调排名。

- 这种采样策略兼顾效率和准确度,尤其适合规模较大或有限资源的场景。[page::7,8]

---

3. 图表深度解读



3.1. 图1(第7页)


  • 描述:展示单一代理对三个项目 \(p1,p2,p3\) 的成对比较图。每个顶点表示项目,每条带箭头的边是成对比较对应的胜率。附带项目感知值 \(\nu{i1}\) 与标准差 \( \sigma{i1} \),具体如 \(p1\) 取1,标准差3;\(p3\) 取4,标准差3;胜率如\(w{13}^1=0.2397\)。

- 解读
- 胜率表明代理更倾向于 \(p
3 \succ p2 \succ p1\)。
- 不同比较顺序带来的胜率差异解释了不同排名结果的多样性。
  • 联系文本:此图展示了采样不同组合对排序影响的直观例证,支持循环图采样的合理性和必要性。[page::7]


3.2. 图2(第9页)


  • 描述:30个项目,3个代理,选15个项目。纵轴性能指标 \(E(\beta;N,n,n^*)\),横轴代理专业度广度 \(\beta\)。曲线展示6种聚合方法(算术均值、Borda、Quicksort、两阶段Quicksort、Bradley–Terry、两阶段Bradley–Terry)的性能随知识广度变化趋势。

- 解读数据与趋势
- 随 \(\beta\) 增大(代理专业度差异放大),整体性能轻微下降,反映噪声与不确定增加。
- Quicksort及其两阶段版本、Bradley–Terry方法整体优于均值和Borda计数,尤其两阶段Quicksort最高。
- 两阶段Bradley–Terry在低广度时性能较差,随着 \(\beta\) 增至5以上逼近同类。
  • 联系文本:实证验证新颖聚合方法在高不确定环境中更稳健、有效,尤其采样优化版本兼顾计算效率和效能平衡。[page::9]


3.3. 图3(第10页)


  • 描述:与图2相同设置,但Win概率被限制为离散集合 \(\{0.01,0.1,0.2,\ldots,0.9,0.99\}\)。

- 数据及趋势
- 聚合方法排名不变,但Quicksort与两阶段Quicksort的性能差距扩大。
- 两阶段Quicksort改进效果尤为显著,表明Newman迭代适合有限精度胜率离散化场景。
  • 联系文本:该图强调算法对实际场景中有限概率表达的适应性及优势,同时表明数值离散化可能影响不同方法表现的微妙差异。[page::10]


3.4. 图4(第11页)


  • 描述:对比聚合方法中基于Win概率的四种方法(Bradley–Terry、两阶段Bradley–Terry、Quicksort、两阶段Quicksort)的成对比较次数,分别针对 \(\beta=0,5,10\)三档设定。

- 数据及趋势
- 标准Bradley–Terry始终评估全部435对项目组合(30项全配对)。
- 两阶段Bradley–Terry大幅减少至约60次,极具节约效果。
- Quicksort相关方法介于两者之间,比较次数约为200-270,且随着知识广度 \(\beta\) 增大,比较次数减少。
  • 分析

- 采样和分治策略明显降低计算和认知成本。
- 采样优劣及策略构造(循环图等)位于实际可行性与性能间寻求平衡。
  • 联系文本:数量级对比强调了采样策略在实际应用中的必要性,且为读者提供合理权衡性能与成本的依据。[page::11]


---

4. 估值分析


  • 文中主要估值依据为项目真实价值 \(\nui\),代理代理感知估值 \(\nu{i\ell}\) 包含噪声,通过统计模型推导成对胜率。

- 估值聚合不直接依赖价值平均,而是围绕“胜率概率”做强化,利用Bradley–Terry模型拟合“强度”排分,进而决定项目排序。
  • 迭代法(Newman迭代)核心通过最大化似然估计计算项目强度参数 \(\pii\),反映相对优劣。

- Quicksort排序法以胜率阈值(0.5)做切分,复杂度低且排序稳定。
  • 两阶段方案大幅减少成对比较次数,以循环图采样构造稀疏且有效的比较矩阵 \(W'\),复杂度由 \(O(n^2)\) 降至 \(O(n)\) 或 \(O(n \log n)\),权衡效率和精度。

- 估值模型基于分布式知识广度(\(\beta\))与项目属性间的匹配误差方差,对实际噪声建模合理。
  • 结果显示,基于胜率的排序方法普遍优于均值和单纯计数方法,尤其当噪声和离群值出现时优势明显。[page::3,5,6,9]


---

5. 风险因素评估


  • 认知负担风险:大量项目排序和成对比较会造成代理认知负荷,基础方法(如Borda)不适应规模增长,需采样和分治减负。

- 噪声与估计误差风险
- 代理评估的噪声依赖于专业度与项目类型匹配,匹配度低则不确定加剧。
- 离群评估或极端值对算法稳定性有影响,普通均值敏感性高,胜率聚合方法设计有抗噪声能力。
  • 算法收敛风险

- Bradley–Terry方法理论保证确实唯一解,但实际迭代中存在极端胜负情况导致参数发散,需要谨慎参数初始化及步长控制。
  • 采样策略风险

- 采样虽能有效削减比较次数,但缺失数据使估值矩阵稀疏,影响结果稳定性,尤其两阶段Bradley–Terry方法在知识广度较小时表现不佳。
- 循环图采样依赖初始排名,若初始顺序偏差大,可能影响最终质量。
  • 实际应用风险

- 报告假设项目成本均一及单一类型分布,未考虑成本异质和多样化价值分布的现实复杂性,可能限制泛化应用。
  • 综上,报告虽带来重要改进,仍需关注算法的稳定性和数据的完备程度对结果的影响。[page::2,3,9,11,12]


---

6. 批判性视角与细微差别


  • 客观性:作者合理引用文献,自我批判明显,承认传统方法的局限,尤其强调成对比较的认知负担及噪声多样性的现实难题。

- 假设简化局限
- 项目成本假设均一,未涵盖更复杂多维约束,未来方向提及需对此做扩展。
- 噪声模型默认为正态独立,现实中噪声可能非正态且具有相关结构。
  • 采样方法依赖初始近似,可能导致优化陷入局部,特别在循环采样里的第二阶段,置0赋值简化但或缺失重要信息。

- 迭代算法选择:虽然Newman迭代优化明显,针对极端膜拜胜负情况存在潜在数值不稳定,没有提出具体缓解方案。
  • 缺少复杂项目交互考虑:选择项目之间可能具有协同或冲突效应,文中未涉及。

- 数据集和仿真规模有限,场景广泛适用性需后续验证
  • 总体而言,报告严格,方法创新突出,论据充分,但现实应用前景还需要更多实验、理论和复杂情境分析支持,作者对此有清晰认识并提示未来方向。[page::3,9,11,12]


---

7. 结论性综合



本文以解决不确定环境下的项目组合选择问题为核心,创新性地将偏好聚合与排序问题转化为成对比较胜率矩阵的估计与排序问题,利用了Bradley–Terry模型的统计学优势和Quicksort算法的高效排序特性。全文结构严谨,从理论模型推导、数学算法设计,到多方法详细比较与仿真验证,逐步深入。

主要发现如下:
  • 聚合基于胜率的策略优于单纯均值和Borda计数,体现了对主观评价中噪声和偏见的鲁棒性提升。

- 利用Bradley–Terry模型及其迭代算法求解项目强度参数,提供更细腻的胜率估计和排序支持。
  • Quicksort结合胜率矩阵快速排序,提供复杂度较低且性能优越的方案,尤其在大规模场景具有实践意义。

- 两阶段采样方法大幅降低成对比较次数,既满足认知和资源限制,也保证排序性能,但采样设计对初始排序和稀疏数据处理影响显著。
  • 仿真结果显示,知识广度增大时,基于成对比较的排序方法优势更加明显,验证了模型合理性和应用潜力。

- 报告提出的方法具有广泛应用价值,涵盖组织创新选择、民主参与预算、社会选择等领域,且可拓展至大语言模型对比评测等新兴问题场景。
  • 同时作者坦诚指出现有模型假设简化、噪声建模理想化等不足,未来研究方向明确,包括引入代理委托机制、社交影响模型、非均一项目成本及其他复杂情形。


三张核心图表(图1-图4)分别从单代理局部比较示范、整体性能对比(连续与离散胜率)、以及成对比较成本层面清晰呈现了理论与实证的紧密结合。

综上,报告为不确定性项目组合选择问题提供了创新、扎实且具备应用前景的偏好聚合新框架,为领域相关决策和计算方法研究开辟了重要路径。

---

附:关键术语与模型解析


  • Bradley–Terry模型:通过参数向量 \(\pi\) 表达“项目强度”,任意两个项目胜出概率为 \(\pii/(\pii+\pij)\),利用最大似然估计算法确定 \(\pi\)。

- Newman迭代:一种快速求解最大似然估计的迭代算法,相较传统Zermelo迭代收敛显著加速。
  • Quicksort算法:经典快速排序算法,此处基于胜率矩阵分区,时间复杂度 \(O(n\log n)\)。

- 循环图采样:成对比较只在项目列表的邻接节点执行,形成环状图采样,减少比较数量至 \(O(n)\)。
  • 知识广度\(\beta\):代理专业度分布范围,反映专家多样性,对评估噪声的重要影响因子。

- Borda计数:基于倒序排名分配分值的聚合方法,鲁棒于噪声但难捕捉偏好强度差异。

---

以上为全文的全面详尽分析,涵盖所有章节要点、关键数据和图表解释、估值与风险分析,并结合文中内容批判性评述,满足1000字以上及专业性要求。若需进一步针对具体章节深入剖析,请告知。

报告