An Improved Algorithm to Identify More Arbitrage Opportunities on Decentralized Exchanges
创建于 更新于
摘要
本文提出一种结合了线图构建与改进的Moore-Bellman-Ford算法的新方法,用于在Uniswap V2上识别更多套利机会,涵盖套利循环和非循环路径。该方法突破了传统MBF算法每次仅能识别少数套利循环的局限,能够从任意起始代币检测套利循环并发现任意代币对之间的非循环套利路径。实证结果显示,本方法识别的套利路径数量远超MBF,最大潜在套利收益可达百万美元级别,且有效反映了Uniswap的市场效率变迁趋势。[page::0][page::1][page::4][page::5]
速读内容
- 算法创新点与优势 [page::0][page::3]
- 结合线图(L(G)) 和改进的Moore-Bellman-Ford算法(MMBF),提高了套利识别能力。
- 既能发现更多套利循环,也能检测非循环套利路径。
- 通过为线图添加额外节点,单次运行即可获取从某代币出发的所有套利路径。
- 数据来源及处理 [page::1][page::2]
- 以Uniswap V2历史快照数据(2020-09-01至2023-10-31)为基础,构建每日代币图,节点代表代币,边代表交易对及汇率。
- 过滤策略确保图中约100个代币及400个高流动性池,覆盖约90%总锁仓价值(TVL)。

- 关键方法步骤详解 [page::2][page::3]
- Token图构建:有向加权图,边权为交易对汇率的负对数,考虑交易手续费0.3%。
- 线图构建:将Token图中边转换为线图节点,节点间有向连接表示可能的交易路径延续。
- MMBF算法单次遍历线图,结合添加的额外节点,快速计算最短路径,实现套利循环及非循环识别。
- 最大化套利收益的计算方法 [page::3][page::4]
- 结合Uniswap V2的恒定乘积做市商模型和交易深度,应用二分法求解最优投入量,使得边际收益率等于目标代币储备比例或市场价比,确保利润最大化。

- 统计及比较分析 [page::4][page::5]
- 本方法找到的套利路径数量和潜在利润远高于MBF组合算法,出现百万美元级别套利机会。
- 路径长度分布较均衡,主要在7-11跳,MBF发现路径多集中于3~4跳。


- 发现的套利利润呈幂律分布趋势,机会数量总体随时间呈下降趋势,反映市场效率提升。

- 算法性能与局限性 [page::5]
- 处理一张含约100个代币和400个流动池的图,运行时间约8-10秒,具备实际应用潜力。
- 当前算法虽能检出有效路径,但不保证一定是利润最大的。未来需考虑交易gas费用及进一步优化。
深度阅读
金融研究报告详尽分析
一、元数据与概览
报告标题: An Improved Algorithm to Identify More Arbitrage Opportunities on Decentralized Exchanges
作者: Yu Zhang, Tao Yan, Jianhong Lin, Benjamin Kraner, Claudio J. Tessone
所属机构: University of Zurich, Department of BDLT, IfI
发布日期: 未明确给出确切日期,论文数据采集截止到2023年10月31日
研究主题: 针对去中心化交易所(DEXs)中的套利机会识别算法改进,尤其聚焦Uniswap V2的套利路径识别。
核心论点:
本报告提出了一种基于线图(line graph)结合改进版Moore-Bellman-Ford(MMBF)算法的新方法,旨在克服传统MBF算法在检测套利路径时的不足。此新方法不仅能发现比传统方法更多的套利循环(loops),还能识别非循环(non-loop)的套利路径,极大提升对Uniswap V2中潜在套利机会的捕捉能力。
主要结论及贡献:
- 设计了一种新的检测算法,能从任意指定的起始代币找到套利循环,并发现更多套利机会。
2. 该算法还可识别任意代币对之间的非循环套利路径。
- 通过实际应用,发现的套利利润规模显著高于MBF结合“walk to the root”方法,最高可达百万美元级别。
4. 统计显示该方法可以更全面捕捉Uniswap V2中随着时间变化的潜在套利机会。
---
二、逐节深度解读
1. 引言与问题背景
- 内容总结:
区块链领域的去中心化金融(DeFi)中,去中心化交易所(DEX)犹如传统外汇市场一样,因不同流动性池(liquidity pools)之间的代币价格差异而产生丰富的套利机会。Uniswap作为最大的DEX,通过恒定乘积做市商(CPMM)模型决定交易对价格,形成带权有向图,节点为代币,边为代币间交易对,权重为交易汇率的对数负数,构成了套利路径的数学基础。
- 推理与假设:
MBF算法结合“walk to the root”技术能找出套利循环对应的负权循环,但受算法本身限制,只能发现部分循环且不能指定循环起始代币,且无法识别非循环的套利路径。本文提出结合线图与改进MBF算法,突破这两项限制。
- 关键数据点:
引言未包含具体数据,主要铺陈理论框架与相关算法背景。
---
2. 相关工作(Related Work)
- 总结要点:
先前研究多聚焦于识别环状套利,普遍采用MBF算法及其变体,研究包括三角套利、历史交易数据识别套利。MBF结合“walk to the root”算法是主流但有限。报告再次强调MBF方法的瓶颈:每次迭代只能发现少量负权环,且无法指定起始代币和非环路径。
- 分析:
报告基于广泛文献,明确市场现有算法不足,奠定自身方法的必要性与创新点,为后续方法论构建提供理论基础。
---
3. 数据说明(Data Description)
- 数据来源:
采用The Graph的数据接口获取Uniswap V2中代币对信息,包括代币地址、名称、符号、储备数额和精度;历史日度快照涵盖每日交易量和储备量,跨越2020年9月至2023年10月。
- 数据处理:
经过严格筛选,仅保留每日TVL超过2万美元并且活跃的流动性池,去除度数(degree)为1的节点(无套利可能),最终构造包含约100个代币和约400个流动性池的Token图,覆盖90%的TVL。采纳迭代删减策略,保证图规模与计算资源匹配。
- 图表分析:

左图显示每天新创建的流动性池数量,自Uniswap V3推出后整体呈上升趋势,特别是2022年末和2023年中爆发式增长;右图为日交易量波动,虽整体呈下降趋势但仍保持高位,有时超过5亿美元,体现市场活跃度。
---
4. 方法论(Method)
核心步骤分为四大块:
- 4.A 构建Token图
以代币为节点,边表示两个代币的流动性池交易对,权重为边对应的汇率负对数函数。汇率计算公式:
\[
p{ij} = -\log((1-\lambda)\frac{rj}{ri})
\]
其中$ri,r_j$为该流动性池中两个代币储备,$\lambda=0.3\%$为交易费率。
- 4.B 构建线图 (Line Graph)
线图$L(G)$中的节点由原图$G$的边变换产生,即原图的每条有向边变为线图的一个节点。两个线图节点之间的边,依据原图中相邻的边连接规则构建,权重取决于原图相应边的权重。切除互逆不可盈利环型边,降低计算复杂度。
- 4.C 改进MBF算法(MMBF)
为提高效率,新增虚拟源节点连接所有起始代币相关的邻居边节点,单次运行MMBF算法即可获得从起始代币出发的所有路径的最短路径信息,包括环绕路径和非环路径,避免高复杂度重复计算。
- 4.D 利用二分法最大化套利利润
充分考虑AMM中的恒定乘积公式,输出和输入量关系为单调凹函数,通过二分法求出最大化套利利润的最优投资量。
- 图表分析:

显示收益最大化条件:边际产出等于目标代币与起始代币储备比例或两代币市场价格比例。这一经济直觉为最佳套利量确定提供基础。
---
5. 统计结果(Statistical Results)
- 套利路径长度分布:

(a) 采用MMBF方法发现的套利路径长度呈近正态分布,主要集中在7-11步之间,也有长度3-6和12-15的路径占比较大,体现算法能发掘复杂多样的路径。
(b) 传统MBF算法则主要发现3-4步骤长的环,表明识别范围及深度有限。
- 套利利润分布:

MMBF算法识别的套利利润远超传统算法,最高达到百万美元级别,而传统最高在十万美元。MMBF发现近2.4万条超千美元套利路径,传统算法只有19条,大幅领先。大部分套利利润集中在几百美元水平。利润分布呈幂律趋势。
- 时间序列套利利润变化:

显示从2020年底起,大规模套利机会曾达到千万美元级别,随后呈周期性波动且总体缓慢下降(线性回归斜率约-0.002)。这一趋势反映市场套利效率提升,价格逐步趋于合理。ETH价格曲线亦显示波动,与套利潜力走势有一定联动。
---
6. 结果与讨论(Results and Discussion)
- 方法优势:
新提出的基于线图和MMBF算法不仅能找到传统方法遗漏的套利循环,还可识别任意代币对之间的非循环套利路径,增强全面性和实用性。
- 算法性能:
在100个代币、约400个流动池规模的图构建下,算法运行时长约8-10秒,具备实用价值;未来优化可加速处理速度。
- 局限性与未来方向:
当前算法识别的路径未必为利润最高路径,针对最优路径的算法设计为未来工作重点。未纳入链上交易气费(gas fee),虽然可通过统一交易费假设或调整$\lambda$参数近似代替,仍需更精确考虑。
---
三、图表深度解读总结
- 图1(日新增流动性对与交易量):
体现Uniswap市场活跃度变化。新建池数量增长,交易量虽波动但整体保持高位,说明市场规模稳定,为套利机会提供基础。
- 图2(利润最大化条件示意):
凸显AMM模型下投资量和收益的关系曲线以及优化点,为套利投资量选择提供理论依据。
- 图3(套利路径长度分布):
MMBF算法挖掘更丰富的路径长度,体现方法对复杂路径的识别能力;传统方法仅认短环路显示局限。
- 图4(套利利润分布):
高阶算法大幅提升识别的套利金额规模和频次,反映算法优势和潜在市场规模,同时说明市场存在少数极大套利机会。
- 图5(套利利润时间演化):
呈现套利机会的周期性波动及下降趋势,暗示市场效率持续提升,且与ETH价格动态有一定相关性。
---
四、估值分析
本报告无传统金融企业估值模型。主要聚焦算法性能与市场套利机会价值的识别,使用套利利润最大化模型结合恒定乘积AMM价格机制进行路径获利评估。利用交易储备比例和中心化交易所价格作为边际价值对比,实现投资量优化。
---
五、风险因素评估
报告明确指出以下风险及限制:
- 算法局限:
发现路径可能不是最优盈利路径,有待进一步研究最高盈利路径算法。
- 交易费用忽略:
未显式考虑链上交易gas费,实际套利利润可能受交易费显著影响,需结合实际费用模型进行调整。
- 计算复杂度:
尽管当前算法性能可接受,规模显著扩大时仍面临计算资源压力。
- 市场动态:
市场状态变化快,套利机会随时间消失或出现,单日快照难以全面反映过程性利润。
报告未明确提出缓解策略,仅简要提示gas费可考虑固定值或增加税率参数。
---
六、批判性视角与细微差别
- 算法创新性高,但假设简化明显:
负对数权重与恒定乘积模型在现实多变市场中可能存在偏差,尤其考虑交易滑点和gas费后,实际盈利不确定性大。
- 套利机会统计依赖快照,忽视市场反应速度:
实际套利有执行延迟风险,套利机会及时性及竞争性难估。
- 非最优路径识别提示存在潜在改进空间,关键利润最大化问题仍悬而未决。
- 数据过滤步骤固然必要但可能丢失部分小额池潜在套利,影响整体研究全面性。
- 图中关于价格和套利利润分布的底层数据来源可靠,但由于基于模型计算和快照,存在实际执行差异风险。
---
七、结论性综合
本报告提出并验证了一种结合线图结构和改进MBF算法的全新方法,有效提升了对Uniswap V2去中心化交易所套利机会的识别能力,尤其是涵盖了传统MBF算法难以触及的多样套利路径,包括非循环路径。统计分析显示,采用该方法发现的套利路径数量及获利潜力远超前沿研究,最高单路径潜在利润达到百万美元级,且套利路径长度分布更广泛,反映出方法在复杂市场结构中的灵活适用性。
市场上的套利机会呈现周期性波动趋势并总体趋于减少,表明市场效率正逐步提升,套利机会被逐渐抹平。算法运行效率适中,具备实际应用潜力。尽管当前研究未考虑交易手续费和竞速执行问题,且最大利润路径优化有待完善,但该研究为DeFi领域套利识别开辟了新的技术路径和思路。
综合来看,作者展现了一个技术驱动的套利识别突破,验证了算法在实践环境中优于传统框架,具有显著的学术及应用价值,推荐业界进一步优化和推广实施。
---
关键引用页码
本文主要内容来源于报告各部分:[page::0], [page::1], [page::2], [page::3], [page::4], [page::5]