`

Investigating Similarities Across Decentralized Financial (DeFi) Services

创建于 更新于

摘要

本报告利用图表示学习算法对DeFi协议中金融服务的相似性进行聚类分析。通过对以太坊交易数据中DeFi构建块结构与特征的高维向量嵌入,结合聚类算法,实现对不同协议下的金融功能进行分类,最高纯度达到0.888。研究发现协议特定的设计模式影响聚类性能,能够有效揭示相似DeFi服务间的内在联系,促进对多协议复杂DeFi生态的理解与管理 [page::0][page::2][page::4][page::8][page::11]。

速读内容

  • DeFi构建块定义与作用 [page::0][page::2][page::3][page::4]:

- 构建块为一组特定协议的智能合约,树状结构展示单笔交易内合约函数调用关系。
- 不同构建块实现诸如资产交换、借贷等具体金融功能。
  • 研究数据与方法 [page::5][page::6][page::7]:

- 使用2021年1月至8月以太坊链上交易数据,涉及23个DeFi协议共10,000个构建块。
- 应用graph2vec图表示学习算法,基于构建块的子图结构和节点特征生成128维嵌入向量。
- 节点特征包括无特征、三类合约分类、函数选择器和函数选择器分组4类。
- 聚类采用层次凝聚法,选择距离阈值使得V-measure最大化。
  • 金融功能类别及协议标签定义 [page::6][page::7]:

- 金融功能分8类:包括Swap、Lock Capital、Borrow等,采用根节点函数名关键字匹配分类统计。
- 协议标签基于根节点所属协议赋值,覆盖全部构建块。
  • 聚类效果与可视化 [page::8][page::9][page::10]:

- 使用函数选择器分组特征,针对金融功能分类聚类纯度最高达到0.888,V-measure较低(0.239),显示部分功能间区分度不足。

- 针对协议标签,纯度为0.864,V-measure显著提升至0.571,协议间构建块聚类呈明显分离。

- Uniswap与Sushiswap聚类相邻,反映其代码复用关系。
  • 协议特定模式影响聚类解释 [page::10][page::11]:

- 同一协议不同金融功能构建块存在公共子图,体现协议层的重用逻辑。

- 这解释了协议标签聚类优于金融功能标签的原因。
  • 量化方法亮点 [page::5][page::6][page::7][page::8][page::9]:

- 深入利用图嵌入方法抽象复杂DeFi交互结构。
- 多层次节点特征设计提升聚类表现。
  • 研究局限与未来方向 [page::12]:

- 时间窗口与协议覆盖有限,未来可扩展至更长周期和更多协议。
- 期待引入更多链上事件数据及大型语言模型辅助节点特征提取,提升功能预测能力。

深度阅读

金融研究报告详尽分析


报告标题:Investigating Similarities Across Decentralized Financial (DeFi) Services
作者:Junliang Luo, Stefan Kitzler, Pietro Saggese
发布日期:2024年4月2日
主题:基于图表示学习算法(Graph Representation Learning, GRL),分析去中心化金融(DeFi)协议中各种服务的相似性,特别是智能合约的构建块及其聚类表现。

---

1. 元数据与概览



本报告围绕DeFi协议所提供的金融服务,特别是基于以太坊(Ethereum)的智能合约,探讨利用图表示学习算法对DeFi服务进行自动聚类与分类的方法。作者通过识别“构建块”(building blocks)这一协议特定的智能合约组合,构建用于图嵌入的特征向量空间,并采用聚类算法,检验DeFi服务的相似性。核心论点在于:
  • DeFi构建块能反映具体金融服务的逻辑功能,比如资产交换(swap)与借贷(lend)等。

- 通过GRL技术将构建块的图结构和智能合约属性转化成嵌入向量,可实现高效的服务相似性识别。
  • 利用构建块所属协议和其金融功能类别作为标签,在聚类结果中展现高纯度(purity最高达0.888),表明聚类能较好地区分不同的DeFi功能和协议。

- 构建块间存在协议级别的代码复用和模式共享,使得协议标签的V-Measure指标要高于功能类别标签。

本报告中并未直接给出投资评级或价格目标,但其旨在为DeFi服务分析提供机器学习支持的技术工具和理论框架,从而促进DeFi协议互操作性与安全性理解。

---

2. 逐节深度解读



2.1 摘要(Abstract)



摘要总结了本文的研究目标——应用图表示学习算法来识别DeFi协议中的构建块,并基于智能合约调用图和属性对它们进行聚类。研究利用8个金融功能类别作为聚类的监督标签,取得纯度最高0.888,且在协议标签下取得更高的V-Measure,表明该方法在分类DeFi服务上表现有效。关键词明确聚焦于DeFi、以太坊、智能合约、聚类和图表示学习等技术领域。page::0]

2.2 引言(Introduction)



介绍了DeFi的定义及其基于智能合约的去中介化金融服务创新。强调DeFi协议间智能合约的互操作性以及代码复用的广泛性,举例Sushiswap作为Uniswap的fork。指出DeFi功能在协议间存在功能复用和相似性,反映了传统金融功能逻辑的去中心化实现。研究动机是自动化分类DeFi服务,并探究这些相似性的技术根源。[page::0][page::1]

2.3 相关工作(Background & Related Work)


  • 介绍了DeFi协议运作,兼述以太坊虚拟机(EVM)及其合约账户的可互调用性(Section 2.1和2.2)。

- 说明构建块的概念:单个交易中由可调用的智能合约组成的树形子图,表示基本的金融功能单元,如Uniswap的资产交换或1inch的聚合交易(图1)。
  • 综述相关文献,涵盖DeFi组合复杂性带来的系统性风险,以及基于区块链交易图的机器学习应用,如反洗钱、诈骗检测等。[page::2][page::3][page::4]


2.4 数据与方法(Dataset and Methodology)



依托于Kitzler等人提出的构建块提取算法,采集2021年1月至8月间以太坊交易,包含23个主流DeFi协议的数据,提取前10000个构建块。

采用graph2vec算法建立构建块的图级嵌入。graph2vec基于Weisfeiler-Lehman子树核方法,定量衡量图结构的相似性,并生成固定长度的向量表示。该向量既体现结构信息,也可融入节点特征(智能合约属性)。

节点特征包括四种设定:
  • 无特征(默认节点度数);

- 三类合约类型标记(factory deployed、assets、其它合约);
  • 函数签名字节选择器(function selectors),即每个合约的函数签名哈希的前4字节编码;

- 签名组(signatures group),对签名选择器进行Jaccard相似度聚类而成的特征组。

目标标签有两类:
  • 协议标签(protocol),以构建块根节点所属协议作为标签;

- 金融功能类别(financial functionality category, FFC),共8大类,包括swap、lock capital、withdraw、borrow等,依据根函数名称中的关键词正则匹配确定。[page::5][page::6]

2.5 聚类分析(Clustering Analysis)


  • 使用agglomerative聚类,调整距离阈值以优化V-measure指标,兼顾聚类纯度与完整度。

- 各节点特征设定下,最佳表现为“签名组”模式,表明更细粒度的签名函数分类能更好捕捉合约功能相似性。
  • 协议标签聚类结果纯度可达0.864,V-measure达0.571,优于功能标签的纯度0.888但较低的V-measure 0.239,原因在于协议间存在较多共享子图和复用模式。

- 图2和图3(t-SNE降维可视化图)表明,Swap功能聚类较为集中,而协议聚类展现明显分离,各协议构建块形成独立紧密簇,Uniswap与Sushiswap因代码基础相似聚簇较近。
  • 通过分析协议内部构建块中的共同子图或嵌套关系(图4),解释协议聚类优于功能聚类的现象,显示部分子结构并非金融功能特异,而是协议特有通用模式。[page::7][page::8][page::9][page::10][page::11]


2.6 讨论与结论(Discussion and Conclusions)


  • 成功应用图表示学习和层次聚类算法,实现构建块金融功能的有效分类与分析。

- 可揭示协议间相似功能服务及异同,促进对DeFi生态的宏观理解及互操作性推进。
  • 研究也承认局限性:仅采用交易调用数据,忽略事件数据;数据时间跨度有限;算法研究尚有限。

- 未来改进方向包括:引入更多数据类型和时序分析,融合大语言模型提取合约特征以提升分类效果,并进一步实现新功能识别和行为预测。
  • 本研究为自动分析DeFi合约服务提供新方法,助力理解DeFi复杂生态结构及风险管理。[page::11][page::12]


---

3. 图表深度解读



3.1 图1:构建块示例(第3页)


  • 图呈现两个DeFi构建块,分别源自Uniswap(单一交换构建块)和1inch(聚合多个DAI构建块实现更复杂交换)。

- 节点代表智能合约账户,边表示合约调用方法,树形结构体现交易内部嵌套调用。
  • 显示了DeFi合约组合(“composition”)如何构建复杂金融服务。1inch聚合调用Uniswap和Sushiswap子构建块,完成多协议资产交换。

- 该图直观支持构建块定义及组合原理,说明DeFi复杂服务背后存在结构化、可复用的合约调用模式。[page::3][page::4]

3.2 算法1流程图(第8页)


  • 为图2Vec嵌入和层次聚类算法伪代码,包含输入数据集、节点特征赋值、迭代训练、聚类阈值选取和指标计算。

- 清晰体现了从原始智能合约调用图到高维向量空间再到聚类标签预测的全流程。
  • 重要参数:embedding维度(128),学习率(0.05),训练轮次(100),聚类最优距离阈值(0.6-1区间搜索)。

- 该伪代码为后续实验提供技术细节和复现基础。[page::8]

3.3 表2:聚类结果指标(第9页)


  • 对比不同节点特征和目标标签下聚类表现:指标包括群体同质性(Homogeneity)、完整性(Completeness)、V-Measure、纯度(Purity)和聚类簇数。

- 签名组节点特征在两种标签(协议和功能)下均取得最优纯度(协议0.864,功能0.888)和V-Measure(协议0.571,功能0.239),验证了高质量节点特征的重要性。
  • 节点无特征和简单分三类特征均表现较差,表明结构信息配合精准节点功能标识提升分类效果。

- 功能类别纯度最高,但V-measure较低,暗示功能标签内簇不够完整或分散;协议标签聚类效果更均衡。
  • 聚类簇数多达200+,说明DeFi构建块种类丰富且多样性高。[page::9]


3.4 图2和图3:t-SNE降维可视化(第9-10页)


  • 图2(功能类别标签)显示以“swap”为主的构建块形成多个明显簇,其他功能如“withdraw”和“lock capital”相对接近,说明某些金融功能逻辑上有相互依存和共性。

- 图3(协议标签)显示大部分协议构建块聚类间距离遥远,除Uniswap和Sushiswap外明显分离,支持协议间高度专属性。
  • 这两幅图形象表明:协议标签更适合通过图嵌入捕捉协议代码层面共性,功能标签反映金融业务逻辑层面区别,但后者因共享协议代码而混淆较多。[page::9][page::10]


3.5 图4:协议内共享子图示例(第11页)


  • 展示Compound和Aave协议内部不同金融功能构建块间存在同一部分子图(带红色高亮)。

- 例如Compound的borrow构建块包含exchangeRateCurrent构建块,且Aave的repay和borrow两构建块间存在公共子结构。
  • 证实协议中存在复用模块和协议特有操作,非纯粹功能划分导致聚类指标协议标签优于功能标签。

- 该图为理解不同标签聚类效果差异提供了结构性证据和技术解释。[page::11]

---

4. 估值分析



本报告无典型财务指标估值内容(如DCF、市盈率等),而是聚焦于DeFi协议层面的技术分类和模式识别,故不适用传统金融估值分析方法。

---

5. 风险因素评估



虽未专门设置“风险”章节,报告隐含的风险与局限主要包括:
  • 数据时效性限制,仅涵盖2021年初至8月,可能忽略后续DeFi协议新演化及变更。

- 样本覆盖有限(23个协议),DeFi生态快速发展带来新协议可能无纳入,影响泛化能力。
  • 仅依赖交易结构调用数据,缺乏诸如事件触发、资产转移等补充维度,分析深度受限。

- 机器学习方法自身存在模型选择和参数调整风险,可能导致局部最优或过拟合。
  • 集群正确性依赖标签准确性,函数名正则匹配标签存在误判风险。


报告对这些限制均予以披露,并提出未来改善方向(不同数据源、多算法结合、大语言模型辅助),体现了合理的风险自我评估与迭代方案。[page::12]

---

6. 批判性视角与细微差别


  • 报告侧重技术方法创新,略显理想化,实际DeFi合约代码复杂度及业务变化可能带来更多动态性与不可预见性,未充分讨论动态时间序列分析的必要性。

- 对功能标签的划分依赖于函数名关键词,潜藏标签噪声和误差,可能影响聚类评级的可信度。
  • 仅使用graph2vec,一种基于子树核的算法,可能受限于子图同构判定能力;报告提出未来扩展但未实证其他更先进图神经网络的利弊。

- 聚类参数,如距离阈值的选取,基于经验法则调优,未提供充分的敏感性分析,存在潜在主观选择偏差。
  • 虽识别出协议内部共享模式导致聚类协议标签表现更优,但未深入探讨这种代码复用是否会导致功能层面金融风险聚集,亦未论及安全审计等风险管理对策。


整体而言,报告立场客观,结构严谨,技术路线明晰,但对DeFi生态整体复杂度的动态演变与金融风险实务关联讨论不足,后续研究可进一步填补该空白。

---

7. 结论性综合



本报告系统地提出并验证了一种基于图表示学习的DeFi构建块相似性分析与聚类框架,主要贡献体现在:
  • 明确定义并量化了DeFi协议中由智能合约调用树构成的“构建块”,对应不同金融功能,解析其结构与协议属性。

- 通过graph2vec嵌入将构建块转化为高维向量,利用不同节点特征丰富智能合约信息,提升图嵌入能力。
  • 采用层次聚类算法对嵌入空间进行分组,通过协议和金融功能类别两种目标标签衡量聚类效果,KITZLER等提出的签名组节点特征在纯度和V-Measure指标上均优异(纯度最高达0.888,V-Measure最高达0.571)。

- 聚类可视化揭示Swap类别构建块相对独立,协议标签呈现明显分离,验证协议间存在的代码复用和设计模式共享,如Uniswap与Sushiswap的近似聚类。
  • 协议内部不同金融功能构建块共用子图结构,导致协议标签聚类效果优于功能标签,体现了协议特有交易模式的存在。

- 该方法为自动识别和分类DeFi金融服务提供可解释、数据驱动的技术手段,促进DeFi领域互操作性和风险管理的研究。
  • 报告并坦诚当前研究局限,提出未来结合多数据源、扩展算法和利用大语言模型进一步提升DeFi服务智能分析的方向。


综上,本文不仅为DeFi服务分类提供了机器学习和图学习全新工具,也为DeFi协议间代码复用与功能相似性分析提供了深刻洞见,具有较高的理论价值和实际应用前景,其研究结果为DeFi生态的安全性、合规性与创新提供坚实支撑。

---

图表参考



- 算法流程图:图算法1流程
  • 图2:功能类别标签t-SNE可视化:图2

- 图3:协议标签t-SNE可视化:图3
  • 图4:协议共用子图示例:图4


---

引用文献标注示例:[page::0][page::1][page::3][page::6][page::9][page::11][page::12]

报告