Transaction Profiling and Address Role Inference in Tokenized U.S. Treasuries
创建于 更新于
摘要
本论文首次系统性解析了跨多区块链网络的美国国债代币化资产的交易行为,详细解码合约调用以划分发行、赎回、转账和跨链等功能,揭示机构与零售的行为差异。创新性地提出基于Poincaré嵌入的超曲率表示学习方法,结合流动性特征和图结构,实现地址经济角色预测,优于现有基线模型并具良好泛化能力,为链上金融资产行为理解与异常检测提供新实证证据[page::0][page::1][page::16]
速读内容
跨链交易数据采集与多代币分析 [page::2][page::3]
- 收集了三种代表性美国国债RWA代币BUIDL、BENJI和USDY的交易数据,涵盖以太坊、Arbitrum、Stellar等多个链。
- BENJI在Stellar链表现出极高交易频率(百万级交易),而BUIDL和USDY则更多集中在以太坊及Layer-2链,体现不同链与代币角色差异。
- 表格详列各链的交易次数与地址数,量化跨链资产流动特征。
交易功能划分与机构/零售行为差异 [page::4][page::5][page::6]


- BUIDL代币功能调用包括发行(issuetokens)、赎回(redeem)、销毁(burn)、转账(transfer)等,机构投资者倾向于低频高价值的赎回和发行操作 predominantly on以太坊链,零售多集中于小额高频次传输操作。
- BENJI在Stellar链构建了高频操作生态,EVM链采用signedDataExecution进行合规控制,反映中心化管理与合规需求。
- USDY展现Dual-structure,机构规模交易集中于以太坊,零售用户活跃于Arbitrum和Mantle等L2,涉及丰富DeFi功能如swap、lending、bridge。
地址角色标签及半监督标注方式 [page::8]
| 类别 | 关键词匹配 |
|---------|-----------------------------|
| Trader | dex trader, nft trader 等 |
| Bot | Sandwich Attacker, MEV等 |
| Treasury| Gnosis Safe, Multisig等 |
| Other | 以上均不匹配 |
- 共标注815个地址,交易内涵分为交易者、机器人、国库和其他四类,用于后续模型训练。
超曲率嵌入模型构建与经济角色预测 [page::9][page::10][page::11][page::12][page::13]

- 利用Poincaré球面模型,捕捉区块链交易图内隐层级结构,将中心高层节点(国库、主控者)嵌入球心,外围交易者和机器人分布在边缘。
- 引入流动性-均值比(LAR)量化流动性波动和方向失衡,细化嵌入表示质量。
- 构造11维层级半径特征,结合局部拓扑特征,使用多层感知机对地址角色进行分类。
角色分类模型性能及泛化能力 [page::13][page::14][page::15]
| 模型 | Precision | Recall | F1 | Accuracy |
|-----------------------|-----------|--------|-------|----------|
| Node2Vec | 0.668 | 0.687 | 0.654 | 0.687 |
| Role2Vec | 0.659 | 0.681 | 0.662 | 0.681 |
| FeatherNode | 0.407 | 0.638 | 0.497 | 0.638 |
| PoincaVec (w/o H, w/o T) | 0.692 | 0.712 | 0.694 | 0.712 |
| PoincaVec (w/ H, w/ T) | 0.757 | 0.748 | 0.726 | 0.748 |
- PoincaVec结合层级特征和拓扑特征表现最好,F1提高至0.726,显著优于传统平面嵌入方法。
- 在四个公链交易分类异常检测任务中展现强泛化能力,均优于基线,其中以太坊数据集最高F1达0.940。
结论与贡献 [page::16]
- 本文首次从交易层面解析美国国债RWA代币跨链行为,揭示机构与零售差异,功能调用特征及链间异质性。
- 创新提出基于超曲率几何的交易图嵌入模型,实现高效地址角色推断,且具备实际区块链异常检测潜力。
- 研究为链上固定收益产品的行为理解提供理论与技术框架,推动区块链金融化研究前沿。
深度阅读
金融研究报告详尽分析报告
报告标题:Transaction Profiling and Address Role Inference in Tokenized U.S. Treasuries
作者及机构:Junliang Luo, Katrin Tinn, Samuel Ferreira Duran, Di Wu, Xue Liu,均来自McGill University,涵盖计算机科学与管理学院,其中Xue Liu兼任MBZUAI,UAE。
发布日期:报告末页无明确发布日期,文中数据覆盖至2025年4月,推断为2025年中期前后。
研究主题:以加密链上交易视角,聚焦美国国债实物资产(RWA)数字化代币的交易行为描述及地址功能角色推断。
---
一、元数据与报告概览
本报告对Tokenized U.S. Treasuries(美国国债数字资产化)的链上交易进行了跨链多链的细粒度分析,主要涵盖代表性Token(如BUIDL、BENJI、USDY)在以太坊、Layer-2网络及其他链上的发行、兑换、转账和跨链桥接功能。针对地址行为角色,创新性地引入了基于Poincaré(双曲几何)嵌入的学习框架,结合流动性等图结构特征,来推断经济行为角色(机构、机器人、散户等)。报告核心贡献包括首次系统收集并解码链上美国国债Token交易数据,功能级别拆解交易类型,明确机构与散户用户的行为差异,且提出的角色推断模型表现优异,且具有良好的泛化能力。报告提供了链上美国国债市场金融行为的新实证证据,为理解DeFi中的真实资产金融化提供了结构化视角。[page::0,1,16]
---
二、逐节深度解读
1. 引言及背景介绍
报告介绍了RWA(Real-World Assets)即现实中收益资产通过链上Token形式数字化的趋势,其中美国国债短期票据数字化Token作为典型,体量达到60亿美元(截至2025年第二季度),主要Token有BUIDL(BlackRock)、BENJI(Franklin Templeton)、OUSG(Ondo Finance)等。数字化FFI的智能合约明确资产净值计算、红利发放及身份合规管理,且多因合规机制(KYC、白名单)限制,导致DeFi中的组合性有限。报告提出现有研究多分析发行结构与治理困境,缺乏基于交易行为的实证多链深入分析,亟需从交易及网络层面探索RWA Token的经济行为差异及内在结构。[page::0,1]
2. 相关工作回顾
分析指出,目前RWA数字化研究聚焦于多资产类别的结构治理和合规挑战,行为分析尤以房地产Token为主,显示所有权较分散、流动性总体偏低,并受市场情绪与交易成本影响。相比之下,美国国债Token的链上行为尚无全面交易层面实证报告,凸显本研究的填补作用。[page::2]
3. 数据采集
数据涵盖三大主流国债Token:BUIDL、BENJI、USDY,跨越EVM兼容链(Ethereum、Arbitrum、Avalanche、Polygon、Optimism等)及非EVM链(Stellar、Aptos)。使用公开区块浏览器API,结合Tenderly解码引擎及4byte签名数据库,对交易输入数据智能合约调用进行函数级别解码。规模层面数据显示BUIDL主要在以太坊活跃,BENJI多集中于Stellar链(短期内交易量超过250万笔,地址超过22万),USDY最大交易量集中于Mantle链(27万笔交易)。此种跨链数据集为后续交易行为的详细分析奠定坚实基础。[page::2,3]
4. RWA Token的交易行为定量分析
4.1 BUIDL行为分析
基于合同函数名的字符串匹配,将交易功能划分为“发行(issuetokens)”、“赎回(redeem)”、“销毁(burn)”、“转账(transfer)”、“存款(deposit)”和“发送(deliver)”六类。以BUIDL为例(见图1),清晰展现出以太坊链上的大额低频发行和赎回功能交易(机构特征)占据交易总额主导,二级市场活跃度极低,反映以机构对接及合规主导现实,辅助链则少量出现流动性补充和跨链桥交易痕迹。交易集中在资金密集的发行和赎回环节,零售参与度低。[page::4,5]
4.2 BENJI行为分析
BENJI使用Stellar作为主要的发行和清算账本,Stellar链内交易极为密集,主要执行股权注册、分红回购之类高频低值操作,其财务信息隐含在交易元数据中,不以传统字段体现。EVM链上仅通过“signedDataExecution”单一函数执行预授权操作,各链协同形成跨链体系,而非孤立复制。此结构表明明显的链角色分工,Stellar负责主数据库和投资者记录,EVM链更多执行许可合规的支持及辅助操作。[page::5]
4.3 USDY行为分析
对USDY的交易函数同样通过字符串匹配归类,功能更为多样,包括交易所Swap、流动性池操作、借贷行为、桥接、铸造、销毁、奖励提取及治理等。图2显示不同链及功能所呈现的交易数量与价值多样并存,部分以太坊主网的大额低频铸造销毁展示机构操盘风格,Layer-2如Arbitrum、Mantle则展现高频、低价值的零售风格交易,功能更加分散和丰富,体现DeFi本地用户行为多样性。整体表明机构与散户在不同链及功能层面共存但行为差异明显。[page::6]
5. 地址角色预测建模
5.1 角色定义与标注方案
围绕经济行为,提出三大类角色:
- Treasury(国债库存管理账号):多签钱包、基金托管等机构资金池。
- Execution Bots(执行机器人):高频套利、区块链中间件自动化交易行为。
- Traders(散户交易者):个人用户、普通投资者。
利用Dune社区数据表的地址标签,结合正则表达式提取策略对地址打标签,获得约815个地址样本,分为520散户、44库存、33机器人及218其他。[page::7,8]
5.2 模型设计
- 嵌入空间选择及理论支撑:
使用Poincaré双曲球体空间作为嵌入基地,其负曲率能够有效刻画层级结构和网络树状嵌套,核心节点更靠近几何中心,边缘节点分布到边界,提高表示层级差异的能力。见示意图3。
- 训练目标与损失设计:
采用基于对比的铰链损失函数,拉近真实交易边连节点距离,推远负样例节点,结合径向正则化使节点嵌入半径与节点度数负相关,体现层级深度。
- 流动性与波动比率(LAR)作为辅助特征:
汇聚局部交易波动率和流入流出比例权重,辅助修正嵌入。此设计可过滤稀疏异常节点的噪声影响,增强核心节点离散度。
- 基于局部半径统计的11维层级特征:
包括节点自身的射线距离,邻居的均值、方差,邻居相对深度分布的统计量(最大/最小,与节点深度相对比较),以及4个区间的邻居深度直方图。
- 融合深度神经网络分类器:
输入为Poincaré嵌入、层级统计特征和基于随机游走的结构特征,多层感知机实现层级角色分类。[page::9-12]
5.3 实验评价与基线对比
- 本地RWA数据集:
PoincaVec模型基础版(仅Poincaré嵌入)F1=0.694优于Node2Vec(0.654)、Role2Vec(0.662)以及FeatherNode(0.497)。整合层级特征和走路特征后,F1提升至0.726,表现最优,显示双曲嵌入对链上行为角色辨识有显著提升。
- 外部区块链数据测试:
测试涵盖4个不同区块链交易标签数据集(包括Ethereum普通交易、AscendEX交易所黑客事件、PlusToken诈骗和Ethereum Classic诈骗记录),模型普遍优于对照组,特别是在大型稀疏标签网络中F1最高达0.940,展现良好泛化及对异常检测的潜力。[page::13-15]
---
三、重要图表深度解读
图1:BUIDL交易量与频率散点图(对数尺度)
- 横轴:总交易金额(BUIDL Token计量),纵轴:交易笔数。
- 点形状区分功能类型(发币、销毁、转账等),颜色代表链(如Ethereum、Arbitrum)。
- 右上角点聚类代表机构行为(大额少笔),左下方聚类代表零售行为(小额多笔)。
- 以太坊上的“赎回”、“销毁”和“发行”高度集中于右上,说明以太坊仍为大部分机构业务发生地;辅助链散布在左下,显示零售特征或辅助托管。[page::4]
表1:Token及跨链交易统计
- USDY在Mantle链交易量最高,BENJI在Stellar蜂拥式交易高达250万,说明Stellar为BENJI主链;BUIDL主力为以太坊,次级链交易活动较弱。
- 通过不同链的交易数及活跃地址数量对比,反映不同Token链上采用策略及用途差异(主链+桥接/二级生态等)。[page::3]
图2:USDY各功能交易量vs频率分布(对数坐标)
- 多功能区分的交易行为清晰可见,如Mantle链高频Swap和执行交易,Ethereum链大额铸币和赎回,体现机构与散户、多层级DeFi活动的共存。
- 该图揭示不同链的功能侧重点,链间生态角色分化。[page::6]
图3:交易图网络与Poincaré嵌入对比示意
- 左图传统欧氏网络布局,三层节点无明显环层分离。
- 右图Poincaré嵌入的双曲圆盘模型,核心资金集中住所节点在圆心,外围行为零散的节点分布在边界,几何结构与经济角色形成映射关系,便于更清晰地建立层级与功能角色映射。[page::9]
---
四、估值与方法论分析
本报告未涉及传统金融估值(如DCF、市盈率等),而是运用机器学习节点嵌入方法,将角色判别任务视作节点分类问题,核心技术亮点包括:
- 双曲空间嵌入:凭借负曲率结构自然表达交易网络的层级结构,此嵌入类型适合捕捉区块链网络的树状层次与核心外围结构区别。
- 流动性指标(LAR)与邻居统计特征:创新引入流动性波动率指标辅助分辨不同经济角色的行为特征。
- 多模态特征融合:引入Poincaré嵌入、局部层级统计及基于随机游走的拓扑特征联动,提升分类器能力。
- 多任务评测:模型不只在本研究的数据集表现优秀,还能泛化至不同区块链角色标签识别(诈骗地址等),表明所提方法的稳健及适用性。
---
五、风险因素评估
报告未直接讨论投资风险,但隐含风险可推断为:
- 数据覆盖有限性与采集偏差:多链合约、异构函数调用可能存在未完全识别或归类风险,交易数据波动或缺失可能影响行为推断准确度。
- 模型依赖标签准确性与相对稀疏的人工标注:预测模型弱监督性导致角色分类存在误判风险,特别是在标签稀缺或混淆的场景下。
- 合规与跨链政策变动风险:KYC、合规模块可能影响Token交易自由及链上行为多样性。
- 技术依赖风险:复杂的Poincaré空间训练需要高计算资源,数值稳定性依赖超参调优,边界节点表现可能存在退化。
报告未详细提及缓解策略,但其跨链、多指标融合的分析方式一定程度规避了单一链与单一变量风险。[page::0-15]
---
六、批判性视角
- 创新性与代表性优势明显:首次数据驱动的Tokenized U.S. Treasuries链上行为解析,数据量涵盖多个链且多Token,全面性领先既有文献。角色推断采用Poincaré嵌入将层级结构几何化,提升了功能角色识别精度和泛化能力。
- 潜在局限性:
- 标注规模不足(815地址样本),分布不均衡,可能限制模型泛化深度。
- 依赖交易合约函数名称字符串匹配进行功能归类,可能遇到语义覆盖不足、合约升级或复杂函数时解释偏差。
- 交叉链数据不均,引发多链行为差异的深入分析可以更加细致(比如Stellar链数据的价值隐含未完全解码)。
- 对交易资金和金额的推断和对价格波动的考量较少,更多侧重结构与行为,看似忽略市场动态中供应链外要素影响。
- 理论与实践配合度良好:强调了双曲空间在嵌入区块链层级结构的合理性,并以示意图和引理形式阐释,支撑解释力强。
- 建议未来拓展:考虑合并链下合规信息、深化跨链桥接行为分析、加强模型对动态演变的跟踪能力,以及对大规模标签样本的扩展,提升模型在实务合规环境中的应用潜力。
---
七、结论性综合
本文系统采集并深入解析了以BUIDL、BENJI、USDY为代表的Tokenized U.S. Treasuries跨链链上交易数据,解码智能合约函数实现系统性的功能拆解,揭示了机构投资者和散户用户在发行、赎回、转账等功能上的显著行为分化。BUIDL典型机构行为集中于以太坊大额、低频发行/赎回,BENJI显示Stellar链作为主要发行与结算链,高频低值操作突出,USDY则多链共存呈现机构与散户并行的多功能生态。基于Hyperbolic Poincaré空间的地址嵌入模型融合交易流动性与拓扑特征,实现了金融角色的有效自动标注与推断,优于Node2Vec、Role2Vec等经典算法,且在多个外部区块链欺诈检测数据上表现出优异泛化能力。整体来看,报告不仅填补了数字化美国国债交易行为的实证空白,亦为链上金融行为角色推断开辟了新范式。其提出的多模态嵌入框架可为DeFi合规、市场监管以及区块链数据科学提供重要工具和参考。[page::0-16]
---
附录中的核心数学表述
- Poincaré嵌入通过对比损失与径向正则将节点层级映射到双曲球面中,且距离定义采用反双曲余弦函数(arcosh),有效分隔层级深度。
- 设内部节点度数越大嵌入坐标越接近中心,边缘及外围节点靠近球面边界。
- 层级半径等于节点到球体原点的几何距离,用于衡量层次结构的连续代表。
- 流动性指标LAR结合交易金额的波动度和方向流入流出比,对嵌入进行精细化调整。
此嵌入方法对区块链复杂的交易网络中的层级与异常节点识别提供了数学上严谨且实践中高效的解决方案。[page::10-12,16]
---
总结说明
- 本文严密结合链上行为数据,细致阐述不同链及Token生态的角色分布和功能差异性。
- 创新采用双曲空间嵌入,理论与应用相结合,推动链上经济行为分析向高维层级几何建模发展。
- 多维度数据融合及跨链视角提升分析深度和实际适用性,对监管、合规及生态设计具有重要参考意义。
---
此分析严格基于原文内容和数据,详尽覆盖报告结构、核心数据及数学模型,符合溯源规范。