Enhancing Meme Token Market Transparency: A Multi-Dimensional Entity-Linked Address Analysis for Liquidity Risk Evaluation
创建于 更新于
摘要
本报告提出基于多维度实体关联地址识别的方法,创新性构建针对meme代币的流动性风险指标体系。通过对BabyBonk等多款代币的实证分析,验证了方法能揭示代币真实流动性,识别自买自卖和循环交易等操纵行为,极大提升了市场透明度和风险评估准确性,为监管和投资提供理论基础和实践工具 [page::0][page::1][page::5][page::6]。
速读内容
研究创新点与方法流程 [page::1][page::2]

- 首次针对meme代币设计多维度实体关联地址识别方法,包含资金来源分析、资金去向分析、行为相似性分析、异常交易行为分析四个维度。
- 利用图挖掘、社区发现及聚类算法,过滤异常地址,提升识别准确率并聚合实体地址群。
- 构建覆盖代币分布、交易活跃度、流动性的六项流动性风险指标。
数据预处理及地址识别细节 [page::2][page::3]
- 过滤智能合约地址、热钱包地址和空投相关交易,剔除干扰。
- 资金来源与去向分析针对单向、多向资金流动,结合行为相似性检测协调交易,捕获更复杂、隐蔽的实体地址关系。
- 识别异常高频和循环交易行为,有效揭示市场操纵。
实验结果及实体群聚合分析 [page::4][page::5]


| clusterid | balancepercent | addrs | addrspercent | daysmin | daysmax | daymean | txssum | txsmean | balanceusdtsum |
|------------|-----------------|-------|---------------|----------|----------|----------|---------|----------|------------------|
| -1 | 0.487452 | 17371 | 0.7984 | 1 | 100 | 2.3 | 409531 | 23.6 | 12621589 |
| 0 | 0.278419 | 988 | 0.0454 | 1 | 63 | 4.1 | 10258 | 10.4 | 7209112 |
| 1 | 0.000006 | 105 | 0.0048 | 1 | 24 | 1.4 | 231 | 2.2 | 148 |
| 2 | 0.000044 | 34 | 0.0016 | 1 | 10 | 3.6 | 291 | 8.6 | 1149 |
| 3 | 0.000023 | 28 | 0.0013 | 1 | 9 | 2.4 | 99 | 3.5 | 601 |
| 4 | 0.000026 | 27 | 0.0012 | 1 | 12 | 1.6 | 70 | 2.6 | 676 |
- 通过多阶段聚类合并,将18,587地址聚合为5,245实体群组,最终确认1,214个高度可信实体群。
- 最大实体地址数群组持有27.8%代币,疑似市场做市行为,可排除干扰分析。
MEME代币真实流动性指标优化效果 [page::5][page::6]


- 以BabyBonk为例,实体关联识别后,Top10持币比例和HHI显著下降,表明真实资金高度集中,揭示隐藏风险。
- 对比BabyBonk、NMT与BonkFork三代币,NMT在优化后流动性指标表现优异,展现更稳定价格趋势,适合投资选择。
- 反映市面常见的虚假交易行为对统计指标的潜在扭曲。
研究局限与未来方向 [page::6][page::7]
- 实体识别算法仍受复杂攻击策略影响,排除公共地址导致部分关联遗漏。
- 静态指标体系难以全面反映市场快速波动与动态变化。
- 后续工作聚焦于结合价格走势的长期实证验证和动态流动性风险评分体系构建,拓展至更多公链资产。
深度阅读
金融研究报告详尽分析报告
---
1. 元数据与报告概览
- 标题:《Enhancing Meme Token Market Transparency: A Multi-Dimensional Entity-Linked Address Analysis for Liquidity Risk Evaluation》(提升迷因代币市场透明度:基于多维度实体关联地址分析的流动性风险评估)
- 作者与机构:
- Qiangqiang Liu, Qian Huang, Frank Fan(三人均来自Binance风险部门,分别位于迪拜与香港)
- Haishan Wu(Zand AI部门,迪拜)
- Xueyan Tang(上海交通大学苏州人工智能研究院,复旦校友)
- 发布日期:2024年(具体未标明月份)
- 主题:围绕“迷因代币(Meme tokens)”的流动性风险评估,利用区块链地址聚合和实体识别技术,提出新型多维度方法实现市场透明度提升。
核心论点与主要信息:
本文针对迷因代币这类极具波动性、社区导向且极易被操控的数字资产,提出了一种创新的基于“实体关联地址识别”的流动性风险评估框架。通过多维度资金流、行为相似性和异常交易检测方法,识别实际由同一主体控制的多个链上地址,纠正传统交易数据中由于“自我交易”“循环交易”等人为操控导致的流动性虚假表现。实证分析针对BabyBonk、NMT和BonkFork三种代币,揭示了明显的“表象”与“真实”流动性差异,对投资者和监管机构提供理论及实证支持,推动构建更透明和稳健的迷因代币生态。[page::0,1]
---
2. 逐章深度解读
I. 引言(Introduction)
- 关键论点:
迷因代币因其强烈的社区互动、病毒式传播和高度波动性,成为加密市场中一类新兴资产,截至2024年已占据11%的加密市值(超1200亿美元),极具投资诱惑但风险同样显著。该类别通常特征包括高波动性、社媒驱动价值、低流动性、不明确的基本面,以及潜在严重的市场操纵风险(如LIBRA、Broccoli案例)。这些独特属性使传统金融分析工具难以准确评估其风险,催生前沿的流动性风险评价模型需求。
- 论据及数据支撑:
引述了多起典型案例,如由政治事件推动起飞的TRUMP coin,短时间市值迅速暴涨;操纵事件中LIBRA因内部大户导向造成暴涨暴跌,Broccoli则呈现严重持仓集中及“泵盘出货”一日暴跌现象,表明主流方法难以抓住此类资产真实风险。[page::0]
- 概念解析:
- 实体识别(Entity Identification):链上多地址合并归属于单一主体,识别同一控制者持有的地址群,为剖析资金流及操纵行为奠定基础。
- 流动性指标偏差:未识别实体相关地址前,表面交易量、持币分布等指标易受“假象交易”影响,导致风险低估。
II. 相关研究(Related Works)
- 关键观点:
- 研究领域涵盖区块链地址聚类与实体识别、数字货币流动性分析和市场操纵检测。
- 以往区块链地址聚类研究已较成熟,包括多篇机器学习及图挖掘方法创新工作[5-13],但专门针对迷因代币的流动性风险尚无综合框架。
- 流动性研究涵盖DeFi生态和交易所网络动态,探索新指标衡量流动性[14-22],市场操纵识别注重洗盘、环交易等异常交易行为[23-26],监管挑战与泡沫探讨也日益丰富[27-32]。
- 本文创新在于整合上述多领域技术,专注迷因代币的特殊市场结构与风险,提出专属流动性风险评估框架[page::1]
III. 方法论(Methodology)
- 数据源及整体流程(见图1):
- 主链数据来自BscScan(BSC链浏览器)
- 地址标签数据来自Arkham(链上情报平台)
- DEX流动性数据来自DEXScreener
- 利用图挖掘算法识别实体关联地址(资金来源、资金去向、行为相似、异常交易四维度分析)
- 进一步对候选关联地址进行聚类和精炼,排除离群点
- 计算并优化流动性风险指标
- 工作流程图方便理解四个关键分析模块及指标计算,清晰展示多数据源融合特点[page::1,2]
- 数据预处理:
- 排除智能合约地址、热钱包转账行为,避免误关联
- 剔除空投相关多重发送交易(常利用多发送合约分发等)
- 保障实体识别专注真实用户行为,避免项目方数据干扰[page::2]
- 四大实体识别维度:
1. 资金来源分析:一钱包单向大量转账至多个子钱包,强调持币实体归属,适用低频交易者及长期持币群体。
2. 资金去向分析:多个小钱包资金集中汇聚到同一地址,识别散布持币者实为单一主体,揭露分散持币掩盖的风险。
3. 行为相似性分析:
- 用Louvain社区检测算法,识别统一操作模式(交易时点、交互合约等相似)。
- 捕获避开资金流基础识别的复杂操控行为,重点发现协同行动网络。
4. 异常交易行为分析:
- 侧重高频率、小额环形交易、金额相同转账等环洗、自卖自炒行为。
- 有效揭示人为炒作及交易量造假[page::2,3]
- 实体地址聚类:
- 通过提取多维特征(交易量、网络结构、时间序列、持币特性、社会图等)
- 采用DBSCAN密度聚类、Isolation Forest排除异常,最后基于概率模型进行阈值判定,形成最终实体关联地址群。
- 多重聚类策略兼顾宏观社区结构与微观异常过滤[page::3]
- 流动性指标设计:
- 代币分布类:前十大持币占比及Herfindahl-Hirschman指数(HHI)评估市场集中度,HHI越大,市场越易受大户控制。
- 交易活动类:
- VMTV(24h交易量/市值比率),反映市场活跃度与流动性水平。
- 波动率(24h交易量/流动性池规模比),监测交易频率和操控可能。
- 流动性类:
- 流动性池总值:DEX中实际可用交易资金量。
- 持币地址数:参与度和社区规模指标。
- 通过实体关联地址优化指标,剔除虚假交易,自我交易,提高风险评估真实性[page::3,4]
IV. 实验与结果(Experiment)
- 数据采集:
- 选取2023.12.15至2024.3.23间BSC链上高排名迷因代币BabyBonk。
- 初步275,956笔交易,21,759持币地址。
- 按预处理剔除智能合约、热钱包及空投相关交易,剩余161,336笔交易,18,587持币地址[page::4]
- 实体地址识别数量级:
- 资金来源分析:1,063组,5,413地址。
- 资金去向分析:2,811组,3,008地址。
- 行为相似性分析:1,104组,5,819地址,示例呈树状资金流分布(Fig. 2)。
- 异常交易分析:70组,2,015地址,交易金额一致群体具高度关联(Fig. 3)[page::4,5]
- 聚类成果:
- 总18,587地址被整合为5,245实体组。
- 通过调参(DBSCAN eps=0.5, Isolation Forest contamination=0.1, ProbModel阈值=0.7)确保聚类精度。
- 1214个实体组(4,387地址)被最终确认。
- 最大实体组(群0)27.8%代币持有,10,258笔交易且持续活跃,推测为市场制造者,排除对比失败。
- 另有单地址31.7%代币持有的零散群,代表散户基础活跃度高(Fig. 4、5)[page::5]
- 流动性指标对比:
- 采用雷达图显示BabyBonk优化前后指标差异(Fig. 6)。
- 几乎所有指标(持币集中度、HHI、活跃度等)均下降,表明原指标被虚假交易掩盖风险。
- 特别是Top10持币集中度明显提升,警醒投资者真实风险较大。
- 实体优化使指标更贴近市场实况[page::5]
- 多代币流动性对比:
- 选取2024年3月BSC链三大币种BabyBonk、NMT、BonkFork。
- BonkFork流动性较差被排除。
- 初步,NMT波动率优但持币集中度较高;BabyBonk则相反(Fig. 7A)。
- 实体关联优化后,NMT整体面貌明显改善,雷达空域大幅扩大(Fig. 7B),呈现更优流动性和较好价格稳定性。
- 该方法为投资决策提供了更科学依据[page::6]
---
3. 图表深度解读
图1:研究流程图
- 展示了数据收集到最终流动性指标计算的全流程。
- 四大识别维度(资金来源/去向、行为相似、异常交易)分别描绘典型交易图结构,辅助理解复杂链上模式。
- 展示数据来源及后续分析步骤衔接,辅助理解整体框架设计合理性。[page::2]
图2:树状资金分布
- 表示某实体组内一中心地址向叶节点大量分发资金,呈典型“主链一对多”资金扩散网络。
- 该网络揭示单实体可能通过多个子钱包构建复杂资金动作,以掩护真实资金所有权。
- 有助解析投机及潜在操控实践。[page::5]
图3:相同金额交易图谱
- 高亮交易金额相同的区块链地址间交易,形成紧密联系网络。
- 说明地址间人工循环交易的可能性。
- 该异常模式有力支持文章提出的“环洗交易”“自我交易”行为识别。[page::5]
图4:最大五个实体群统计表
| clusterid | balancepercent | addresses | addrspercent | daysmin | daysmax | daymean | txssum | txsmean | balanceusdtsum |
|------------|-----------------|-----------|---------------|---------|----------|----------|---------|----------|------------------|
| -1 | 48.75% | 17,371 | 79.84% | 1 | 100 | 2.3 | 409,531 | 23.6 | 12,621,589 |
| 0 | 27.84% | 988 | 4.54% | 1 | 63 | 4.1 | 10,258 | 10.4 | 7,209,112 |
| 1 | 0.0006% | 105 | 0.48% | 1 | 24 | 1.4 | 231 | 2.2 | 148 |
| 2 | 0.0044% | 34 | 0.16% | 1 | 10 | 3.6 | 291 | 8.6 | 1,149 |
| 3 | 0.0023% | 28 | 0.13% | 1 | 9 | 2.4 | 99 | 3.5 | 601 |
- 显示大多数代币集中于少数实体组及众多散户,体现代币分布极度不均衡的实情[page::5]
图5:最大实体组的交易网络
- 多个簇状子网络连接形成复杂网状结构。
- 指出市场制造者通过紧密合作的多个地址实现持续交易,产生流动性假象。
- 该结构支持排除制造者组用于后续真实流动性评估的决策。[page::5]
图6:BabyBonk流动性雷达图对比
- 绿色为优化后,黄色为优化前。
- 优化后Top10持币集中度、HHI、VMTV、波动率等均下降,持币地址等略变。
- 面积缩小表明未经实体识别前指标被人为炒作放大。
- 支持文章核心论点,实体识别提升现实反映。[page::5]
图7:三币种流动性雷达图对比
- (A) 优化前:三币种VMTV、波动率、持币集中度指标差异明显但均有弊端。
- (B) 优化后:NMT雷达图明显扩大,指标均衡改善,BabyBonk未有显著提升。
- 显示实体识别对投资选择提供了更加科学依据,避免单一指标误导。[page::6]
---
4. 估值分析
本文并未涉及传统的估值模型或目标价预测,侧重于流动性风险的识别与量化,强调通过实体识别纠正虚假数据纠偏后的风险指标呈现。采用的指标多为统计与网络分析工具,无现金流折现法、市场乘数法等传统估值模型,聚焦市场微观行为与风险揭示。
---
5. 风险因素评估
- 市场操纵风险:大户通过多地址持币和自交易行为制造虚假交易量与流动性,掩盖真实持仓集中度与市场风险。
- 数据识别盲区:公开地址与复杂策略可能导致漏判真实实体关联,部分关联地址被误判为独立。
- 动态变化不足:指标相对静态,难实时捕捉市场的快速动态变化与情绪影响。
- 样本选择偏差:仅选择部分知名、高排名代币,可能无法代表更广泛的迷因代币生态。
- 价格走势与社交影响未涵盖:价格变动受综合因素驱动,流动性风险虽重要但非唯一影响因素。[page::6]
---
6. 批判性视角与细微差别
- 该研究主要解决了传统指标难以识别虚假流动性的问题,但未能完全涵盖所有复杂操控手段,尤其是那些利用多链、多平台与跨链流转的行为。
- 实体识别依赖阈值和算法模型,参数选择可能带来不同结果,对模型敏感性分析欠缺。
- 数据剔除规则具有一定主观性(如排除部分热钱包转账),可能存在一定的误差和遗漏。
- 研究重点聚焦BSC链,虽然提出方法具备跨链普适性,但不同链上行为模式及数据差异可能限制其直接外推。
- 流动性度量指标优化后依旧存在流动性指标“Liquidity”变化较少,或说明某些传统流动性指标并未充分受到虚假交易影响,这个点未有深入讨论。[page::6]
---
7. 结论性综合
本文创新性地提出了基于多维度实体关联地址识别的迷因代币流动性风险评估方法,系统地结合资金流向、行为聚类与异常交易检测,以克服以往传统指标对虚假交易的识别不足。实证研究以BabyBonk为主,利用区块链公开数据,剔除智能合约与空投等特殊交易,成功识别散户与大户实体群体。通过聚类分析,发现部分大户利用复杂地址结构构建市场制造者行为,严重影响了流动性指标的真实性。优化后的核心指标如Top10持币集中度、HHI指数以及交易活跃度均发生明显调整,真实反映了代币内在流动性风险。
跨代币对比进一步验证了方法的实用性,尤其NMT代币在应用实体识别优化后展现出更优流动性和价格稳定性,支持该方法在投资决策中的辅助价值。图表(如Fig.1~7)系统呈现了数据处理、地址识别及指标优化全过程,视觉化呈现流动性真实结构,增强结论说服力。
该研究为监管机构和市场参与者理解及治理迷因代币市场提供了理论与实证基础,有望促进该新兴市场的透明度与健康发展。未来研究需进一步完善识别算法、动态指标体系和长期价格验证,并推广到更广泛的链与代币,以增强方法普适性及实际指导价值。[page::0-7]
---
总结
- 研究目标:解决迷因代币市场因虚假交易导致的流动性风险误判问题,提升市场透明度。
- 方法逻辑:多维度实体地址识别(资金来源去向、行为相似、异常行为)结合聚类与剔除异常,计算改进流动性指标。
- 核心创新:实体关联消除“假象交易”,实现更真实风险评估。
- 数据与验证:多指标实证检验,数据剔除合理,典型代币案例扎实。
- 投资价值:辅助正确区分表面活跃与实质流动性,防范操控风险。
- 不足:局限于BSC链,动态风险及多因素融合不足。
- 未来方向:跨链应用、动态风险追踪、与价格走势的关联实证。
整体而言,该报告在迷因代币市场风险识别领域填补重要空白,为市场参与者和监管提供了具有操作性的分析框架与实证依据。
---
全文引用页码标注示例:
综述段落引用了页面[page::0,1]等,详见上述各部分对应标注。
---
以上为本金融研究报告的详尽、全面剖析。