A Full-History Network Dataset for BTC Asset Decentralization Profiling
创建于 更新于
摘要
本报告首次推出覆盖比特币从创世区块至2024年5月的全历史交易网络数据集,并基于此系统分析BTC资产的去中心化演变。通过网络中心性指标和资产分布测度,构建多维度去中心化度量指标,揭示比特币不同发展阶段的集中与分散趋势。结合排名稳定性和市场集中度分析,报告展示了BTC去中心化对金融活动(如交易手续费和MVRV-Z预测)的显著提升作用,拓宽了区块链资产定量研究视角,具备跨链可扩展性意义 [page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8].
速读内容
- 数据集全覆盖:报告构建了从2009年1月3日创世区块至2024年5月29日的完整BTC交易数据集,包括14亿以上唯一地址,超过10亿交易,输入输出分别约26亿和28亿,总交易金额超86亿BTC。利用UTXO模型重构有向加权交易图,边权基于BTC转账金额分配 [page::1].
- 网络中心性演化:报告监测了Betweenness、Closeness、In-Degree和PageRank四种核心中心性指标的历史变化。Betweenness在2011-2012年Mt.Gox事件期间出现集中峰值,随后趋于下降;Closeness保持稳定,In-Degree反映资产流入节点集中度提升,PageRank显示早期有几个核心节点占据较大影响力,整体趋势指示比特币网络去中心化加深。

- 引入“分散率”指标,定量衡量中心性指标在节点间的分布均匀度,进一步确认去中心化阶段划分 [page::2].
- 资产分布及排名稳定性分析:基于每日本金排名前5000个地址,发现比特币历史可分为三阶段:初期迅速去中心化(2009-2010)、中期去中心化减弱(2010-2012)、长期稳定(2012-至今)。定义资产分布去中心化度指标,基于累积分布曲线与理想均匀分布间面积差。

- 排名稳定性通过Spearman系数和保留率衡量,发现排名靠前的地址(可能为交易所或矿池)表现出更高稳定性,短期内新增地址影响排名波动,长期看则主导地址排名变动明显 [page::3][page::4].


- 市场集中度与去中心化:利用Herfindahl-Hirschman Index(HHI)评估市场集中度,分别在无聚类地址视角和基于社区检测归类实体视角计算,展示关键事件(2011年崩溃、2014年Mt.Gox倒闭及2018年51%攻击担忧)对去中心化度的影响。结果表明,单地址市场集中度较低,但聚类实体集中度早期快速提升后逐渐分散,反映机构或大户持币多地址分散特征。

- 量化因子与模型预测:构建多维特征集合(中心性指标,资产分布,排名稳定性)用于交易手续费和MVRV-Z时间序列预测,采用iTransformer、Flashformer、Flowformer等多种Transformer及循环神经网络模型。结果显示:
- iTransformer在各种预测长度及任务上均表现最佳,且预测精度随历史窗口增长显著提升。
- 组合使用资产分布和排名稳定特征较单一中心性特征带来显著性能增益。
| 特征组合 | iTransformer MSE (交易费) | iTransformer MSE (MVRV-Z) |
|--------------------------|---------------------------|---------------------------|
| 中心性(Centrality) | 0.474 | 0.040 |
| 中心性 + 资产(Asset) | 0.456 | 0.041 |
| 中心性 + 排名(Rank) | 0.435 | 0.040 |
| 中心性 + 资产 + 排名 | 0.435 | 0.039 |


- 该预测框架验证了网络去中心化指标在财务时间序列分析中的有效性,提供面向区块链资产的综合分析思路 [page::5][page::6][page::7][page::8].
- 贡献总结:首次发布覆盖15年完整BTC交易网络数据,提出多维度网络和资产去中心化度量方法,展现BTC去中心化的多阶段演变及对金融指标预测的提升,为区块链资产动态分析和跨链研究奠定数据与方法基础 [page::0][page::9].
深度阅读
金融研究报告详细分析
---
1. 元数据与概览
1.1 报告基本信息
- 标题: A Full-History Network Dataset for BTC Asset Decentralization Profiling
- 作者: Ling Cheng, Qian Shao, Fengzhu Zeng, Feida Zhu(*标识为第一、第二作者,均来自新加坡管理大学)
- 机构: 新加坡管理大学(Singapore Management University)
- 发布时间: 覆盖数据至2024年5月29日,报告形成时间应接近此日期
- 研究主题: 通过网络视角对比特币(BTC)资产去中心化程度进行系统量化与分析
1.2 报告核心论点
报告基于迄今为止首个覆盖2009年比特币创世区块至2024年5月的全历史交易网络数据集,首次系统提出了量化比特币资产去中心化的网络指标体系,涵盖地址级别及社区聚类层面的去中心化刻画,并验证网络性质与去中心化特征能显著提升比特币相关财务指标(如交易费、MVRV-Z值)的预测准确度。作者意图表明,网络结构和资产分布的联合分析,是理解比特币作为分散资产演化的重要视角,也为区块链跨链去中心化比较提供通用框架。
---
2. 逐节深度解读
2.1 引言与背景(页0-1)
- 论文指出比特币自2009年起发展为全球最具代表性的去中心化数字资产,但迄今缺乏用完整交易网络视角量化其资产去中心化的研究,特别是考虑其作为金融资产的特征。
- 论文贡献主要包括:构建全历史BTC交易网络数据集,提出多维度去中心化度量标准(集中论述地址及前五千大持币地址),结合网络性质展开纵向历史演化分析,并应用于重要金融指标预测。
- 限制方面,作者坦承现有聚类算法和钱包标签不足可能导致一定偏差,未来将扩展至更准确的钱包级聚合。
- 基础知识点介绍比特币UTXO交易模型,数据量规模庞大:覆盖2.6亿输入、2.8亿输出,逾14亿独立地址,史无前例地全链覆盖,奠定后续研究基础。
2.2 数据集详情与图构建(页1)
- 数据处理流程细致:基于BTC Core全同步与BlockSci工具,提取完整交易详情,生成从输入地址到输出地址的多重加权有向边,构建BTC交易网络图(N输入 × M输出形成边X)。
- 关键创新在于对UTXO模型的不明确输入输出映射的合理推断,形成面向网络分析的结构化数据。
2.3 网络性质视角的去中心化分析(页2)
- 核心指标: Betweenness (中介中心性),Closeness (接近度中心性),In-degree (入度中心性),PageRank
- 分析展示BTC网络中心性的时间演进呈现几个阶段:
- 2011-2012年Betweenness极高,集中化明显(Mt. Gox相关),随后逐步分散
- Closeness逐渐稳定,In-degree与PageRank呈现中度集中倾向
- 离散率指标衡量中央性指标的分布广度,用于判定整体网络中心性的集中与分散程度。结果提示,BTC去中心化经历波动,最终趋于较宽松的分散状态。
- 图1详解了四个中央性指标的不同百分位数演化及其离散率变化,标明网络影响力逐渐从少数中心节点扩散到更广泛节点。
2.4 基于资产分布的去中心化(页3-4)
- 资产集中度分析: 重点关注每日前5000大地址持币比例及其在不同时期的变化,划分BTC历史为三个阶段:
1. 去中心化提升(2009.1-2010.2): 新用户快速涌入,持币分布更加分散
2. 去中心化下降(2010.2-2012.3): 头部地址持币集中度升高,中小地址比例降低
3. 长期稳定(2012.3至今): 持币比例稳定,资产集中在头部地址保持相对均衡
- 定义资产分布的去中心化度量$DA$基于真实持币累计曲线与理想等分曲线之间面积差值,曲线凸出越大,中心化越严重,$DA$越小。此度量与历史三阶段特征高度吻合,验证指标有效性。
- 排名稳定性分析:利用Spearman系数和保留率评估头部地址排名随时间的波动和成员变动。发现:
- 越短区间成员变动大,排名较稳定
- 越长期排名波动加剧,尤其头部500名成员更稳定
- 较大排名区间(如前5000)成员变动相对一致,推测均为固定角色,如交易所或矿池。
2.5 市场效率视角下的去中心化(页5)
- 引入赫芬达尔-赫希曼指数(HHI)衡量资产集中度,两个聚类方案:
- A1:独立地址为市场主体
- A2:通过社区检测聚类后视为独立实体
- HHI值较低表明更去中心化,基于A2方案观察到市场集中度曾随机构入升高,随后因大型交易所事件分散。
- 标记三个重要历史事件(Mt. Gox崩溃、难度调整等)与HHI指标波动相关,体现市场结构与安全事件的密切联系。
2.6 下游应用——财务预测任务(页5-7)
- 任务涵盖:交易手续费和MVRV-Z值的时间序列预测
- 利用网络中心性、资产分布和排名稳定性等指标作为多维特征输入,基于多种先进时序模型(iTransformer、Flashformer、Flowformer、Reformer、传统Transformer、GRU、LSTM)进行性能对比。
- 主要结论:
- 历史数据长度及预测跨度均对准确率有显著影响,iTransformer表现最好,误差最低
- 结合资产分布及排名稳定性特征显著提升模型表现,说明多维去中心化指标具备预测价值
- LSTM和GRU适合短期预测,长期表现欠佳
- 可视化展示(图6、7)进一步验证全特征模型对实际走势拟合更佳,体现模型鲁棒性。
2.7 相关研究回顾(页6-7)
- 总结此前比特币网络数据集的局限性,主要集中在社交信任、欺诈检测或局部时间段,没有覆盖全历史且缺乏系统的资产去中心化度量
- 先行去中心化定量研究多聚焦于矿工集中度、信息熵等技术指标,较少结合交易网络与资产流动
- 本文通过全链深入交易网络,聚焦资产分布,弥补了现有研究缺口。
2.8 结论与展望(页8)
- 本文提供了首个BTC全历史交易网络数据集与资产去中心化分析框架
- 强调网络性质与资产分布对金融预测的重要性
- 未来计划拓展到其他区块链,结合哈希算力等共识层面指标,实现多层面综合去中心化分析。
---
3. 图表深度解读
3.1 图1:四个中央性指标的时间演进(页2)
- 展示Betweenness、Closeness、In-Degree、PageRank中不同百分位节点中心性的变化,以及对应的指标离散率变化。
- Betweenness呈现早期高峰后迅速下降,说明初期存在超级中介节点,后由更分散节点担当中介。
- Closeness和In-Degree呈现逐渐上涨趋势,说明网络节点间交互效率及资产流入聚焦有所增强。
- PageRank早期集中度高,后趋平稳,反映信任资产流向由少数节点扩散。
- 离散率指标则量化了这些中心性能量的集中与分散程度,具体表现了比特币网络去中心化的复杂波动趋势。

3.2 图2:资产分布及去中心化度量(页4)
- 左图显示不同Top-x地址(500至5000,500递增)累计持币比例的时间演化,反映资产集中度分级结构随时间变化。
- 中图为连续分段比例差值,展现不同排名阶层间持币比例差异的动态,帮助识别市场集中度变化的微妙层次。
- 右图呈实际资产累计分布与理想等分曲线间面积差异的去中心化度量,明显映射历史上去中心化三阶段的边界和演进。
- 该图清晰展示了BTC资产由早期分散到阶段性集中再长期稳定分散的过程。

3.3 图3-4:排名稳定性指标(页4)
- 图3展示不同时间间隔(日、5、10、50、100天)内Top-5000及不同排名等级的Spearman系数,揭示排序稳定性。
- 图4则对应Retention Rate,度量同一排名列表内成员保留比例。
- 结果表明短期内排名成员较频繁变动(新增地址驱动),长期内成员相对稳定,但排名序也发生较大变动。
- 高排名组成员在网络事件中表现更为稳定,推测其为矿池、交易所等固定机构。


3.4 图5:利用HHI指数衡量去中心化(页5)
- 展示两种聚类方案下的去中心化度量随时间变化,橙色(不聚类,独立地址视为主体)保持较高去中心化度,黑色(地址聚类为实体)则呈现明显波动。
- 纵观2010-2024,HHI聚类方案迎来数次大幅波动,对应重要市场事件,反映主导机构及资本聚焦度的历史演变。

3.5 图6-7:财务指标预测表现(页7-8)
- 分别展示14天交易手续费及30天MVRV-Z预测的实际值与基于不同特征组合(单独中心性、中心性+资产分布、中心性+排名、三者结合)的预测曲线
- 预测模型中iTransformer以最优表现显著逼近实际走势,整体趋势说明综合特征提升了预测准确性。
- 误差表格中详细列举多模型、多特征组合、多预测长度的MSE和MAE对比,进一步定量支撑综合指标的有效性。


---
4. 估值分析
本报告核心为交易网络和资产结构的量化分析及预测应用,未涉及传统企业估值模型(如DCF、市盈率、EV/EBITDA等),故无相关估值方法及目标价讨论。
---
5. 风险因素评估
论文虽未专门设立风险分析章节,但在讨论中提及:
- 数据及标签偏差: 钱包标签缺失及启发式聚类可能导致资产归属理解偏差,影响去中心化度计算结果准确性。
- 指标测量局限: 中央性指标在交易网络推断上存在不确定性(输入输出地址间映射问题)。
- 外部事件影响: 大型交易所崩溃、网络安全事件等瞬时因素对网络资产分布和中心度产生剧烈影响。
- 未来计划结合哈希算力等共识层面指标,提供更加全面的去中心化风险评价。
---
6. 批判性视角与细微差别
- 报告整体结构严谨,数据完整,首次实现全链覆盖,极大提升了BTC去中心化研究的量化深度与广度。
- 在资产聚类方面存在一定启发式猜测,缺少基于真实身份的更准确钱包归集方法,可能导致资产中心化程度估计偏低。
- 去中心化度量依赖于具体网络指标选用和采样时点,仍需警惕模型和指标选择的主观性。
- 财务预测部分虽然突出了网络指标的优势,但预测误差仍有提升空间,考虑更多复杂市场变量或多链交叉影响可能更合理。
- 报告多处提到分阶段的去中心化演进,给出指标变化的合理历史解读,但定量阶段划分边界本质上仍有一定经验成分。
---
7. 结论性综合
本文首创性地提供了从2009年比特币创世块至2024年全历史交易数据集以及构建相应的交易网络图和资产分布数据。通过引入多维网络中心性指标(Betweenness、Closeness、In-degree、PageRank)及基于最大资产地址排名稳定性、资产分布凸出偏离(去中心化度)等创新指标,论文全面量化了比特币网络及资产层面的去中心化程度及其历史演变,明确划分为去中心化提升、下降与长期稳定三阶段。
图表分析细致反映了BTC资产流动与网络影响力的动态特征。以HHI法测度的聚类实体去中心化显示市场参与者结构演化及重大事件对集中度的影响。结合金融预测任务,网络指标与资产去中心化多维度特征显著提高了交易手续费及MVRV-Z预测准确率,体现了网络结构指标在量化金融领域的应用潜力。iTransformer模型在预测任务中表现尤为优异,且整合资产分布、排名稳定性特征进一步优化模型表现。
整体上,作者展现了从交易网络出发量化去中心化的新范式,为比特币及其他区块链资产的研究提供了丰富数据支持和深入洞察,具有重要学术价值和应用前景。未来向多链、多层面结合共识与金融指标全面诠释去中心化,将推动生态系统安全和市场行为理解的深化。
---
引用溯源
- 数据集介绍、去中心化度量定义及中心性指标分析详细见[p.0-2]
- 资产分布阶段划分及去中心化曲线基于图2分析[p.3-4]
- 排名稳定性分析对应Spearman系数与保留率[p.4]
- HHI指数与聚类实体分析对应图5及相关段落[p.5]
- 预测任务模型及特征分析详见第七节及图6、7[p.5-8]
---
以上为本报告的详尽分析,涵盖全文所有核心章节和主要图表,解释了技术细节、关键数据及其意义,充分体现了作者创新点和研究价值。