Bitcoin Transaction Behavior Modeling Based on Balance Data
创建于 更新于
摘要
本文基于比特币用户余额数据研究交易行为模式,发现用户余额分布符合对数正态分布且不能完全由Gibrat比例增长定律解释。进一步分析揭示存在“贫穷用户”与“富裕用户”两类行为模式:贫穷用户倾向初期购入少量比特币后逐步全部卖出,富裕用户起始持有较大量比特币,卖出速度随时间减缓并保留部分余额。此动态模型对理解加密资产交易行为及其他金融市场用户行为提供新视角 [page::0][page::1][page::3][page::4][page::5]。
速读内容
- 比特币余额分布模式分析 [page::1]

- 余额分布在包含所有用户时表现出重尾特征。
- 仅活跃交易用户余额分布更符合对数正态模型而非幂律分布。
- 统计检验支持对数正态分布优于幂律分布 [page::2]

- 使用UMPU Wilks检验在绝大部分余额阈值内拒绝幂律分布假设,支持对数正态分布为更适切模型。
- 大额极少部分用户余额占总额低于5%,不影响整体分布结论。
- 余额变化与余额关系的聚类特征及行为识别 [page::2]

- 余额与余额变动散点图揭示三明显行为轨迹:新增持币(竖线)、无交易(横线)和全部卖出(对角线)。
- 非交易用户(横线数据)剔除以提升分析准确性。
- 余额变化与比特币余额幂律关系建模及参数估计 [page::3]

- 平均余额变化与余额幂关系拟合表明漂移项指数α接近1,波动项指数小于1。
- 归一化余额变化(变化率)显示明显双模态:余额小用户平均正增长(买入),余额大用户平均负增长(卖出)。
- 区分贫穷与富裕用户的量化交易模型及时间动态分析 [page::3][page::4][page::5]

- 贫穷用户:漂移和波动项指数均小于1,漂移系数正且随时间降低,表现为先购入后渐进卖出且卖出趋于确定。
- 富裕用户:漂移指数大于1且带负漂移,波动指数小于1,卖出速度随着时间下降,但最终仍保留部分持仓。
- 该双模型在不同时间区间均保持,说明两类用户行为的稳定性和差异性。
- 研究结论及意义 [page::5]
- 比特币用户交易行为突破经典Gibrat比例增长定律,体现更复杂的行为分层。
- 本文建模揭示了基于余额规模的行为差异,为加密资产及其他金融市场的用户行为研究和建模提供理论支持和方法启示。
深度阅读
金融研究报告详细分析报告
报告标题:Bitcoin Transaction Behavior Modeling Based on Balance Data
作者:Yu Zhang、Claudio Tessone
发布机构:苏黎世大学区块链与分布式账本技术组
发布日期:未明确(根据文内数据,研究时间点主要为2016-2019年)
研究主题:基于比特币(Bitcoin)用户余额数据对其交易行为的建模与机制分析
---
1. 元数据与概览
本报告旨在探讨比特币用户余额分布的产生机制及其交易行为规律。通过分析2016年及2019年两段典型时间点的比特币余额数据,确认余额分布符合对数正态分布(log-normal),而非传统的幂律分布(power-law)。作者试图将Gibrat的比例增长法则——此规律曾成功解释城市规模及词频分布——用于解释比特币余额增减的动力学。但研究发现,余额变化的漂移和波动项的指数参数均偏离1,意味着该法则并不能完全解释余额分布的形成。在此基础上进一步剖析用户行为特征,揭示用户分为两类:“贫穷用户”与“富裕用户”,二者的买卖行为截然不同。报告的核心论点强调:
- 比特币用户余额分布更适合用对数正态模型描述,非幂律。
- 用户的余额动态遵循不同的增长模型,指数参数不完全为1,表明非标准的Gibrat法则。
- 贫穷用户倾向先买入更多比特币,随后逐步卖出全部余额,且售出概率随时间增加。
- 富裕用户则随时间卖出速度递减,将至少持有部分最初余额,且余额越高,卖出比例和确定性越大。
- 该行为分析模型能为理解比特币及其他金融市场用户行为提供新视角。
此报告无直接评估评级与目标价,属于机制性和行为特征研究报告,主要价值在于为金融数据分析及市场行为建模提供理论依据和新方法。[page::0,1,2,3,4,5]
---
2. 逐节深度解读
2.1 引言与问题陈述(Introduction)
- 报告从比特币交易网络数据切入,强调UTXO机制使得追踪每笔未花费交易输出成为可能,能合理按照用户(非单地址)聚类。
- 行业内曾发现交易网络的入度和出度遵循幂律分布,可通过“线性度优先连接”(linear preferential attachment)理论解释,但余额分布机制未完全阐明。
- 文章提出关键研究问题:用户余额变化是否满足形式为
$$ dSi = Si^\alpha \cdot \mu \cdot dt + Si^\alpha \cdot \sigma \cdot dwi $$
中$\alpha=1$的比例增长模型。若成立,说明交易动态符合Gibrat法则;否则需要更复杂模型。
- 引入了用户分类概念,分为两类:有交易的用户组A和无交易的用户组B,二者余额变化统计意义有异,需要分别处理。该切分提高后续分析的准确性。
2.2 数据描述与初探(Data Description and Exploration)
- 选定2016-01-23作为样本日期,因比特币网络当时较为成熟且较为静态。
- 图1展现了余额概率分布函数(PDF),左图涵盖全用户,右图仅计活跃交易用户,均表现为重尾分布。
- 使用Python的power-law库拟合数据,比较幂律与对数正态两种分布,发现对数正态拟合效果优于单纯幂律拟合。
- 利用UMPU Wilks统计检验(图3)验证分布形态,结果显示在余额较小及中间区间,幂律假设被拒绝,支持对数正态替代模型,只有极高余额少数用户区间存在幂律可能,但这部分仅占总余额5%。
- 多年跨度对照发现2019年余额分布仍保持对数正态特性,表明其稳定性,增强研究意义。
2.3 数据聚类与结构分析(Data Clustering and Structure)
- 余额与余额变化呈现多类聚集表现(图4散点图,覆盖半年度变动)。
- 确认存在明显的三条数据聚集线:垂直线(小余额但新增大量余额用户)、水平线(余额未变的用户,推断无交易)、对角线(全仓卖出用户)。
- 水平线数据点被剔除,避免对平稳期无交易用户带来干扰。
- 尽管尝试了K-Means及高斯混合模型聚类,数据非高斯分布且结构复杂导致传统聚类失效。
2.4 机制探索(Mechanism Detection)
- 假设余额变化可用GBM(几何布朗运动)建模,基本形式是
$$
d Si = Si^\alpha \mu dt + Si^\alpha \sigma dwi
$$
其中$\alpha$是关键参数,反映比例关系程度。
- 根据理论,均值和标准差应满足
$$
E(dSi) = Si^\alpha \mu dt, \quad \sigma(dSi) = Si^\alpha \sigma \sqrt{dt}
$$
- 使用了指数分箱法处理余额跨度巨大带来的数值稀疏,保证统计稳健性。
- 图5显示,均值曲线拟合$\alpha$ 接近1的比例增长模型较合理,但波动率拟合$\alpha$ 明显小于1,二者不一致。
- 将余额变化归一化成相对变化率$dSi / Si$,理论上若$\alpha=1$,该值的均值和方差应与余额无关。
- 图6揭示两个用户行为模式:
- 对于余额低于某阈值$S^$的用户("贫穷用户",图中蓝点),其平均相对变化率为正,即$\mu>0$且指数$\alpha<1$,且波动率与余额呈负相关。说明这类用户偏向买入后逐步卖出。
- 对余额高于$S^$的用户("富裕用户",红点),平均相对变化率为负,$\mu<0$,且漂移项指数$\alpha \gtrapprox 1$,但波动率项指数仍小于1,表明卖出速度变慢且不会完全清仓。
- 因此作者在(4)式中提出了分段拟合的两组随机微分方程,反映不同的增长规律和行为模式。
2.5 时间尺度动态与参数演变
- 通过改变时间间隔$dt$,作者观察参数随时间变化趋势(图7)。
- 对贫穷用户来说:
- 漂移项$\mu dt$随$dt$增大单调下降趋近零,说明初期净买入意愿强,随后趋于卖出,由此驱动卖出全过程。
- 指数$\alpha{drift} <1$且随时间变化,$\alpha{volatility}$较为稳定。
- 波动率随时间下降,显示卖出行为趋向确定性。
- 对富裕用户来说:
- 漂移项$\mu dt$为负且随时间下降,表明持续卖出趋势。
- $\alpha{drift} >1$且稳定,波动率指数小于1且随时间递减,强调卖出速度下降但最终会保留小部分持仓。
- 综合两类行为的模型在动态演化过程中均有稳定性,且刻画出用户的财务行为差异性。
2.6 总结与讨论
- 报告确认比特币用户余额分布符合对数正态,对Gibrat比例增长模型进行了深刻的实证检验,发现其漂移和波动项指数参数偏离1,不完全支持原生Gibrat法则。
- 阐释比特币用户交易行为存在两个截然不同的群体:富裕用户偏向逐步卖出且部分持有,贫穷用户初期买入后未来确定性卖出。
- 方法依赖UTXO链上数据,可精细追踪转账流向,提供宏观股权分布可解释模型以及微观行为基础。报道强调该研究的开创性与潜在应用价值。
- 给予后续研究对传统金融市场及其他数字资产市场动态提供参考框架。
---
3. 图表深度解读
图1:比特币余额分布直方图(2016-01-23)
- 图示两个面板,左为包含所有用户,右为包含仅活跃交易用户的余额概率密度分布(PDF)。
- 均在双对数坐标系下呈重尾现象,说明大部分用户余额较小,但存在少量超大余额。
- 活跃用户分布右图较左图平滑,表明去除无交易用户后,数据更能反映真实流动性。
- 支持余额非均匀、集中度高的市场特性。
图2:对数正态与幂律拟合比较
- 对比所有用户及仅活跃用户两组数据,对数正态拟合曲线始终优于幂律曲线,说明对数正态模型更合理。
- 绿线为实测数据,橙线幂律拟合,蓝线为对数正态拟合。
- 对数正态模型在中间余额区间拟合优异,幂律高估尾部概率。
图3:UMPU Wilks检验p值图
- 左图:p值对阈值排名的函数,p值低于0.01线说明拒绝幂律假设。
- 右图:p值对余额阈值函数,除最高余额少数点区域,幂律假设几乎被拒绝。
- 同时显示该余额阈值以上的余额比例(蓝线),低余额部分余额比例大,确认对数正态符合绝大部分数据。
图4:余额与余额变化散点图(半年度)
- 四个子图分别从不同尺度观察整体余额与余额变动关系
- 三条明显线段:
- 垂直线(余额接近0,余额变化大):新增用户或小额用户大量买入
- 水平线(余额不变):无交易用户,去除
- 对角线(余额变化=负余额):全仓卖出用户
- 指示用户交易行为的多样性和复杂性。
图5:余额与平均余额变化及标准差关系
- 左图:均值-|平均余额变化|与余额关系,比例增长$\alpha=1$(红线)与拟合曲线(绿线)接近。
- 右图:对数坐标下波动率与余额关系,拟合显示波动率指数$\alpha$约为0.739,低于1。
- 说明漂移和波动项的尺度依赖性不同,提示需区分处理。
图6:平均相对变化率与余额关系(对数对数坐标)
- 蓝点代表平均$\frac{dS
- 左图:漂移项指数对贫穷用户显著小于1,富裕用户约等于或略大于1。
- 右图:波动率指数对所有用户均小于1,但随用户类别略有差异。
- 这两套指数表明贫穷和富裕用户余额动态分别遵循不同增长规律。
图7:不同时间间隔$dt$对应参数变化趋势
- 7a示意参数计算过程
- 7b贫穷用户:漂移项指数$\alpha$随$dt$下降但仍小于1,漂移项$\mu dt$单调递减趋近0,波动率随时间下降。
- 7c富裕用户:漂移项指数$\alpha$稳定大于1,漂移项$\mu dt$为负且递减,波动率下降。
- 该图详尽展示随着观察时间尺度改变,用户行为动态特征的整体趋势,为建模提供动态参数基础。
---
4. 估值分析
本报告属于行为和机制研究范畴,未涉及典型的估值方法如DCF、市盈率等财务估值工具,因此估值分析部分为空。但其模型对理解用户资金流动和持仓结构稳定性有重要启发,为未来基于用户行为的资产价值动态建模奠定基础。
---
5. 风险因素评估
原文未单独列明风险因素,但可以从模型可靠性及数据局限性隐含分析如下:
- 地址分类不足:仅聚焦用户余额存在分组不确定,如多地址归一问题可能带偏差。
- 数据滞后及样本选取风险:研究基于特定时间点,市场机制随时间发展或波动影响稳健性。
- 模型假设限制:GBM假设依赖对指数参数调整,该模型无法完全捕捉更复杂的市场冲击与行为异质性。
- 测试统计依赖大样本与拟合方法,少数极端用户数据拟合存在不确定性。
报告虽未提出缓解策略,但分组区分与多时间尺度参数考察降低了单一模型解释风险。
---
6. 批判性视角与细微差别
- 报告充分使用统计检验强化结论,但$\alpha$指数在漂移和波动项异质,表明模型简化有待谨慎对待。
- 模型对“贫穷”与“富裕”用户分类确定性依赖阈值$S^*$,该阈值的选择及稳定性或随时间变化,可能影响结论泛化。
- 对富裕用户持币意愿的描述在模型中表现为残余持有,实际行为可能受宏观市场因素影响更多。
- 报告强调对数正态优于幂律但对极端尾部数据拟合仍存在一定争议,未来可结合更多高频行为数据丰富模型。
- 并未充分讨论溢出效应如钱包安全、市场制度变化对行为的影响。
整体,结论较为稳健,且自觉指出前人方法不足,开辟了基于交易行为的新增解释路径。
---
7. 结论性综合
本报告针对比特币用户的余额分布及交易行为进行了系统性分析,核心结论如下:
- 余额分布特征:比特币余额呈明显的对数正态分布,优于传统的幂律模型解释。 这一发现经多时间点、不同交易活跃度的用户分类数据检验稳固,并通过UMPU Wilks测试得以统计支持。[page::0,1,2]
- 交易行为建模:比特币用户的余额变化不完全符合经典的Gibrat比例增长法则。通过对漂移项和波动项万能指数参数的细致拟合,发现两类用户模型截然不同。贫穷用户表现为先买后卖,且清仓概率随时间递增;富裕用户卖出速度递减,且长时间保持少量持仓。[page::3,4,5]
- 时间动态分析:对时间间隔参数的追踪揭示,模型参数呈现随时间尺度变化的趋势,增强理解用户行为的动态性与非平稳特征,为未来行为金融学和资产流动性建模提供实证依据。[page::4,5]
- 实际意义:本研究利用UTXO机制对链上数据进行罗列与分析,为交易行为提供了精细视角,揭示了金融用户行为模式的复杂结构,模型适用性或可推广至其他加密资产与传统金融市场。
综上,作者在报告中展现了比特币用户余额和交易行为多层次、分段动态特征,深化了对数字货币市场内在机制的理解,且以严密数据分析支持结论,贡献了新的理论观点和建模工具。对研究比特币以及更广泛的数字资产交易行为提供了坚实起点。[page::0,1,2,3,4,5]
---
参考图示
比特币余额分布(图1)

比特币余额拟合对比(图2)

UMPU Wilks测试(图3)

余额与余额变化散点图(图4)

余额与余额变化均值及标准差拟合(图5)

相对余额变化均值及波动(图6)

参数随时间间隔变化趋势(图7)

---
【全文分析完毕】