比特币公开的链上数据,让我们在“钱如何流动”这件事上第一次拥有了显微镜级的观察工具。
研究背景:从黑箱到透明账本
传统金融体系对个人资金往来讳莫如深,链下交易高度碎片化,宏观研究只能依赖统计抽样或问卷。比特币系统则反之:全部转账记录公开、可批量下载、字段标准化。这一前所未有的“开源资金流”为复杂网络科学与经济物理提供了天然的实验场。
关键词提示
- 比特币交易网络
- 数字资产流动性
- 无标度网络
- 希尔不平等系数
- 线上财富积累
网络搭建:把地址建模成节点
我们获取了截至 2013 年 5 月的完整区块链,得到约 17,354,797 笔交易、覆盖 13,086,528 个地址。同一用户的多个地址不做合并,直接以地址–地址的有向图建立网络:
- 节点:公钥地址
- 有向边:一次付款,附带时间戳与金额
- 权重:付款金额
两个发展阶段的画像
| 阶段 | 时间跨度 | 特征标记 |
|---|---|---|
| 初始期 | 2009–2010-10 | 爱好者实验,价格几乎为零,网络统计量剧烈震荡 |
| 交易期 | 2010-10 后 | MtGox 开放法币兑付,比特币“有价”后开始呈稳定幂律身份 |
幂律体现在入度与出度分布,对数坐标下呈直线;中后期指数稳定在 2.1–2.3 区间,属于典型的无标度网络。
网络拓扑的量化结果
度分布与异质性
- 入度刻画“收到款的地址受欢迎程度”;
- 用 Gini 系数测量不平等:2011 年后长期维持在 0.86 附近,Top 6% 的地址掌握 94% 的比特币余额。
度相关性:负相关即“中枢爱连长尾”
- Pearson 系数 ≈ –0.1,网络呈非一致性连接(disassortative)。
- 通俗解读:大额收款地址往往把钱转给小散户,构成链上“倒金字塔”资金流。
聚类系数
- 稳定于 0.03 左右,超过同等规模随机网络 6 倍,暗示存在局部“小圈子”转账。
财富增长的微观动力学
“马太效应”是否有链上证据?
我们以 30 天 为时间窗,观察同一地址余额变化 ΔB 与其期初余额 B₀ 的关系:
ΔB ∝ B₀^0.25- 指数 < 1 → 次线性偏好依附(sublinear preferential attachment)。
- 结果:财富差距存在,但扩张速度受抑制,余额分布渐趋于拉伸指数,而非无界限的幂律。
- 解释:隐私习惯驱使用户经常做“找零地址”转移,导致大额地址拆分,抑制极致集中。
FAQ:常见疑问一次性回答
- 比特币网络中的“节点”等于用户吗?
不,一个用户可以拥有数千地址;我们研究的粒度是地址级,而非实体级,报告中的“巨鲸”可能是单笔资金池而非单一玩家。 - 研究结果是否能套用到其他加密货币?
理念相通,但唯有链上数据公开完整(如莱特币、狗狗币早年的全账本)可直接复用;隐私币(Monero 等)无法重复。 - 0.86 的 Gini 算高吗?
高于全球主要法币(通常 0.6–0.8),但低于某些法币顶层财富基尼。记住,我们统计的是地址,不直接对等现实人头。 - “中枢爱连长尾”是否具有欺诈风险?
数据表明,交易所、矿池等大节点确实大量向散户打款,这种模式在服务业务逻辑下普遍存在,尚无证据显示系统性风险。 - 怎样才能避免成为“长尾”而向“中枢”迈进?
网络效应意味着“越早积累余额→越早收下一笔”,但统计上也发现随机馈赠、空投事件。市场机会复杂,切忌单一归因于“早买”。 - 数据集公开吗?如何二次开发?
作者早年将整理后的 CSV 与脚本上传至 ELTE 服务器,文件名格式清晰,一行即一条转账。可轻松导入 Pandas、Neo4j 进行衍生研究。
总结:模型之外的未来观察
本文用单一币种、单一时段的区块链证明了:
- 网络连接度与财富积累互为因果,皮尔逊系数达 0.72;
- 次线性偏好依附既拉大早期差距,也预留晚期“再分配”空间;
- 公开账本足以将传统经济物理模型从“假人经济”迁移到可验证的“真人+真钱”场景。
下一步工作若能合并链上与链下(交易所内部订单、衍生品数据),我们或许可以画出全球加密财富的真实拓扑,推动更具落地的政策与风控讨论。