Global Public Sentiment on Decentralized Finance: A Spatiotemporal Analysis of Geo-tagged Tweets from 150 Countries
创建于 更新于
摘要
本报告基于7.4亿条推文中的1.5亿地理标签DeFi相关推文,利用多语言BERT情感分析模型,整合经济和地缘政治数据,采用空间计量、聚类和主题模型技术揭示不同国家对DeFi关注度和情绪的显著差异。研究发现经济发展水平(GDP人均)是DeFi讨论活跃度的关键驱动力,尤其自2015年加密货币(如比特币)价格上涨后影响增强。低收入国家虽经济落后,却展现高关注度及积极情绪,偏重金融安全和暴富梦想;中等收入国家更多结合社交和宗教话题;高收入国家则偏向视DeFi为投机或娱乐工具。该研究为金融包容政策制定及DeFi负责任发展提供数据支撑和理论依据,并通过开源数据和非代码平台推动跨学科研究扩展[page::0][page::1][page::5][page::7][page::10][page::12]
速读内容
- 全球不同国家对DeFi相关推文的关注度和情绪存在明显的空间聚集现象,GDP人均是预测DeFi推文比例的关键经济指标,且2015年后其影响显著增强[page::5][page::6]。


- 2012-2022年逐年地理加权回归(SEM)模型显示,2015年之后GDP增长1%伴随DeFi推文比例增长约0.24%-0.40%区间[page::6]:
| 年份 | 2015 | 2016 | 2017 | 2022 |
|------|------|------|------|------|
| GDP对DeFi推文比率影响 (弹性) | 0.281 | 0.387 | 0.396 | 0.244* |
- Fisher变换相关性分析揭示,比特币等加密货币价格波动增强了GDP与DeFi关注度的相关性,表明经济发达国家受市场波动影响更敏感[page::5]。

- 通过K均值聚类法对145国按照DeFi推文比例、情绪得分和GDP进行分类,最佳分为三类[page::7]:
- Cluster 1(低GDP):最低经济水平,最高DeFi推文注量(0.497%)和最高情感分(0.706)。
- Cluster 2(中GDP):中等经济水平,最低推文比例(0.102%)和最低情感值(0.651)。
- Cluster 3(高GDP):高经济水平,DeFi推文和情感介于两者之间。


- 法规分析显示高GDP国家更可能认可加密货币合法性,法规限制程度与GDP呈负相关[page::8]:

- 不同经济群体国家的主题模型揭示不同DeFi话题关注点,低GDP以金融希望、暴富概念为主;中GDP结合宗教社交;高GDP侧重金融工具和娱乐属性[page::9][page::10]。


- 研究强调Twitter地理标签用户存在人口代表性偏差,尤其在低收入国家和Twitter被禁区域(如中国)影响显著,需结合其他数据源补充[page::9][page::22][page::23]。


- 研究提出DeFi在促进贫困减少(抗腐败、抗通胀)及推动可持续性(绿色能源、以太坊合并)方面的潜力,同时指出加密货币犯罪风险及监管挑战[page::10][page::11]。
- 未来研究建议结合文化因素、利用更先进NLP工具及多平台数据,发展无需编码的KNIME平台降低分析门槛,推动跨学科DeFi研究[page::12][page::23]。

深度阅读
深度详尽分析报告:全球对去中心化金融(DeFi)公众情绪的时空分析——基于150个国家的地理标记推文研究
---
1. 元数据与概览
报告标题: Global Public Sentiment on Decentralized Finance: A Spatiotemporal Analysis of Geo-tagged Tweets from 150 Countries
作者及机构: Yuqi Chen, Yifan Li, Kyrie Zhixuan Zhou, Xiaokang Fu, Lingbo Liu, Shuming Bao, Daniel Sui, Luyao Zhang 等,涉及北京大学、多伦多大学、伊利诺伊大学厄巴纳-香槟分校、哈佛大学、杜克昆山大学等多所国际知名学术机构。
发布日期: 2024年8月–12月间部分研讨会交流,整体研究涵盖2012至2022年数据
研究主题: 运用跨学科计算社科与金融科技方法,依托※地理标记※推文数据,剖析全球公众对区块链及去中心化金融的情绪表达,探索其与国家经济发展及地理特征的关系。
核心论点:
- 在全球范围内,对DeFi的关注度与情绪表现存在显著的空间差异,其背后深受经济发展水平(以GDP人均衡量)、地缘政治因素和加密货币市场动态影响。
- 通过对超过1.5亿条德菲相关推文情感分析,结合法经济与政策法规数据,发现较高经济水平国家对DeFi讨论更活跃,且对加密货币价格上升极为敏感。
- 经济欠发达国家虽然整体GDP较低,却往往表现出更高的关注度和更乐观的情绪,且更偏向于将DeFi视为实现财务安全与暴富机会的工具。
- 中等收入国家则更多将DeFi话题与社会、宗教因素联系起来,而高收入国家多将其视为投资或娱乐工具。
- 研究不仅拓展了社交媒体地理信息的金融应用,也提供了开源数据和无代码分析工具支持,促进学术界及实务界的广泛共同研究。
---
2. 逐节深度解读
2.1 摘要与引言(页码 0-1)
- 介绍了区块链和DeFi的创新性及颠覆性影响,特别是其对全球金融系统的潜在重塑作用,同时指出现有研究多缺少对公众情绪地域分布的关注。
- 提出研究设计:通过BERT多语言模型对7.4亿推文进行情感评分,筛选涉及DeFi相关关键词的1.5亿条地理定位推文。
- 明确研究目的:探究不同国家及地区间关于DeFi的公众关注度和情绪差异,量化经济(GDP)与地理空间因素的影响,以及解读各集群内的主题差异。
- 研究问题设计清晰且系统,覆盖空间变异性(RQ1)、经济影响动态(RQ2)及语义主题差异(RQ3)。
- 通过不同的定量模型(空间计量、聚类分析、主题建模)构建多模态框架。
- 公开数据和代码,体现透明与开放科学理念。
2.2 理论背景与相关文献综述(页码 2)
- DeFi 从区块链技术起步,强调其通过去中心化账本减少传统金融中介带来的交易成本与信用风险,但同样存在技术(智能合约漏洞)、法律、数据安全以及犯罪风险。
- 学界已注意到DeFi用户数和锁仓规模激增,表明其全球化推广与引发学术关注的背景。
- 社交媒体作为即时舆情与金融趋势数据来源被广泛应用于加密货币价格预测,但此前缺少对地理空间差异的深入挖掘。
- 本文旨在填补空间视角缺失的学术空白,将社交媒体用户的地理标记与经济指标、监管政策及主题词进行整合分析。
2.3 数据说明(页码 2-3)
- 地理标记推文: 利用哈佛大学Twitter Archive v2.0版本,覆盖近13年数据,共7.4亿条推文。
- 结合DeFi相关关键词词典(涵盖多语言,表16详述),提取约1.5亿相关推文。
- 推文地理位置信息包括精确GPS坐标和基于地点名称的包围盒,配备空间误差估计,确保空间精度分析的合理性。
- 情感数据: 基于哈佛Twitter Sentiment Geographical Index (TSGI)的多语言BERT情感分析结果,为推文赋予情感分数,覆盖163个国家,跨越2012年至2022年。
- 经济数据: 选用世界银行WDI数据库中2012-2022年平均GDP人均数据,以反映国家经济发展阶段。
- 政策数据: 加入Atlantic Council加密货币监管追踪器中关于60国家的加密货币合法性分级(合法、部分禁、全面禁)。
2.4 方法论分析(页码 3-5)
- 空间自相关检验: 应用Moran's I统计量检测描述性变量(GDP人均、推文比例、情感分数)空间聚集性,发现均呈显著的正空间自相关,指示存在经济地理上的空间集聚效应。
- 对分类变量(国家聚类)的空间聚集性,则采用联合计数统计进行检验,确认不同聚类在地理上的空间显著分布。
- 空间回归模型: 以空间误差模型(SEM)替代普通线性回归,应对空间误差的相关性,强化估计的稳健性。
- 相关性变化趋势: 应用Fisher Z转换调整不同年份样本相关系数,合理比较GDP与DeFi推文比例间的变化趋势。
- 聚类分析: 采用标准K-means算法结合Silhouette指标确定最佳聚类数目(3类),并采用对数变换减少长尾效应。
- 主题建模: 基于Latent Dirichlet Allocation (LDA)算法,提取各国家聚类内DeFi讨论的关键主题词汇,辅助定性理解。
2.5 结果与数据解读(页码 5-9)
2.5.1 空间自相关及地理分布(图1-2,表1)
- 【图1】全球地图展示各国DeFi相关推文占比,颜色越深代表该国关注度越高。高比例集中于印度、越南、伊朗、肯尼亚等国,部分发展中国家和新兴经济体显示异常高的关注度。
- 【图2】对应情感得分地图,越深颜色表明公众情绪越积极。低收入但关注度高的国家情绪普遍较正面;高收入国家虽关注度较高,但情绪相对中等。
- 【表1】Moran's I值均显著正向,GDP人均最高达0.8,说明地理聚集显著,DeFi话题与经济发展空间相关溢出明显。
- 地理自相关反映政策、文化、经济因素的空间集聚效应,支持空间回归分析设计。
2.5.2 经济影响的空间回归分析(表2,图3)
- GDP人均对DeFi相关推文比例的影响自2015年起变得显著且正相关,2017年效应最大,紧随比特币价值暴涨之后。
- 2022年,GDP增长1%带来DeFi推文比例提升约0.244%,但幅度逐年回落,显示趋势非持续上升而呈波动。
- 【图3】Fisher的Z变换系列图展示不同关键词组中GDP关联强弱,综合关键词组、比特币表现出积极相关,Ethereum词汇无显著正相关,显示技术细分议题由更多复杂因素驱动,而非纯粹经济发展。
- 空间误差模型的Lambda系数正向,标志邻近国家DeFi活跃度相互影响,区域溢出效应明显。
2.5.3 国家聚类分析:三类国家特征(图4-7,表3)
- 采用推文比例、平均情感分和GDP人均三维度聚类,最优分为三群。
- Cluster 1(低GDP,异常高DeFi活跃度与正面情绪): 主要为全球最贫困国家,推文关注比例最高(~0.497%),情绪最积极(~0.706),GDP均值仅约3,075美元。推文往往带有实现迅速致富的期待,如"luck"、"hope"等。
- Cluster 2(中GDP,低关注和情绪): GDP均值4,222美元,关注度最低(~0.102%),情绪偏低(~0.651),主题聚焦于社会与宗教关联,如"god"、"lord"。
- Cluster 3(高GDP,中等关注和情绪): GDP高达33,879美元,关注度次高(~0.280%),情感适中(~0.665),多数是发达国家,更多将DeFi视为金融投资或娱乐手段。
- 法律地位相关分析显示,合法加密货币的国家GDP普遍更高,部分或全面禁令的多见于经济欠发达国家。该政策分布与经济水平高度负相关(Spearman相关系数-0.53,显著性高)。
- 中国与韩国作为特殊样例,因中国Twitter被禁,数据偏向小众群体。韩国产生较低关注度,暗示文化因素和监管政策对DeFi话题活跃度的影响。
2.5.4 主题模型及话题演变(图8-10)
- Cluster 1偏重以财富实现和积极乐观情绪带动的具体加密货币项目讨论,带有强烈投机和期盼成分。
- Cluster 2主题围绕社会-宗教议题,将DeFi与信仰和社会关系相连,显示文化关联度强。
- Cluster 3话题多元且成熟,关注金融创新、项目应用和技术普及,较少具备投机性质。
- 主题稳定性通过共识度指标(Coherence Score)验证,Cluster 1表现最高,显示该群体讨论更具聚焦度和连续性。
- 三群均表现对DeFi正面情感,存在共同话题但主题重点迥异,反映经济与文化双重驱动。
2.6 讨论与风险(页码 9-11)
2.6.1 数据与方法局限
- Twitter用户在不同国家分布不均,尤其欠发达国家用户基数偏小,可能导致样本偏差和情感估计偏离全民水平。
- 研究承认该偏差基本符合Twitter用户自身分布特征,但需谨慎解释低覆盖国家的数据。
- 中国Twitter限制尤为明显,国内主流社交媒体如微博数据缺失,造成信息盲区。
- 推文代表的公众情绪与关注存在时滞及非代表性风险。
2.6.2 风险因素
- 智能合约漏洞、数据安全风险和法律责任不确定性均可能带来金融安全隐患。
- 加密货币匿名性加剧洗钱、网络犯罪等风险,挑战监管与治理体系。
- 监管理念差异及法律框架滞后影响DeFi全球规范化进程。
- 环境可持续性问题,尤其PoW共识机制造成能源消耗,引发气候争议。
- 新兴犯罪风险与数字资产安全攻击为业界隐患。
2.6.3 现实意义
- DeFi或有助于发展中国家减贫,通过透明账本降低腐败、为通胀国家提供价值储藏手段。
- 以太坊等生态向PoS机制转换,可缓解能源问题,结合可再生能源助力绿色转型。
- 监管与技术创新应协同推进,加密资产安全管理与反洗钱体系建设迫在眉睫。
2.7 结论(页码 12)
- 明确揭示了DeFi公众情绪和关注度的全球空间不平衡与经济发展水平的紧密联系。
- 虽然所有国家群体均表现对DeFi正面态度,但最贫困国家最为乐观并将其视为财富跃迁工具。
- 未来研究建议引入文化视角,探索文化影响因素对区块链与DeFi接受度的调节作用。
- 鼓励利用更先进自然语言处理技术(如LLMs)及多平台数据整合(包括微博)以拓宽视野。
- 推广非编程可视化工具(如KNIME)降低研究门槛,促进跨学科合作。
---
3. 图表深度解读
图1 & 图2(页5)
- 图1展示了去中心化金融相关推文比例的全球空间分布,印度、伊朗、越南的推文比例显著较高,非洲部分国家也出现高关注区。颜色越深,国家层面公众对DeFi兴趣越浓。
- 图2则呈现情绪色度,颜色越深代表平均情绪更正面,最为积极的正面情绪集中于低收入但高关注国家,这与本文发现该类国家积极将DeFi视为转变命运的途径相契合。
- 这两图联合验证了经济不发达国家在DeFi话题上的高度活跃及乐观情绪,体现了数字金融渗透与经济环境的错综关系。
- 两图也支持空间聚类分析中经济层面分组的合理性和区分度。
表1 空间自相关统计(页6)
- Moran's I在GDP人均接近0.8,强烈的空间自相关说明经济聚集,富裕国家往往邻近或成群聚集。
- 推文比例与情绪虽自相关系数较低但显著,暗示社会媒体对DeFi的关注在地理上存在非随机分布,具备地理依赖性。
- 聚类的Chi-square检验也呈显著,验证三类国家典型的空间分布格局。
- 以1-5邻居测度空间权重的方法表现出空间自相关随邻居距离递减,符合空间经济学预期。
表2 空间误差模型(SEM)回归结果(页6)
- 2012-2014年间GDP对DeFi推文比例不显著,后续2015-2022年间均显著正相关(多数达0.05甚至0.01显著水平)。
- 2017年GDP系数最大(0.396),呼应当年比特币价格爆发阶段,显示经济水平与数字经济参与度的强化关联。
- 空间滞后系数λ正向,代表国家之间存在区域感染效应,即一国的社媒关注受邻国影响。
- 模型拟合优度逐年上升,反映GDP对DeFi关注度的解释力增强。
图3 Fisher’s Z时间序列(页6)
- 综合关键词“Blockchain, NFT, Crypto”组自2015年起与GDP正相关性明显, 体现经济发展促进数字金融讨论普及。
- 对比特定词汇“Bitcoin”表现出较弱但稳定的正相关,“Ethereum”则无显著关联,凸显不同加密资产在公众认知中的差异化社会接受机制。
图4 国家聚类地理示意(页7)
- 显示三类国家按地理分布,低GDP国家主要集中于非洲及南亚部分地区,中GDP分布更分散,发达国家主要在欧洲、北美及部分亚洲。
- 集群划分空间连续性验证经济指标支持划分合理性。
表3 及图5-8 聚类特征详细数据(页7-8)
- 经济指标、推文频率和情感评分均随聚类变化体现典型梯度。
- Cluster 1经济最弱但推文比例最高及情绪最好,是一视觉上的反常现象,揭示贫困国家群体对DeFi存在极乐观心理或投机动因。
- Cluster 3虽经济发达,推文比例与情绪低于Cluster 1,呈现不同的用户群体和讨论主题。
- 融合法规数据显示,经济发达国家中加密货币合法国家比率更高,政策环境可能促使讨论活跃。
图7 加密货币法律地位与GDP的关系
- 清晰演示合法、部分禁、全面禁国家GDP跌宕,突显经济自由度和政策开放的联系。
- HQ图显示高发达国家加密币合法率近30%,较低发达集群低于15%,政策差异明显影响公众参与度。
图8-10 主题演化与差异
- 不同聚类在2015-2023年内主题分布稳定,最低GDP国家聚焦“突然发财”、“运气”等情绪词,表现高投机性。
- 中等GDP多主题围绕宗教、社会连接,最高GDP则为投资与NFT相关技术讨论。
- 主题共识度曲线表现Cluster 1最高,说明最贫穷群体的讨论更为集中和一致。
图9 主题共性与差异(韦恩图)
- 三者均表现出对区块链和金融创新的共同正面认可。
- 最低GDP群体独具“暴富”投机主题,中GDP群体强调社教文化联系,最高GDP群体视加密为娱乐与投资。
- 表明文化、经济和法规环境共同塑造公众视角差异。
附录图表(多语言关键词词典、样本推文、评价指标、额外地理统计图、无代码流程等)
- 关键词词典确保了跨语言、多文化环境下的全面推文筛选和分析。
- 推文样本展示情感评分实际应用(正面、负面、复杂情绪)。
- Silhouette评分及其他统计指标科学验证聚类数目合理。
- KNIME无代码平台流程图降低技术门槛,有利数据民主化。
---
4. 估值分析
本报告为社会经济舆情研究,未涉及传统企业估值,但空间经济回归模型及主题模型的统计推断作用等价于价值分析,构建起内容与经济指标的因果链。空间误差模型及Fisher Z转化为主的方法学保障了评估的地理有效性和时间稳定性。
---
5. 风险因素评估
- 技术性风险:智能合约中存在代码漏洞,可能导致资金损失。
- 法律风险:智能合约法律状态不明确,用户可能因误解合同条款承担法律责任。
- 数据安全:管理员密钥管理不当可能致使资金被盗。
- 依赖外部数据风险: Oracle数据质量影响智能合约执行的可靠性。
- 非法活动风险:DeFi的匿名和去中心属性可能助长洗钱、资金支持犯罪等。
- 环境风险:PoW机制能耗超高,全球气候压力增大。
- 监管风险:各国政策不一致,可能导致市场不确定性及投资者恐慌。
缓解策略未在报告详细展开,但建议结合绿色能源、PoS机制及多边跨国监管合作。
---
6. 批判性视角与细微差别
- 报告高度依赖Twitter数据,可能低估低收入国家的实际关注和情绪,因为这些地方的Twitter渗透率较低。
- 中国数据因Twitter禁令具有代表性不足风险,影响了全球视角的完整性。
- 主题模型基于LDA,未采用近年更先进的LLM模型,可能错失更细腻的语义洞察。
- 聚类分析虽具有统计显著性,但Silhouette平均分约0.31,表明聚类紧密度适中,存在进一步深挖空间。
- 报告未考虑社交媒体虚假信息和机器生成内容对情绪分析的干扰,这在DeFi领域较为敏感。
综合来看,报告严谨而细致,但受限于数据覆盖和模型技术选择,结论在全球普适性层面应谨慎拓展。
---
7. 结论性综合
本报告通过跨时空的150国地理标记推文数据,运用先进多语言BERT情绪分析结合空间计量经济学和文本主题模型,首次系统揭示了全球公众对去中心化金融的关注度与情绪的深刻地域不均衡。主要发现包括:
- 经济发达国家倾向于更活跃、更规范地参与DeFi讨论,但关注度与情绪呈适度正相关,表达较理性务实的投资或娱乐视角。
- 低收入经济体对DeFi表现出高关注和强烈正向情绪,且话题聚焦于“暴富”期待与财务安全,体现DeFi作为社会经济跳板的潜在角色。
- 中等收入国家在关注度和情绪层面均表现相对逊色,且将DeFi话题与文化、社会、宗教更紧密结合。
- 空间自相关分析明确DeFi讨论存在显著邻域效应,经济发展成为核心驱动力,且与加密货币市场波动同步演化。
- 加密货币监管合法性与经济水平呈正相关,政策开放促进数字金融话语权和舆论场活跃。
- 研究提供丰富开源数据及无代码可视化工具,推动跨学科研究普及与实践应用。
本研究不仅深化了区块链与金融社会科学交叉的理解,也为监管政策设计、金融包容性落地及区域数字经济发展提供了科学依据。未来结合文化因素、引入更先进的语义理解模型及拓展其他社交平台数据,将进一步促进全球DeFi普及与健康发展。
---
溯源: 所有分析结论均基于报告正文及图表数据精确摘录与逻辑推演,附带具体页码标注支持:[page::0,1], [page::2,3], [page::4,5], [page::6,7], [page::8,9], [page::10,11], [page::12]
---
如需针对具体章节、图表或方法步骤展开更细致论述,欢迎进一步询问。