Multi Agent Influence Diagrams for DeFi Governance
本报告提出了利用多智能体影响图(MAIDs)模型对去中心化金融(DeFi)治理中的多智能体策略互动进行建模与分析,通过构建简单的治理游戏模拟实际协议,计算Nash均衡,并以MakerDAO为例展示MAID结构,揭示了代理人策略均衡与攻击行为的刻画方法,为深入理解DeFi治理复杂动态提供有力工具[page::0][page::4][page::6][page::7]。
本报告提出了利用多智能体影响图(MAIDs)模型对去中心化金融(DeFi)治理中的多智能体策略互动进行建模与分析,通过构建简单的治理游戏模拟实际协议,计算Nash均衡,并以MakerDAO为例展示MAID结构,揭示了代理人策略均衡与攻击行为的刻画方法,为深入理解DeFi治理复杂动态提供有力工具[page::0][page::4][page::6][page::7]。
本报告展示了联邦学习(FL)技术在保险行业中的应用,通过在不共享原始数据的情况下,多方协作训练模型,有效提升了理赔损失预测的准确率。研究以神经网络为基础架构,探索了水平联邦学习(HFL)增加数据量和垂直联邦学习(VFL)增加特征多样性的效果。实证结果表明,FL框架不仅缓解了数据隐私保护难题,也明显改进了模型性能,促进了保险公司与InsurTech公司基于不同数据源的高效协同。该技术未来可扩展至欺诈检测等其他保险业务领域,为多方、安全、隐私保护的机器学习合作奠定基础 [page::0][page::4][page::13][page::17][page::19]
本报告提出了基于因果推理的时序图神经网络模型CaT-GNN,用于信用卡欺诈检测。模型通过发现和干预阶段,结合时间注意力机制识别因果节点及环境节点,并利用因果混合增强方法提升模型稳健性和可解释性。在多个公开与私有金融数据集上,CaT-GNN显著优于现有最先进方法,验证了因果理论融入图神经网络在金融欺诈检测中的有效性与实用性 [page::0][page::1][page::4][page::6][page::6][page::6][page::6][page::6][page::6][page::6][page::6].
本报告提出并分析了一种名为“Riccati Tontine”的现代累积型养老金共享安排。该方案通过设计基于二阶微分方程(Riccati方程)的时间依赖回收计划,保证代表投资者在死亡或提前退场时“平均”能够收回本金,满足监管要求。与传统养老金不同,Riccati Tontine中的基金投资于与死亡率呈负相关的风险资产,实现寿命风险的有效对冲。数值实验表明,该方案在有限和无限投资池均近似最优,提高了生存者的期望收益并降低风险波动 [page::0][page::2][page::5][page::9][page::10][page::23]
本报告针对金融时间序列中广泛存在的波动聚集现象,提出一种基于尺度混合分布(SMD)的神经网络不确定性量化方法,简化了传统Normal-Inverse-Gamma(NIG)先验的复杂度和过参数化问题。通过设计各参数独立子网络结构并引入模型平均,提高了预测收益和不确定性估计的精准度。在加密货币和美国股票数据集上的实证显示,该方法能有效捕捉波动变化,优于Deep Ensemble和Deep Evidential两种代表性方法,具有良好的理论基础和应用前景 [page::0][page::5][page::16][page::30]
本报告提出了一种基于Instant Hardness Threshold结合逻辑回归(IHT-LR)技术和加权集成学习的混合模型,有效解决了信用卡欺诈检测中数据极度不平衡的问题。通过结合决策树、随机森林、K近邻和多层感知机等多种算法,并运用Grid Search优化权重,模型在公开数据集上实现了100%准确率,显著优于现有方法,展现了强大的欺诈识别能力和实用价值 [page::0][page::6][page::15][page::20][page::22]。
本文针对保险领域中常见的左截断右删失数据,提出基于乘积极限估计量的谱风险度量非参数估计方法,并证明该估计量的渐近正态性及Edgeworth展开,利用自助法提升分布近似精度。模拟研究显示所提估计量在样本量较小和风险厌恶系数较低时优于现有参数及非参数方法,且适用独立及依赖数据情况。最后应用于挪威火险和法国海洋损失数据,验证方法优越性并分析风险特征 [page::0][page::3][page::6][page::8][page::16][page::20][page::21][page::22][page::23][page::24]
本报告提出在动态随机背包环境下的最优机制设计,针对固定资源和战略性买家的二维私有信息,构建了满足激励兼容和个体理性条件的动态最优分配与支付机制。通过贝尔曼方程刻画,设计了惩罚方案以防止买家虚报需求量,并提出基于蒙特卡洛模拟回归和深度确定性策略梯度的两种近似算法,验证了算法的性能差异及应用前景 [page::0][page::1][page::3][page::4][page::5][page::6]
本报告利用高时间与空间分辨率的开源模型,评估了美国电力系统中最优输电扩展对零碳目标减排的作用。结果显示,尽管最优方案将在现有区域间输电容量基础上增加三倍以上,但输电扩展仅能降低7%的清洁能源系统成本,且扩大现有区域内输电可产生大部分节约。储能和发电组合调整可有效替代输电扩展,支撑低成本的零碳电力系统建设。此外,输电扩张改变了不同地区和资源的经济租金分配,可能影响利益相关者支持度 [page::0][page::1][page::5][page::6][page::8][page::9][page::10][page::14][page::20][page::21]
本文推导了包含利率和股息收益率影响的局部波动率模型中期权价格短到期渐近表现,建立了在固定$\rho=(r-q)T$条件下的新型短到期极限,推广了Berestycki-Busca-Florent公式,实现了隐含波动率的眼内波动率和偏度的解析表达,并对CEV模型做了具体应用和数值验证,结果在实用参数范围表现优良 [page::0][page::1][page::4][page::15][page::16][page::17]。
本报告提出了考虑线性价格冲击与二次交易成本的最优清算问题的简洁概率解法,该解法此前未见文献中公布。基于该理论,报告数值分析了在风险资产为分数布朗运动且投资者信息流不同情况下的最优策略及价值,揭示了信息延迟和提前获取对清算价值的显著影响,且该优化框架适用于非半鞅过程的资产价格建模 [page::0][page::1][page::4][page::6]。
本报告提出了“社会环境设计”框架,旨在通过结合投票机制与部分可观测马尔可夫博弈,实现基于AI的自动化政策制定。框架强调政策目标的投票确定、政策制定者设计经济环境,以及多轮迭代中的Stackelberg均衡求解。报告通过一个基于苹果采摘的示例游戏说明了框架,指出了投票偏好聚合、人类行为建模、AI治理、博弈收敛性及大规模仿真等关键挑战,并融合多智能体强化学习和机制设计等前沿方法[page::0][page::4][page::5][page::7][page::8][page::9]。
本报告以大数据和机器学习方法,分析了英国2005-2021年出口二手车辆的碳排放及其对低中收入国家的环境影响。研究发现,出口车辆CO₂排放比报废或本地运行车辆高出13%-53%,且氮氧化物排放严重超标。当前多国缺乏出口车辆排放监管,造成排放“越界转移”,亟需制定统一严格的出口车辆排放标准,以减缓全球运输碳足迹并保护发展中国家空气质量 [page::0][page::1][page::3][page::4]。
本研报针对金融网络中银行债权交易问题,基于Eisenberg-Noe模型,首次系统化研究债权交易的算法复杂性与结构性质。报告重点证明无法实现债权人和买方双方同时严格获益,聚焦债权人正向交易的设计与优化,提出高效算法及近似算法(FPTAS)解决单一及多重债权交易问题,揭示不同支付函数对交易复杂性的本质影响,为缓解系统性风险提供了理论与算法支持[page::0][page::2][page::6][page::14][page::15]。
本报告提出了一种基于深度强化学习(DRL)的动态对冲模型,首次综合考虑有限流动性引起的市场冲击及其时间持久性,模拟结果显示该模型在低流动性环境下优于传统的Delta对冲策略,能够智能调节再平衡动作以控制成本,并内生包含了之前对冲误差和标的资产的漂移影响,显著提升对冲表现与风险控制能力[page::0][page::1][page::6][page::9][page::10]。
本文挑战了传统观点,即当产品为消费者互补品时,上游合并会降低谈判价格,而为替代品时则会上升。研究发现,当中间商销售的产品组合包含除合并供应商产品外的其他商品时,下游的需求关系不一定转移到上游谈判,合并双方的产品可能表现为替代品或互补品,从而导致谈判价格的非直观变化。这一机制解释了上游财团合并在无垄断或排他行为情况下提高价格的现象,并揭示了买方特定价格效应的来源,为反垄断审查提供了新的视角。[page::0][page::1][page::2][page::3][page::12][page::16][page::18]
本报告提出了一种适用于任意局部随机波动模型的蒙特卡洛误差消减新方法,能够显著降低期权定价及希腊字母估计的随机误差,适用范围涵盖欧式及路径依赖、多资产期权。数值实验证明该方法在多种复杂期权类型(如障碍、亚洲、篮子和多资产虹彩期权)下,相较传统蒙特卡洛,误差减少数量级达到数十倍,且适用于希腊值的计算,有效提升计算效率和精度 [page::0][page::8][page::11][page::13]。
本报告研究了大型语言模型(LLM)代理在不同竞争性社会情境中自发形成合作行为的能力,设计了三个跨学科案例(凯恩斯美丽竞赛、贝特朗竞争、紧急疏散)以模拟无指令引导下的合作演化。实验表明,LLM代理能基于上下文及多轮交互,自主调整策略,逐步实现合作,且仿真结果与真实人类行为高度一致,揭示了消除内外部偏见在社会仿真中的重要性,推动了社会科学与人工智能社区对LLM推理能力的新评估标准 [page::0][page::4][page::8]
本报告利用双重深度Q学习(DDQL)方法研究在流动性随时间动态变化且不可直接观测情况下的最优交易执行策略。以Almgren-Chriss框架为基础,模型涵盖临时和永久价格冲击参数的多种确定性及随机动态。实验结果表明,当解析解存在时,算法能有效逼近最优策略;在无法获得精确解的复杂环境下,算法表现优于传统基准策略,体现出强鲁棒性和自适应能力,适用流动性非平稳市场环境[page::0][page::1][page::7][page::14][page::17].
本报告研究投资者在有限交易期内基于部分信息环境下的资产配置问题,提出“信息无差异价格”概念并给出精确表达式,表明该价格受投资者风险厌恶程度和交易信号与噪声比率影响。同时,研究了订阅交易信号信息的最优时机,发现最优订阅时点为确定性时刻。通过单期及连续时间模型验证,报告揭示信息价值随信号强度和投资期限增加而提升,为信息服务定价和策略提供理论支撑,并通过数值实验展示订阅率与价值函数的动态特征 [page::0][page::2][page::3][page::5][page::6][page::9]。