金融研报AI分析

Reinforcement Learning in Non-Markov Market-Making

本报告提出一个基于深度强化学习(Deep RL)的方法,针对具有半马尔可夫和Hawkes跳跃扩散动态的非马尔可夫市场做市(MM)问题。采用Soft Actor-Critic(SAC)算法,在严格模拟了限价单簿(LOB)动态、包含非利好交易填充和库存限制条件下,训练与测试模型表现。结果显示该方法在复杂高维状态和动作空间下有效学习最优做市策略,且纳入不利填充显著影响收益结构,提出了模型的现实应用局限及改进建议[page::0][page::8][page::15][page::19]。

UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models

本报告介绍了UCFE基准,一个用户中心化的金融专业能力测试框架,旨在评估大型语言模型(LLMs)处理复杂现实金融任务的能力。通过结合804名参与者调研反馈与17类多轮任务设计,构建涵盖分析师、金融专业人士、监管人员及普通公众多样需求的数据集。基于LLM-as-Judge方法对11款模型进行评测,并采用Elo评分动态评定性能,结果显示金融领域专用模型显著优于通用模型,且模型评分与人类偏好高度相关(Pearson相关系数0.78),验证了评估方法的有效性。该基准突出用户交互体验与模型适应动态金融环境的能力,为金融领域LLMs的性能衡量和优化提供了开创性框架 [page::0][page::1][page::3][page::5][page::6][page::7]

Approximating Auction Equilibria with Reinforcement Learning∗

本文提出基于自我博弈的强化学习方法,采用策略梯度算法如PPO和神经拟性自我博弈,成功近似多种复杂拍卖环境中的贝叶斯纳什均衡。该方法支持连续动作空间、多维信息状态及多轮拍卖,实现对对称/非对称估值、私有/相互依赖价值拍卖下的稳健出价策略的学习,并通过大量实验验证了其与理论均衡的高度吻合[page::0][page::10][page::11][page::15]。

Corporate Non-Disclosure Disputes: Equilibrium Settlements with a Probabilistic Burden of Proof

本报告基于美股10b-5规则构建了一个动态博弈模型,将安全价格的跌落分解为预期下跌趋势与非披露引起的异常跌落两部分,并提出以异常跌落作为诉讼赔偿基础,避免传统模型因推定管理层必定隐瞒信息而导致的价值过度损耗。模型引入了上限、下限披露门槛和诉讼缓解因子,结合泊松过程的随机信号采样和几何布朗运动对价格演化建模,探讨了企业自愿披露策略与诉讼风险的内在平衡机制,且通过闭式形式定量分析了披露概率、诉讼风险与损害赔偿的关系,提出了基于理性预期与价格趋势的诉讼和披露动态均衡解决方案,为证券信息披露政策设计与司法判罚尺度提供理论参考 [page::0][page::1][page::2][page::3][page::4][page::6][page::8][page::10][page::11][page::12][page::14][page::28][page::29]

COMPETITIVE EQUILIBRIA IN TRADING

本文是关于多交易者竞争中的头寸构建的博弈论分析系列论文的第三篇,系统刻画了多交易者Nash均衡的封闭式解,揭示市场策略为积极型策略,且总实施成本仅与交易者数量及市场冲击参数相关。报告深入分析了交易集中化的价值,发现纯粹的集中化未必降低成本,但战略性集中化可实现成本优化,并提出最优代理交易者数量近似为非本机构交易者数量的结论,为机构交易策略设计提供理论支撑 [page::0][page::1][page::4][page::5][page::10][page::12][page::16][page::19][page::21]

CONCENTRATED SUPERELLIPTICAL MARKET MAKER

本文提出了一种支持负价格交易的自动做市商模型,适用于电力、能源及衍生品市场。通过扩展流动性不变量至负价格域,构建了集中且可偏斜的超椭圆流动性分布,并将其流动性特征、收益表现与传统的Black-Scholes备兑看涨和对数市场评分规则进行了对比,解决了现有AMM无法处理负价资产的问题,开辟了负价格资产链上流动性交易的新路径[page::0][page::1][page::4][page::6].

Delegated portfolio management with random default

本报告研究投资者与基金经理之间的委托代理问题,重点考虑随机违约时间导致的不确定投资期限,提出结合随机控制与BSDE的理论框架,针对违约时间有界及无界两种情况,推导相关的HJB方程并证明最优投资策略与合同的存在性;利用PINNs神经网络算法解决高维数值问题,展示违约时间对投资行为和激励机制的深刻影响,且通过数值实验证实违约时间分布特性对投资策略与激励补偿的差异性[page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24]

IMPACT OF SOCIAL FACTORS ON LOAN DELINQUENCY IN MICROFINANCE

本文基于加纳微型金融数据构建多状态模型,研究宗教、文化等社会因素对微贷逾期行为的影响,首次引入“开斋节”和“长假”变量来量化社会因素对还款行为的动态影响。模型融合时间依赖与非依赖脆弱性,揭示社会因素显著降低逾期风险,但脆弱性模型对预测准确性的提升有限,多种机器学习模型如KTBoost表现优于传统逻辑回归模型。本文提出并比较了优化的Matthews相关系数(OMCC)方法与D&C方法以改进多状态下一步状态预测,反映该领域信用风险评估的新进展 [page::0][page::2][page::3][page::8][page::9][page::10][page::13][page::14][page::15][page::16][page::18]

TIMeSynC: Temporal Intent Modelling with Synchronized Context Encodings for Financial Service Applications

本报告提出了TIMeSynC模型,通过同步编码处理多域异构时间序列数据,解决了不同采样率序列对齐和动态静态序列融合等难题,显著提升金融服务场景下的意图预测准确性。采用基于AliBi的时间编码机制,有效建模多变量、多域序列的时间动态,实验证明该方法在排名召回指标上优于传统基线和复杂特征工程方法 [page::0][page::1][page::3][page::4]。

Optimization of Actuarial Neural Networks with Response Surface Methodology

本文提出基于响应面方法学(RSM)的设计实验框架,对组合精算神经网络(CANN)超参数进行高效优化。通过因子设计和二阶回归模型精确拟合超参数空间,显著降低了计算资源消耗,实现了在少量实验次数下达到接近最优的模型表现。实验证明,当8个超参数全部调优时,最小的0.2458泊松离散偏差在288次试验后获得;而剔除2个不显著超参数时,仅用188次试验即达接近最优,效果损失极小,验证了简化模型优化路径的有效性。[page::0][page::4][page::5][page::7]

Exploring the Interplay of Skewness and Kurtosis: Dynamics in Cryptocurrency Markets Amid the COVID-19 Pandemic

本报告通过对2019年4月至2020年9月期间排名前50的加密货币数据分析,揭示了COVID-19疫情期间加密市场的偏度和峰度动态变化。研究发现疫情时期极端波动频发,偏度与峰度关系呈现加剧态势,验证了二者间的重要交互效应,为投资者提供了额外的风险管理工具。通过多元回归模型,确认疫情对峰度的显著放大作用,揭示市场极端风险集中趋势 [page::0][page::2][page::8][page::9][page::10][page::17][page::18][page::19][page::21]

Sensitivity Analysis of Ruin of an Insurance Company in Ghana

本报告基于加纳一家保险公司2013-2017年的数据,采用Copula方法分析了不同保险产品理赔数量与理赔金额的依赖性,比较了假设理赔独立和依赖情况下破产概率的敏感性。研究发现理赔依赖假设下的破产概率显著高于独立假设且差异在初始储备增大时显著扩大。其中火灾及综合保险产品依赖性最高,机动车保险则表现最优。建议大型保险公司应采用理赔依赖性假设以合理设定初始资本,避免破产概率低估 [page::0][page::4][page::22][page::24][page::28][page::29]

Solving The Dynamic Volatility Fitting Problem: A Deep Reinforcement Learning Approach

本报告提出利用深度强化学习(DRL)方法解决股权衍生品中的动态波动率拟合问题,突破传统确定性算法的局限。通过构建连续状态和动作空间的强化学习框架,采用DDPG和SAC算法训练智能体,实现对市场波动率曲面参数的自适应调整。实验基于静态、序列和拟动态市场情景,结果显示DRL方法与传统优化器拟合效果相当甚至更优,且具有更好的在线学习和动态适应能力。该方法为复杂非线性市场环境下的波动率拟合提供了新的视角与技术路径[page::0][page::1][page::5][page::8][page::14]。

Time-Series Foundation Model for Value-at-Risk Forecasting

本研究首次将预训练的时序基础模型TimesFM应用于VaR(风险价值)预测,针对S&P 100指数及其成分股进行了19年日度回测比较,显示微调后的基础模型在实际与预期违约比率和分位数评分损失上均优于传统GARCH及GAS等计量经济模型,证明了其在金融风险管理中的显著优势与广泛适用性[page::0][page::4][page::25][page::26][page::39].

APROXIMACIÓN PRÁCTICA A LOS MÉTODOS DE SELECCIÓN DE PORTAFOLIOS DE INVERSIÓN

本报告系统介绍了投资组合选择的实用方法,涵盖Markowitz均值-方差模型及基于半方差的模型,详细论述资产期望收益、方差、协方差及相关性的理论基础,并通过遗传算法实现组合优化。报告还考虑了现实交易成本及整数约束,验证了方法的实用性,为实际投资决策提供了科学依据与算法实现示范[page::1][page::5][page::36][page::46][page::56].

European Option Pricing in Regime Switching Framework via Physics-Informed Residual Learning

本文提出基于物理信息残差学习(PIRL)的方法,针对经济状态切换下无封闭解的欧式期权定价问题,结合BSM和Heston模型进行建模及数值实验,展示了PIRL相比传统数值方法的高效性和灵活性,能够快速响应参数变化实现即时预测,极大提升定价效率和适用范围,为状态切换模型的期权估值提供新工具[page::0][page::2][page::12][page::15]。

Backtesting Framework for Concentrated Liquidity Market Makers on Uniswap V3 Decentralized Exchange

本报告开发了一种专门针对Uniswap V3集中流动性市场做市商(CLMM)的回测框架,基于参数化模型近似流动性分布,准确估计流动性池的奖励水平。利用2023年历史数据,回测器误差低于1%,有效支持LP收益的量化评估和策略优化,揭示了不同流动性配置和价格波动对收益的影响,尤其在考虑换手率和池子流动性动态分布时,显著提升了模拟真实池交易量和奖励返还的准确性。本研究还阐述了无常损失的产生机制及其在动态重置策略中的表现,为DeFi中流动性提供策略设计和风险管理提供理论与工具支持。[page::0][page::1][page::5][page::7][page::9][page::11][page::17][page::21][page::26][page::29]

Can GANs Learn the Stylized Facts of Financial Time Series?

本报告研究了生成对抗网络(GANs)在学习金融时间序列中典型统计特征(如随机游走、均值回复、跳跃和时间变异波动率)方面的能力。通过对五种随机过程进行模拟与多种生成器架构比较,发现GANs能捕捉大部分分布特征,但在详细特性如均值回复速度和多变量依赖关系上表现有限。不同架构(如MLP、LSTM、TCN)的性能差异显著,且多变量时间序列的相关性重现尤为困难,提示需针对金融时序设计更复杂的模型结构以提升生成质量 [page::0][page::1][page::3][page::6][page::7]。

NO ARBITRAGE AND THE EXISTENCE OF ACLMMS IN GENERAL DIFFUSION MODELS

本文研究单资产一般扩散市场模型中无套利(NA)条件与绝对连续局部鞅测度(ACLMM)存在性之间的关系。结果表明,有限时间范围内NA等价于存在ACLMM且尺度函数为dc函数且无反射边界;无限时间范围下,则NA与ACLMM存在性等价。此外,通过反例证明这些条件的必要性,揭示了NA与ACLMM概念的精细差别 [page::0][page::1][page::5][page::6][page::9][page::11]。

Parallel Execution Fee Mechanisms

本报告研究了具备全局容量约束的多队列区块链系统中,如何设计定价机制以实现高效资源配置。通过构建多队列排队模型,分析了收入最大化与社会福利最大化下的容量分配差异,并推导了最优相对定价策略,揭示了市场规模、需求弹性及局部与全局拥堵权衡对价格的影响。研究指出,在高并行度、本地拥堵占主导时,基于队列相对需求强度的定价近似福利最优,为并行执行、DAG及多提议者架构下的本地拥堵定价设计提供理论支撑 [page::0][page::2][page::3][page::13][page::15]