MARS: A FINANCIAL MARKET SIMULATION ENGINE POWERED BY GENERATIVE FOUNDATION MODEL
创建于 更新于
摘要
本报告提出Large Market Model (LMM),一种用于订单级别金融市场模拟的生成式基础模型,搭载于MarS引擎中,实现高分辨率、可控且交互式的市场轨迹生成。通过大规模订单及订单批数据训练,LMM表现出良好的扩展性。MarS支持市场预测、风险检测、市场影响分析及强化学习智能体训练,展现出改变金融行业多任务范式的潜力。关键实验证实模拟市场轨迹高度真实且符合多项市场统计特征,同时支持用户实时注入订单影响市场行为,[page::0][page::1][page::4][page::5][page::6][page::7][page::8][page::9]
速读内容
- MarS引擎整体架构与功能 [page::2]

- 由Large Market Model (LMM)驱动,通过订单序列和批次序列生成市场行为。
- 支持多种应用:市场预测、风险检测、“假如”分析及强化学习环境。
- 结合模拟清算所,实现交互式订单匹配和市场轨迹动态生成。
- LMM模型设计及生成机制 [page::3][page::4][page::5]
- 订单模型使用因果Transformer,将订单及其对应LOB信息编码为单一token;订单批次模型使用自动回归Transformer学习分钟级订单图像序列。
- 订单批次转换为多通道RGB“订单图像”,方便表达宏观市场行为。
- 采用集成模型融合订单和订单批次模型优势,平衡微观交互和宏观趋势。



- MarS模拟的真实性评估 [page::6]

- 模拟数据复现聚合正态性、无自相关性及波动率簇聚等市场统计规律。
- 验证模拟价格变动分布和真实市场高度一致,确保模拟的高保真度。
- 交互式和可控模拟验证 [page::6]

- 用户注入订单能产生合理的市场影响,模拟价格轨迹与真实变化趋势吻合。
- 模拟的市场冲击符合经典Square-Root-Law,验证交互影响的正确性。
- 控制信号引入提升与真实市场重放曲线的相关度(由0.23增至0.47),展现模拟可控性。
- 量化因子构建与量化策略训练 [page::8][page::27][page::32][page::33][page::34]
- 采用强化学习训练可调参数的TWAP策略智能代理,提高交易效率与价格优势,训练过程带来显著收益提升。

- 基于MarS生成的市场冲击合成数据,发现超越经典Square-Root-Law的三个新市场冲击因子:resiliency、LOBpressure和LOBdepth。




- 下游应用示例及对比 [page::7][page::34]
- MarS在市场趋势预测中优于DeepLOB,提升预测准确度及多步趋势预测能力。
- 模拟环境支持多任务,包括市场监管异常检测和基于生成市场实现的强化学习,构建更精细的交易策略训练环境。


- 评估MarS复现11项市场统计特性,整体吻合良好,缺失部分反映现代市场特征变化 [page::28][page::29][page::30][page::31]





- “What if”分析平台功能,支持通过自然语言或历史走势描述生成目标市场情景,灵活评估策略与风险 [page::22][page::23][page::24][page::25]

- MarS框架优势总结 [page::1][page::7]
- 极致细粒度至订单级别,支持真实数据驱动、多场景适用、交互与控制并重。
- 作为金融市场的“世界模型”,MarS代表了基于生成基础模型的仿真范式革命。
深度阅读
报告详细分析:《MARS: A FINANCIAL MARKET SIMULATION ENGINE POWERED BY GENERATIVE FOUNDATION MODEL》
---
1. 元数据与概览
- 标题:MARS: A FINANCIAL MARKET SIMULATION ENGINE POWERED BY GENERATIVE FOUNDATION MODEL
- 作者:Junjie Li, Yang Liu, Weiqing Liu, Shikai Fang, Lewen Wang, Chang Xu, Jiang Bian
- 发布机构:Microsoft Research Asia
- 发布内容概要:该报告介绍了基于生成式基础模型构建的金融市场仿真引擎MarS,及其核心生成模型Large Market Model (LMM)。MarS能够高分辨率、交互式地模拟以订单为单位的金融市场微观行为,支持市场预测、异常检测、市场影响分析和智能体强化学习环境等多种金融应用场景。报告整体定位为金融市场模拟领域内的范式转变工具。
- 核心论点:
- 现有金融市场仿真方法在精细度、交互性和现实感方面存在缺口;
- 结合细粒度结构化金融数据(尤其是订单流和限价单簿数据,LOB)的生成式模型是弥补这一缺口的有效途径;
- LMM作为订单级别的生成式基础模型,其规模和数据扩充性能优越;
- MarS引擎基于LMM,具备可控、交互和高保真度,服务于金融风险管理、策略训练等多领域需求;
- 报告配套开源代码,促进行业应用和同行采纳。
整体目标是展示一种基于生成模型的金融市场模拟范式,推动多元金融应用的智能化发展。
---
2. 逐节深度解读
2.1 报告摘要与引言
- 摘要核心:生成模型广泛用于文本、视觉领域的模拟,而金融市场虚拟世界的生成模拟相对匮乏。LMM提出基于订单级别的生成模型,对金融市场中参与者复杂行为进行仿真。MarS围绕LMM构建,支持市场轨迹生成、风险检测、策略分析和智能体训练,展示了生成模型在金融市场的巨大潜力。
- 引言重点:
- 生成模型优势:可以模拟复杂的现实世界行为,支持无风险训练;
- 金融市场具有高度复杂的参与者网络和市场微观结构,仿真需求尖锐;
- 现有统计和基于agent的方法不能充分涵盖订单层面的交互和影响;
- 集成丰富结构化数据(如LOB)可提升仿真精度。
该部分设定了金融市场仿真的背景、挑战与解决方案侧重点。
---
2.2 MarS设计与LMM模型构建
- 系统设计原则:
- 高分辨率:基于成交订单和订单批次,准确复制市场行为轨迹;
- 可控性:用户可调节不同市场场景,如极端波动、压力测试;
- 交互性:允许用户主动下注订单以观察市场反馈。
- LMM模型结构:
- 订单模型(Order Model):采用因果Transformer,基于订单及相应LOB信息进行tokenization,捕获细粒度的订单生成模式;
- 订单批次模型(Order-Batch Model):以时间为维度,对整批订单造型为多通道RGB图像,采用VQ-VAE进行视觉风格token化,捕获宏观市场动态;
- 融合模型(Ensemble Model):结合订单和订单批次模型,平衡短期市场冲击与长期趋势,提升生成正确性和可控性。
- 订单与LOB Tokenization公式为:
\[
Embi = emb(orderi) + linear\proj(LOBi^{volumes}) + emb(LOB_i^{mid-price})
\]
其中,order包含类型(买单、卖单、取消)、价格、成交量及间隔,LOB反映10级买卖量及中间价格tick变化。
- 订单批次图像转换:将订单批次转化为带有“买盘”、“卖盘”和“撤单”三通道的32x32像素图,不同像素值代表相同属性订单计数,实现市场行为的结构化视觉表示。
- 条件生成任务设计:
- 根据历史订单序列、用户下单、策略描述(DES TEXT)和市场撮合规则(MTCH R)进行序列生成;
- 支持模拟不同市场状态、策略执行后的订单生成。
- LMM模型的可扩展性:通过实验验证,在更大数据规模和模型规模下,训练表现持续提升,遵循经典基础模型的“Scaling Laws”。
---
2.3 MarS仿真引擎与生成流程
- 集成订单生成和模拟撮合清算,实时处理用户订单和市场订单生成,中间状态不断反馈,构成闭环;
- 生成机制由两个原则指导:
- “基于已实现的现实塑造未来”——依赖即时匹配市场影响生成下一批订单;
- “从各种可能未来中择优”——同一时刻生成多组订单批次,选择最符合控制信号的结果。
- 订单生成通过订单模型(O)、订单批次模型(OB)、和融合模型(E)三者分层完成,保障细粒度反馈和宏观趋势统一。
- 图4示意描述生成流程及模型协作,体现多模型联合训练和推断的机制。
---
3. 实验验证
3.1 真实感评估
- 通过对比历史数据中市场的主要“典型事实”(Stylized facts),包括:
- 累积正态性(Aggregational Gaussianity);
- 无自相关性(Absence of Auto-correlations);
- 波动聚集性(Volatility Clustering);
- 结果(图5)显示MarS生成数据高度符合这些统计特征,模拟市场行为逼真。
3.2 交互性实验
- Emulate TWAP(一种典型时间加权均价算法)策略代理下单情景,MarS能明显复制出由于该策略执行带来的价格轨迹影响;
- 验证满足广泛认可的市场影响规律——Square-Root-Law($\Delta \propto \sigma \sqrt{Q/V}$),合成数据中价格变动与交易规模根号关系保持良好的一致性(图6b);
- 交互与控制信号结合效果体现,能够在含/不含控制或交互的不同配置下,实现不同程度上的市场影响模拟。
3.3 可控性模拟
- 支持利用真实市场复盘曲线作为控制信号引导订单生成,极大提升模拟结构化预测准确度(图6c);
- 通过自然语言提示(prompt)结合大语言模型接口,实现对市场情景文字描述的条件模拟,兼容灵活多样的市场测试。
---
4. 应用场景详细剖析
4.1 预测
- 使用预测未来时间点一定时间窗口内价格涨跌趋势的多分类任务对比:
- MarS/LMM通过模拟生成128条市场轨迹,并统计汇总达成预测,较传统DeepLOB模型表现更优;
- 模型参数规模增大(1.02亿 > 0.22亿)与性能正相关(图7a)。
4.2 风险检测
- 以中国证监会( CSRC )披露的典型市场操纵案例作为实验对象;
- 观察仿真与历史市场数据的价格差价分布相似度;
- 在正常状态保持较高相似度(>0.87),操纵时期相似度大幅下滑,显示模拟识别出流动性受扰动信号(图8),为检测异常交易提供新思路。
4.3 “假设分析”——市场冲击研究
- 用仿真数据进行市场冲击科学发现,采用遗传算法和符号回归,挖掘出传统Square-Root-Law之外的新影响因子:市场弹性(resiliency),LOB压力,LOB深度;
- 建立基于ODE的长周期价格冲击衰减模型,结合这些因子对市场冲击进行动态建模,可更好拟合真实价格影响轨迹(图9 & 26)。
4.4 强化学习环境
- MarS因其真实性和交互性,适合训练强化学习智能体,针对买入执行策略进行RL训练实验;
- 智能体动作设计基于可调TWAP策略,奖励函数考虑成交率和价格优势;
- 训练曲线表现智能体从基础策略出发,价格优势显著提升(图7b),验证MarS作为虚拟训练环境的有效性。
---
3. 图表深度解读
图1(页2)
- 内容:MarS整体框架示意。包括以历史订单数据训练的LMM,实时模拟过程中生成订单序列、结合用户交互订单,在模拟清算中心撮合生成模拟市场轨迹,支持预测、检测、分析和智能体训练等下游任务。
- 分析:突出展现了生成模型是整个仿真的基础,且能适应场景描述控制输入和用户交互,整合成多层的市场状态。展示了从微观订单到宏观市场多级模拟的全景视角。
图2(页3)
- 内容:订单批次转化为三通道RGB图像,三种订单(买、卖、撤销)分别对应不同颜色,通过价格槽与量槽在图像坐标上展示;
- 分析:将订单批次转化为图形数据,降低了序列长度的同时引入了空间结构,更便于利用视觉模型提取规律,有效融合时间和空间市场特征。
图3(页4)
- 内容:LMM两个模型的Scaling Curve表现(训练样本数 vs 验证误差loss),不同模型参数规模的比较;
- 分析:数据与模型规模增加带来loss下降趋势,验证LMM具备典型的基础模型扩展前景,表明未来可通过更大模型和数据提升表现。
图4(页5)
- 内容:订单层面与订单批次层面联合生成机制流程图;
- 分析:清晰展现生成机制如何结合预测多个候选订单批次,选取最符合控制信号的序列,由订单模型在微观层面精修具体订单,实现用户交互订单的市场影响反馈,形成高一致性的仿真闭环。
图5(页6)
- 内容:三大典型市场特征(累积正态分布、无自相关、波动聚集)的模拟验证对比;
- 分析:模拟数据广泛贴合实盘数据,基础特征统计吻合良好,体现MarS具备稳健市场现实感。
图6(页6)
- 内容:交互模拟多个方面(a)模拟代理交易触发的价格影响轨迹;(b)模拟数据验证Square-Root-Law;(c)控制信号对价格相关性影响的热力图;
- 分析:验证交互特点和控价能力,证明人工注入/控制的订单行为能够合理影响市场表现且模拟可度量与真实规律相符。
图7(页8)
- 内容:(a)趋势预测准确率趋势(分钟展开)对比传统模型和两种规模LMM版本;(b)RL智能体训练中价格优势改进趋势;
- 分析:模拟式预测在预测能力上显著领先传统单步模型,基础模型规模增长推动性能提升; RL效果展示了环境有效性。
图8(页8)
- 内容:三阶段市场操纵期间的价差分布对比及相似性度量;
- 分析:操纵期模拟与实盘差异显著,表明仿真在检测异常市场机制方面具备潜力。
图9(页9)
- 内容:新增市场冲击因子“弹性”的关系图、以及长周期影响ODE模型权重热力图;
- 分析:通过仿真数据发现新的影响指标及其相互作用,丰富市场影响理论。
图11(页18)
- 内容:是否纳入LOB信息对模型训练loss曲线影响;
- 分析:以LOB信息联合token显著提升Order Model的训练表现,强调市场微结构信息的关键性。
图12(页19)
- 内容:平均每分钟订单的日内分布,展示U型分布和定时聚集规律;
- 分析:说明建设Order-Batch模型的动机,突出市场行为在时间维度的周期性及批次特征。
图13(页20)
- 内容:Order-Batch模型基于两阶段架构的训练流程图,结合视觉编码与序列生成;
- 分析:通过将订单批次转化为图像token序列并用Transformer学习,实现了宏观订单模式拟合。
图14(页22)
- 内容:融合模型训练过程loss收敛曲线,表现比单一订单模型更优;
- 分析:验证融合不同模型输出提升订单位生成质量和平衡宏观趋势强制指标。
图15(页23)
- 内容:通过GPT生成的示例代码,捕获“剧烈下跌”场景;
- 分析:展示自然语言场景描述自动转成数据筛选条件,结合LLM赋能控制策略。
图16(页25)
- 内容:三大模拟场景(剧烈下跌、剧烈上涨、趋势反转)在真实与模拟价格上的对比案例;
- 分析:直观体现MarS在契合指定金融场景模拟的能力。
图17-21(页29-31)
- 内容:针对Cont提出的11项典型市场特征进行系统对比分析,包括自相关、重尾、波动聚集、杠杆效应等;
- 分析:MarS覆盖大部分市场真实统计特征,较少数如杠杆效应的差异反映现代市场演变,验证整体模型生成的市场行为高度写实可靠。
图22(页31)
- 内容:以买单比例为例的分布相似度及三分类准确率矩阵;
- 意义:说明模拟数据能够准确重构关键市场行为指标的统计分布及动态类别,支持下游任务。
图23(页32)
- 内容:不同代理配置下市场影响完成率与价格影响动态图;
- 分析:模拟不同交易策略带来的成交和冲击差异,彰显MarS支持多策略测试。
图24-26(页33-34)
- 内容:新发现市场影响因子与经典因子相关性热力图和长时序市场影响ODE拟合曲线;
- 分析:进一步深化了市场冲击机制定量建模的科学依据,展示了仿真数据驱动的理论革新。
---
4. 估值分析
本报告为基础金融模型与仿真平台的技术研发文档,未涉及传统意义上的公司估值、财务预测等内容,因此无估值分析部分。
---
5. 风险因素评估
- 内在风险:
- 模型基于历史订单和LOB数据训练,可能无法捕获未来市场结构的突变或极端未知事件;
- 模型对交易所撮合机制(MTCH R)假定为主流的双边竞价,其他市场规则可能带来偏差;
- 控制信号与交互对市场影响模拟效果存在平衡权衡,可控性和真实性之间仍有妥协;
- 对市场操纵事件的识别并非定论,单一指标判断需结合多维度风险指标综合判断。
- 外部风险:
- 法规变化、市场结构调整、极端宏观经济事件等外生变量无法完全涵盖。
- 缓解措施:
- 模型开放源码,支持持续更新和领域自适应;
- 以模拟环境为主,建议结合实盘数据和人工经验共用;
- 明确免责声明,建议用户评估和管控使用风险。
---
6. 批判性视角与细微差别
- 报告非常强调生成模型在金融市场微观层面的创新应用,但对复杂经济行为和参与者心理、政策影响、突发新闻等非结构化信息的建模能力未展开,存在一定局限;
- 用户注入和控制信号的交互存在一定的平衡困境,过度强调交互影响可能降低对历史轨迹的拟合质量,这一权衡对最终模拟结果产生细微影响;
- 报告多次提及模型和数据量巨大,但实际使用中对计算资源需求和成本未作详述,存在未公开的门槛问题;
- 与当前主流金融文本和多模态LLM金融模型相比,侧重纯金融结构数据,金融语义信息整合有待延申;
- 尽管报告提及RL智能体训练成功,但未具体说明涉及的算法细节、策略复杂程度和效果泛化能力,需后续更多实践验证。
---
7. 结论性综合
此报告系统且深入地阐述了基于生成式基础模型LMM架构的金融市场仿真引擎MarS。通过严格的模型设计,算法创新和数据工程,MarS达成了三个关键特性:高分辨率复现市场订单,用户灵活控制市场状态,以及实时交互式交易策略仿真。丰富的实验系统验证MarS的真实感,模拟交互性和可控性,均表现出色。特别是:
- 订单级和订单批次级的两层生成模型创新地结合了市场微观行为和宏观态势;
- 模拟结果完美复制市场统计特征,验证了模型的高真实性;
- 用于趋势预测、操纵检测、市场影响分析和强化学习环境的多任务应用展示了MarS的通用性和实用价值;
- 新发现了多种市场冲击影响因子,展示了仿真数据驱动的理论创新潜力;
- 兼具技术先进性和应用适应力,被描绘为金融市场仿真领域“范式转变”的里程碑。
图表支持了上述结论:如图3的模型规模与性能提升曲线、图5-6的市场基本统计特征对照、图7-9多任务实验结果以及图16与图22等的场景及统计指标模拟。
作者表明MarS及其代码开源,显示了推动业界及学界深入研究和应用的诚意。该报告内容丰富、结构严谨,兼顾理论和实践,是金融市场模拟领域的重要参考文献。
---
以上内容所有结论均严格依据报告原文内容,附带对应页码标注。
---
参考文献溯源
- 页面索引引用举例:[page::0], [page::2], [page::4], [page::6], [page::8], [page::9], [page::18], [page::22], [page::29], [page::33], [page::34] 等。
---
(全文完)