admin管理员组

文章数量:1445118

微软开源MarS:生成基础模型时代的统一金融市场模拟引擎

介绍

生成基础模型已经改变了各个领域,为内容生成创造了新的范式。将这些模型与特定领域的数据集成可以实现特定行业的应用。微软研究院已经使用这种方法为金融领域开发了大型市场模型 (LMM) 和金融市场模拟引擎 (MarS)。这些创新有可能使金融研究人员能够针对各种场景定制生成模型,为将生成模型应用于金融市场的下游任务建立新的范式。这种整合可能会提高效率、提供更准确的见解,并在金融领域取得重大进步。

将生成模型应用于金融市场

近年来,生成基础模型在自然语言处理和媒体生成等领域取得了显著成功。它们的兴起引发了新一轮的研究和工业应用浪潮,重塑了各个行业的生产流程。这些模型之所以出类拔萃,有三个基本要素:大量高质量的训练数据;核心信息(如文本中的语义信息)的有效标记化和序列化;以及全面建模数据的自回归训练方法,实现隐式推理。

基于多年来在各个行业中对 AI 的应用,微软研究人员认识到,将生成模型与特定领域数据相结合可以带来有效的解决方案,尤其是在金融领域。金融市场就是一个典型的例子,尤其是它拥有大量的订单数据,这些数据具有三个关键特征:

  • 粒度细:订单作为金融市场的原子数据,对真实市场提供了全面细致的呈现,结合撮合规则,可以重现整个市场运行过程。
  • 规模庞大:电子交易导致全球交易所积累了大量交易订单数据
  • 结构良好:订单数据的结构化特性使其成为标记化和顺序建模的理想选择
  • 下载火星[1]

这些特点使订单流数据成为金融市场生成模型的重要基础。为此,微软研究院开发了 LMM 和 MarS,金融研究人员可以使用它们为各种应用定制生成模型,从而为金融的所有下游任务培育出一种新的生成解决方案范式。这有可能提高金融行业的效率和洞察力。

订单流信息标记化

订单流数据对于金融生成模型至关重要,反映了市场参与者之间的实时互动。它提供两种类型的价值:

  • 细粒度的市场反馈:每个订单,特别是大订单,都可能影响其他人的决策,从而提供定价行为的微观视角。
  • 宏观市场动态:集体互动随着时间的推移塑造交易动态,捕捉市场力量之间冲突的演变和解决。

微软的研究人员通过对单个订单和整个订单集进行随时间变化的建模,开发了 LMM。这种双层方法既可以捕获细粒度的反馈,也可以捕获宏观层面的竞争动态。图 2 显示了这些模型的标记化技术,可以对复杂的市场动态进行高保真模拟。

图 2:单个订单(顶部)和批量订单(底部)的标记化

大市场模式的扩张规律:释放金融数据的潜力

随着训练数据集和模型参数的增大,生成模型的有效性显著提高。微软的研究人员使用了两种标记化策略来设计基于 Transformer 架构的模型,并在不同的数据规模上对其进行测试。图 3 说明了订单和订单批次模型的扩展行为,突出显示了历史交易数据的见解。这种集成增强了模型生成订单流的能力,并深入了解了市场的复杂性,从而实现了更准确的时间序列建模。

图 3:不同参数规模下订单和批量订单模型的缩放曲线

基于 LMM 的 MarS

可定制的金融场景生成模型

生成模型经过训练后,可以轻松适应一系列下游任务,其表现通常优于针对特定场景量身定制的传统模型。在 LMM 开发的基础上,研究人员进一步分析了各种金融场景的需求,并将 MarS 设计为一个多功能的金融市场模拟引擎。MarS 不仅是一个通用的模拟工具,还引入了一个新颖的框架,用于将生成模型应用于从市场预测和风险评估到交易策略优化等各种金融任务。

图 4:MarS 框架

构建预测和检测任务的统一范式

传统的金融预测解决方案通常需要开发专门的算法,这些算法必须经常调整,耗费时间和资源。LMM 能够深入建模金融市场,可根据最新数据定期更新。MarS 创建虚拟交易所来匹配 LMM 生成的订单流,模拟交易并得出模拟的市场轨迹(见图 4 右上角)。这种方法可以有效解决金融场景中常见的预测和检测任务,在生成模型框架内引入创新解决方案。

预测任务中的应用

预测任务在金融领域至关重要,它涉及估计未来市场指标。传统模型需要根据预测目标的任何变化进行修改。MarS 通过从最新数据中不断生成未来订单流来解决此问题,这些订单流在虚拟交易所中进行匹配,从而模拟潜在的未来市场轨迹。这大大提高了预测能力。

图 5 展示了 MarS 在预测股价走势中的应用,其性能明显优于传统的基准算法。以顺序模型 (1.02B) 为例,其性能在 1 分钟时长内超过 DeepLOB 约 (0.662/0.583−1=13.5%),在 5 分钟时长内增加到 (0.579/0.473−1=22.4%)。这种不断扩大的性能差距表明,顺序模型在更长的时间内更有效地保持了预测准确性,凸显了其与基线相比更出色的泛化能力,尤其是在预测任务在延长的时间范围内变得更具挑战性的情况下。这为金融市场的预测任务提供了一个有吸引力的解决方案,同时也凸显了 LMM 在建模股票市场动态方面的能力。

图 5:使用 MarS 预测股价趋势

检测任务中的应用

对于监管机构而言,检测系统性风险或市场滥用对于市场稳定至关重要。LMM 模拟典型的市场模式,通过将真实市场轨迹与 MarS 生成的轨迹进行比较,可以识别异常情况。图 6 显示了在确认的恶意市场操纵事件期间模拟和真实市场轨迹之间的价差分布差异(即最佳买入价和卖出价之间的差异,反映资产流动性)。这种比较可以发现表明异常活动的细微偏差,为监管机构提供监控市场完整性的有效工具。

图 6:市场操纵期间模拟市场与真实市场的价差相关性

定义新的金融科技场景

生成模型可以根据简单的描述创建定制内容。在 MarS 中,一种机制可以根据市场状况的自然语言描述生成特定的订单流。为了应对极端情况,研究人员开发了一种控制信号系统,该系统使用分层扩散模型在罕见事件(例如股市崩盘和熔断)期间生成高保真信号。此功能将广泛的描述转化为精确的订单流控制。

通过将受控订单生成与实时反馈相结合,MarS 为预测和检测任务创建了一个统一的框架,重新定义了金融研究、应用和市场理解。主要应用包括“假设”分析和现实市场条件下强化学习算法的训练环境。

金融研究的“假设”分析

“如果在不同的市场条件下执行不同规模的交易订单,会发生什么情况?”这个问题对于理解市场行为至关重要。传统方法依赖于真实订单、经验和假设,成本高昂且速度缓慢。生成模型提供了突破性的解决方案。

图 7 说明了 MarS 如何模拟市场影响:左上角显示买单如何影响资产价格轨迹,而右上角则显示不同策略的市场影响曲线,与传统模式相符。研究人员还使用 MarS 生成大规模模拟数据,使用常微分方程 (ODE) 构建市场影响模型。图 7 左下角显示了推导的影响公式,右下角展示了其可解释性。这些进步凸显了 MarS 通过深度市场建模增强“假设”研究的潜力。

图 7:使用 MarS 进行订单市场影响研究的样本结果

金融市场强化学习的训练环境

强化学习 (RL) 算法需要受控环境进行测试和优化。金融市场行为通常通过订单流变化表现出来,从而影响市场。如果模拟不能准确反映这些影响,RL 算法可能会在现实场景中失败。

MarS 提供高保真生成和实时反馈,为金融领域的强化学习创建了一个全面的环境。图 8 显示了交易代理的训练过程,突出显示了随着时间的推移性能的显著提高,并证明了 MarS 作为强化学习训练场的有效性。

图 8:在 MarS 中训练的强化学习交易代理的性能。在训练期间,代理的性能显著提高,展示了 MarS 能够帮助开发针对真实市场条件的强大强化学习算

[1]

火星 :

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2024-12-05,如有侵权请联系 cloudcommunity@tencent 删除模型数据金融开源基础

本文标签: 微软开源MarS生成基础模型时代的统一金融市场模拟引擎