近期热点量化百科策略分享精品课程专题报告AI量化知识树PLUS会员问答交流公告&内推

优秀量化论文合集

论文-1:FinGPT:使用大规模互联网数据的金融大语言模型

标题:FinGPT: Democratizing Internet-scale Data for Financial Large Language Models

作者:Xiao-Yang Liu, Guoxuan Wang, Daochen Zha

主页https://arxiv.org/abs/2307.10485

摘要:FinGPT是一个项目,旨在通过使用大规模的互联网金融数据来开发金融领域的大型语言模型。这个项目的目标是使金融大型语言模型的发展更加民主化,让更多的人能够获得和使用这些模型。通过使用互联网上的金融数据,FinGPT可以提供更准确、全面的金融知识和信息,帮助人们在金融领域做出更好的决策和创新。

代码

  1. https://github.com/AI4Finance-Foundation/FinGPT
  2. https://github.com/AI4Finance-Foundation/FinNLP

论文-2:生成式元学习鲁棒质量多样性投资组合

标题:Generative Meta-Learning Robust Quality-Diversity Portfolio

作者:Kamer Ali Yuksel

主页https://arxiv.org/abs/2307.07811

摘要:本文提出了一种新的元学习方法,用于优化鲁棒的投资组合集合。通过深度生成模型生成多样且高质量的子投资组合,并将它们组合成投资组合集合。该方法平衡了最大化子投资组合性能和最小化最大相关性的目标,从而获得对系统性冲击具有鲁棒性的投资组合。实验结果表明该方法在存在随机奖励的情况下表现良好,并且通过对生成的子投资组合权重取平均可以得到具有鲁棒性和泛化能力的集合投资组合。该方法适用于需要在鲁棒集合中多样化共同优化解决方案的问题。

代码https://github.com/kayuksel/generative-opt

论文-3:MOPO-LSI: 一个开源的可持续投资多目标投资组合优化库

标题:MOPO-LSI: A User Guide

作者:Yong Zheng, Kumar Neelotpal Shukla, Jasmine Xu, David (Xuejun) Wang, Michael O'Leary

主页https://arxiv.org/abs/2307.01719

摘要:MOPO-LSI是一个开源的可持续投资多目标投资组合优化库。本文档提供了MOPO-LSI 1.0版本的用户指南,包括问题设置、工作流程和配置中的超参数。

代码https://github.com/irecsys/MOPO-LSI

论文-4:综合金融市场潜在主题和投资者预期的分析框架

标题:Joint Latent Topic Discovery and Expectation Modeling for Financial Markets

作者:Lili Wang, Chenghan Huang, Chongyang Gao, Weicheng Ma, Soroush Vosoughi

主页https://arxiv.org/abs/2307.08649

摘要:在金融市场分析中,我们希望不仅能够预测个别股票的表现,还能捕捉公司和股票之间的相互关系。然而,现有的方法在对预定义股票关系依赖和仅考虑即时效应方面存在限制。为了克服这些限制,我们提出了一种全新的金融市场分析框架。该框架结合了投资者预期建模和自动挖掘潜在股票关系的能力。我们在中国的上证300指数进行了综合实验,结果显示我们的模型始终实现了超过10%的年回报。这一表现超过了现有的基准,为股票回报预测和多年交易模拟设定了新的先进标准。

备注:在2023年的知识发现与数据挖掘进展(PAKDD 2023)中发表。

论文-5:时间序列降噪

标题:Noise reduction for functional time series

作者:Cees Diks, Bram Wouters

主页https://arxiv.org/abs/2307.02154

摘要:本文提出了一种用于减少功能时间序列中噪声的新方法。该方法基于函数主成分分析(FPCA)框架的扩展,利用时间序列的动态特性将观测曲线中的噪声与相关动态部分分离开来。通过将观测曲线投影到噪声子空间上,我们可以得到经过去噪的曲线估计。我们的方法在最小化均方积分误差的意义上是最优的,并且在模拟和真实数据上展示了其一致性和优于现有去噪技术的效果。此外,我们还展示了该方法可以作为预处理步骤用于提高预测的准确性。

论文-6:多因子收益模型:如何处理这么多特征?

标题:Multi-Factor Inception: What to Do with All of These Features?

作者:Tom Liu, Stefan Zohren

主页https://arxiv.org/abs/2307.13832

摘要:加密货币交易涉及大量的特征数据,如价格、哈希率和谷歌趋势等。本文介绍了一种名为Multi-Factor Inception Networks(MFIN)的框架,用于系统化地处理这些特征并进行交易决策。MFIN模型通过学习回报数据中的特征,并优化投资组合的夏普比率,实现了一种高效且不相关的交易策略。与传统的基于规则的策略相比,MFIN模型在近几年一直表现出稳定的回报,而传统策略和整个加密货币市场则表现不佳。这表明MFIN模型能够捕捉到传统手工因子所无法捕捉到的交易机会。

论文-7:面向交易执行的可泛化强化学习

标题:Towards Generalizable Reinforcement Learning for Trade Execution

作者:Chuheng Zhang, Yitong Duan, Xiaoyu Chen, Jianyu Chen, Jian Li, Li Zhao

主页https://arxiv.org/abs/2307.11685

摘要:本文研究了优化交易执行中的过拟合问题,并提出了一种针对这一问题的解决方案。过拟合是指现有的强化学习方法在实际应用中无法良好适应的问题。研究者将交易执行建模为具有动态上下文的离线强化学习,并发现过拟合问题主要是由于上下文空间庞大和上下文样本有限所导致的。为了解决这个问题,他们提出了一种学习上下文的紧凑表示方法,可以通过利用先前的知识或者进行端到端的学习来实现。通过在历史限价订单簿数据上进行实验,研究者验证了他们的算法在减轻过拟合问题方面的有效性,并取得了更好的性能表现。

论文-8:一种用于优化交易执行的适应性双层强化学习方法

标题:An Adaptive Dual-level Reinforcement Learning Approach for Optimal Trade Execution

作者:Soohan Kim, Jimyeong Kim, Hong Kee Sul, Youngjoon Hong

主页https://arxiv.org/abs/2307.10649

摘要:本研究旨在利用强化学习设计一种策略,能够准确跟踪每日累积成交量加权平均价格(VWAP)。先前的研究主要集中在较短的交易时间段内进行建模,这导致在短期内准确跟踪每日累积VWAP变得困难,因为金融数据在短期内通常变动不大。本文提出了一种能够准确跟踪每日累积VWAP并最小化与VWAP偏差的策略。研究者使用了股票日内交易量的U形模式,并采用Proximal Policy Optimization(PPO)作为学习算法。他们采用了双层方法:一个Transformer模型捕捉全局的U形交易量分布,一个LSTM模型处理局部时间间隔内订单的分布。实验证明,相比先前的基于强化学习的模型,这种双层架构提高了逼近累积VWAP的准确性。

论文-9:基于隐含波动率和实现波动率的系统性风险指标

标题:Systemic risk indicator based on implied and realized volatility

作者:Paweł Sakowski, Rafał Sieradzki, Robert Ślepaczuk

主页https://arxiv.org/abs/2307.05719

摘要:本研究提出了一种新的系统风险度量方法,用于分析美国、欧洲、巴西和日本股市中的金融市场动荡对系统风险的影响。该方法基于隐含波动率和实现波动率,通过IVRVSRI指标来显示股市的反应差异,并且冲击的持续性取决于历史波动率和长期平均波动率水平。该方法的优势在于简单且计算负担较小,同时在鲁棒性检验中表现出准确和有效的度量能力。此外,该方法还适用于其他类型的资产和高频数据。在评估各种系统风险指标的预测能力时,包括CATFIN、CISS、IVRVSRI、SRISK和克利夫兰联储等,基于简单线性、准分位数和分位数回归的方法,结果显示IVRVSRI具有最强的预测能力,尤其针对标普500指数的周回报。

论文-10:DINs:一种通用的端到端多资产量化策略框架

标题:Deep Inception Networks: A General End-to-End Framework for Multi-asset Quantitative Strategies

作者:Tom Liu, Stephen Roberts, Stefan Zohren

主页https://arxiv.org/abs/2307.05522

摘要:本文引入了Deep Inception Networks,这是一种深度学习模型,为多资产量化策略提供了一个通用的端到端框架。DINs直接从每日价格收益中提取时间序列(TS)和横截面(CS)特征,从而消除了手动特征工程的需要,并允许模型从TS和CS信息中同时学习。DINs采用完全数据驱动的特征提取方法,以避免过拟合。在之前深度动量网络的基础上,DIN模型直接输出优化夏普比率的整个投资组合的仓位大小。我们提出了一种新颖的损失项,用于平衡交易频率的规范化和由于与整个市场的高相关性而增加的系统风险之间的关系。通过使用期货数据,我们展示了DIN模型在各种交易成本下具有稳健性,并在不同的随机种子下表现一致。为了增加DIN模型的通用性,我们提供了注意力机制和变量选择网络的示例,以帮助解释投资决策。这些方法在输入维度较高且变量重要性随时间动态变化时特别有用。最后,我们比较了DIN模型在其他资产类别上的表现,并展示了如何自定义潜在特征空间。

论文-11:发掘波动性的潜力:改进GDP预测

标题:Harnessing the Potential of Volatility: Advancing GDP Prediction

作者:Ali Lashgari

主页https://arxiv.org/abs/2307.05391

摘要:本文提出了一种新颖的机器学习方法,利用波动性作为权重来预测国内生产总值(GDP)。该方法特别设计用于选择与GDP相关性最高的宏观经济变量,并考虑可能对经济产生意外冲击或事件的影响。研究通过实际数据对该方法进行了有效性测试,并与用于GDP预测的先前技术进行了比较,如Lasso和自适应Lasso。研究结果显示,基于波动性加权的Lasso方法在准确性和鲁棒性方面优于其他方法,为决策者和分析师提供了在快速变化的经济环境下做出明智决策的有价值工具。

论文-12:理解高频交易中最不为人知的秘密

标题:Understanding the least well-kept secret of high-frequency trading

作者:Sergio Pulido, Mathieu Rosenbaum, Emmanouil Sfendourakis

主页https://arxiv.org/abs/2307.15599

摘要:本文通过分析限价订单簿中的成交量失衡与价格波动之间的关系,揭示了高频交易中的一个秘密。研究者通过研究市场做市商问题,将成交量失衡视为对价格波动的最佳反应。他们的模型中存在一个基准有效价格,驱动着中间价,并且考虑了不确定性区域。市场做市商了解基准有效价格,以及未来中间价跳跃的概率,她可以控制在最佳买入和卖出价格上提供的交易量。通过解决优化问题,研究者能够自然地理解价格和成交量失衡之间的关系,并证实引用预测性失衡是最佳策略

\

文档