Two Sigma:序列深度学习与量化投资
由crisvalentine创建,最终由crisvalentine 被浏览 212 用户
导语
近日,来自Two sigma AI Core团队的David Kriegman教授进行了题为《Deep Learning for Sequences in Quantitative Finance》在线分享。David Kriegman是加州大学圣地亚哥分校的计算机科学与工程教授,也是计算机视觉的专家。他于今年1月份加入了Two Sigma AI Core团队。
正文
量化投资对很多人来说似乎很神秘,以至于大家经常把投资过程本身称为一个“黑盒子”。此外,量化投资的复杂性不断增加,如今Two Sigma和其他公司经常在过程的各个部分使用强大的深度学习技术,根据大量数据做出决策。
即便如此,这个过程也不一定像人们有时想象的那样神秘。David kriegman教授在本次网络研讨会,阐明Two Sigma研究人员如何将序列深度学习应用于量化投资。
正如David Kriegman解释的那样,量化投资过程地分为特征提取、预测单个资产的收益、投资组合配置和交易执行等步骤。这个过程中的许多步骤可以很容易地表示为机器学习问题,可以使用序列深度学习方法解决。
序列深度深度学习的输入是一个单维或多维的序列,如RNN就是典型的用于序列预测的深度学习模型。在很多领域都有序列预测的需求,比如情感分析、图像标注、翻译等等。
接下来的分享分为两大部分:第一部分介绍了Two Sigma的量化投资的流程线,以及各流程中与深度学习结合的过程;第二部分介绍了常见的用于序列预测的深度学习模型。
传统的因子体系的投资框架将策略构建的过程分为了特征提取、预测单个资产的收益、投资组合配置和交易执行等步骤。在这些步骤中,如特征提取、资产收益预测及交易执行中,都用到了序列预测。
可以看到,这还是一个传统的因子模型的构建流程,只不过在不同的流程中找到了深度学习的应用场景。所以整体还是基于传统投资框架,用深度学习进行局部优化与提升。在我们之前介绍的念空超级信号工厂(念空的『超级信号工厂』)也采取了一样的框架体系。
在Feature Extraction与Alpha Modeling的步骤中,原始输入的因子可以来自多个维度,包括量价指标、基本面数据、情绪数据及非传统信息源。通过大量的数据结合序列深度学习模型,对资产未来的收益进行预测。
有了对于单个资产的收益预测,接下来就是组合构建,需要确定每个资产在组合中的占比。虽然这不是一个序列预测的问题。但组合优化本身也可以结合机器学习的算法,需要考虑非常多的限制条件,及选取合适的目标函数。这本身是一个大规模的优化问题。
最后,在交易执行层面,为了尽可能的控制交易成本,对于未来价格的预测也是一个序列预测的问题。与Feature Extraction与Alpha Modeling预测相对中长期的资产收益率不同的是,交易执行过程中预测的是跟高频的价格变动、成交量变动,以达到最优的执行成本。这当中需要考虑多个因素:订单量大小的选择,交易所的选择及订单类型的选择等。
在第二部分序列预测深度学习模型的介绍中,David Kriegman从基础的RNN介绍到了LSTM。也提到了近年来序列预测模型的热点,主要包括:Transformer和Attention。当然CNN也更多的用在了序列预测的问题上。
对于新手,一个可行的序列预测的学习路径就是:RNN-LSTM-Attention-Transformers-各种新Paper。
最后作者也分享了强化学习的相关应用,强化学习完全是一个端到端的应用。主要在游戏和机器人领域取得了很大的成功。强化学习本身需要强大的算力及模拟器。但在量化投资的应用并没有深度学习那么广泛。
总结
通过本次分享,可以看出深度学习在顶尖对冲基金的应用:
- 深度学习有用,且已经成为主力
- 坚持传统投资框架,在不同的流程中找到深度学习的应用场景
- 基础设施、海量数据同等重要
\