量化研究每周精选-20170802

量化研究每周精选
标签: #<Tag:0x00007fc06999f170>

(小Q) #1

导语:本周精选了五篇关于深度学习、机器学习在量化投资领域的应用文章。随着近年来机器学习和深度学习的发展,越来越多的人投入到研究的队伍中。希望读完这些报告的你能对其中的研究有自己的理解。BigQuant拥有海量的数据和主流开源AI框架,赋能每一位爱好机器学习/深度学习和量化交易的人。


关键词:机器学习、深度神经网络、统计套利
这篇文章是机器学习、深度学习算法应用在股票市场非常全面非常系统的一篇文章。本文介绍了深度神经网络(DNN)、梯度提高树(GBT)、随机森林(RAF)在统计套利的背景下这些方法的组合(ENS)的有效性。每一个模型都是在去除了幸存者偏差后,对标准普尔500指数中所有股票进行训练并预测,本文采取的是滚动学习,一共31个因子,股票池为标普500股票池。从1992年到2015年,每天的交易信号都是根据股票的概率预测产生的,预测概率较大的股票为低估股票,预测概率晓得股票为高估股票,因此作者构建了每天买入若干只低估股票、每天卖出若干只高估股票的统计套利策略。作者后来集成了深度神经网络、梯度提升数和随机森林三个模型开发了一个交易策略,该策略每日收益0.45%,并且发现每天买入股票数量和每天卖出股票数量同时为10只的时候是效果最好的。

关键词:深度学习
本文的受众是对深度学习有一定基础的人群。文章开头先从几何的角度对深度学习进行解释,作者认为深度学习能将所有的东西矢量化,所有东西都是几何空间的点。文中讨论了深度学习的局限性和机器学习模型的风险。文章提出,深度学习模型只具有"局域泛化"的能力,同时只能处理与训练数据非常相近的新情况。作者在文章最后提出,目前深度学习唯一真正成功的是在大量人类标注数据的帮助下将X空间通过连续的几何变换映射到Y空间的能力。这一工作给各行各业带来了革命性的变化,但是距离人类水平的人工智能还有很长的路要走。

关键词:深度学习、卷积神经网络
作者提出了为预测股市的事件驱动深度学习方法。首先,从新闻文本中提取事件,并用一种新的神经张量网络表示为稠密向量。其次,利用深层卷积神经网络来模拟事件对股票价格变动的短期和长期影响。实验结果表明,文中的模型可以在标准普尔500指数预测和股票预测方面取得近6%的改进。此外,市场模拟结果表明,文中的系统比以前报道的标准普尔500股票历史数据训练系统更有盈利能力。

关键词:NLP
本文主要介绍了作者使用自然语言处理技术进行股票回报预测的实验过程。作者进行此应用金融项目旨在制定一个框架,以确定金融新闻头条是否对股票价格产生了有意义的影响。该框架是一种新颖的结构,主要利用现有的自然语言处理技术,包括标题实体识别和全局向量的词表示(GloVe)模型,然后将它们与k-均值聚类和投资组合优化的技术相结合。此项目共有三个目标:1. 使用NLP技术映射组织实体名称并对公司行为进行分类,比如在新闻中GS和高盛都能同时识别出来为著名对冲基金。2. 在股价的基础上识别和评估由事件驱动的收益 3.以信息高效的方式组合对未来股价走势有预测能力的事件。实验结果表明,该框架能够作为一个成功的原型来分析非结构化文本数据,并能够对文本进行聚类,并将这些信息转换成一个针对每个类别的投资组合策略。

关键词:机器学习、深度学习
本文研究了使用机器学习技术建立统计稳定的资金配置策略。传统上,资金配置通常依赖于马科维茨模型,比如均值-方差组合(Mean Variance allocation)、最大多样性(Maximum Diversity)、风险组合(Risk Allocation)、在险价值(Value at Risk)和期望损失值(Expected shortfall),这些方法本质上都属于凸边界优化(convex frontier optimization)。虽然这些方法通过最优化来分配资产,但它们通常依赖于协方差矩阵的估计和使用,但是协方差又不一定是稳定的,因此这些方法都会有偏差。作者研究了通过减少风险和估计偏差并制定结果来开发实用资金配置策略的一些技术。本文给出了机器学习资金配置过程与等权重配置策略和风险评论配置策略的结果,其中机器学习方法是最好的配置方法,这可能得益于其突出分析资产之间非线性关系的好处。此外,该框架还可以考虑到跨资产的长程依赖关系。文中,所有配置策略都具有相同的资产,只是不同的配置方法中各个资产权重不等。



量化研究每周精选》每周一期,为大家提精选研报、前沿研究、热门文章等优质内容。
查看所有 量化研究每周精选。欢迎投稿 (i@bigquant.com)



(kajimage) #2

哪位大佬能分享下,第一篇文章的首先代码吗