【精品】金融投资相关深度学习论文合集

量化研究每周精选
标签: #<Tag:0x00007fb006d18810>

(iQuant) #1
作者:Dmitry Rastorguev
编译:BigQuant

我对技术及其在金融数据分析,特别是投资中的应用感到着迷。以下是过去发布的关于深度学习及其在投资领域应用的免费学术论文汇编。请享用!

$$目录$$

  1. 《通过预测公司基本面来改善基于因子的量化投资》
  2. 《深度学习预测横截面的股票收益》
  3. 《使用机器学习算法预测ETF》
  4. 《金融序列预测:时间序列模型与机器学习模型在预测精度上的比较》
  5. 《借助长期短期记忆网络的深度学习预测金融市场》
  6. 《利用深度学习进行股价预测》
  7. 《基于人工神经网络使用技术分析和大数据框架的股票交易系统》
  8. 《使用堆叠式自动编码器和长期记忆的金融时间序列的深度学习框架》
  9. 《深度学习和横截面预期收益》
  10. 《使用机器学习和常规技术预测财务实力评级》
  11. 《一个稳健的股价预测模型》
  12. 《深度神经网络的宏观经济指标预测》
  13. 《使用人工神经网络进行股市指数预测》
  14. 《预测标准普尔500指数-基于递归神经网络》
  15. 《用k-最近邻、岭回归和前馈神经网络预测外汇汇率变动》

  • 《通过预测公司基本面来改善基于因子的量化投资》

    原文:《Improving Factor-Based Quantitative Investing by Forecasting Company Fundamentals【pdf下载】target=_self;url=https://pan.baidu.com/s/1YYDAPMsbi9ZRKFabHkp4Eg

    摘要:上市公司需要定期发布报告反映公司基本面的财务数据,如收入,营业收入,债务等。这些数据点为公司的财务状况提供了一些参考。学术研究已经验证了一些有效因子,即通过回测分析历史报告数据的计算因子,可以获得超越市场平均水平的表现。其中,两个受欢迎的因子是账面价值(按市值归一化调整)和营业收入(按EBIT / EV归一化调整)。在本文中,我们首先通过回测表明,如果我们能够(透视)选择使用基于未来基本面计算的因子(通过预测)来选择股票,那么我们的投资组合将远远超越标准因子选股方法。受此分析的启发,我们训练深度神经网络以预测未来5年的基本面数据。定量分析显示,MSE比朴素被动预测策略有显着的改善。此外,在使用行业级股票投资组合模拟器(backtester)的回测分析中,我们显示复合年化收益提升至17.1%(MLP),而标准因子模型则为14.4%。

  • 《深度学习预测横截面的股票收益》

    原文:《Deep Learning for Forecasting Stock Returns in the Cross-Section【pdf下载】target=_self;url=https://pan.baidu.com/s/1L45JueKW6klPfe-95jMeEw

    摘要:许多研究已经通过使用机器学习技术(包括神经网络)来预测股票收益。最近,主要用应于图像识别和语音识别领域的高性能深度学习方法在机器学习领域备受关注。本文通过深度学习来预测日本股票市场横截面上月度股票收益,研究结果表明,深度神经网络通常优于浅层神经网络,最好的网络也超越了表征机器学习模型。这些结果表明,深度学习有望成为一种成熟的机器学习方法来预测横截面股票收益。

  • 《使用机器学习算法预测ETF》

    原文:《Forecasting ETFs with Machine Learning Algorithms【pdf下载】target=_self;url=https://pan.baidu.com/s/1Q6tTbkJSTi3nVaRknc4Lfw

    摘要:在这项工作中,我们将机器学习算法应用于金融领域最古老的挑战之一:预测收益率。为简单起见,我们专注于预测几个具有流动性的ETF的涨跌方向(向上或向下),并不试图预测价格变化的幅度。我们使用的ETF用作资产类别代理。我们采用了从2011年1月至2016年1月通过雅虎财务获得的约5年历史日频数据。利用我们的监督式学习分类算法,这些算法可以在Python的Scikit-Learn中随时获得,我们采用三种强大的技术:(1)深度神经网络,(2 )随机森林,(3)支持向量机(线性和径向基函数)。我们记录了三种算法在四种信息集中表现。我们将我们的信息集分为(A)过去的回报,(B)过去的交易量,(C)(回测)天数/月,以及三者的组合。我们介绍了我们的“获得标准”来帮助我们比较分类器的性能,首先,我们发现这些算法在一个月到三个月的范围内运行良好,因此短时间内(几天)的可预测性非常困难,我们的结果支持短期价格服从随机游走假设;其次,我们发现横截面和跨期的成交量对于一个强大的信息集的重要性;第三,我们证明了许多特征是可预测性所必需的,因为每个特征提供的贡献非常小。因此,得出的结论是,ETFs可以用机器学习算法进行预测,但实践者应该将先前的市场和直觉知识纳入资产类别行为。

  • 《金融序列预测:时间序列模型与机器学习模型在预测精度上的比较》

    原文:《Financial Series Prediction: Comparison Between Precision of Time Series Models and Machine Learning Methods【pdf下载】target=_self;url=https://pan.baidu.com/s/1L8pMMepgpc2P4MlJiMTjxQ

    摘要: 投资者从市场收集信息,并根据收集到的信息作出投资决策,即相信未来的证券价格趋势。因此,几种主流趋势分析方法逐渐形成和发展。然而,由于市场信息压倒一切,精确的趋势预测一直是一个难题。虽然传统的时间序列模型如ARIMA和GARCH已经被研究并被证明是有效的预测,但它们的表现还远远不能令人满意。机器学习作为近年来一个新兴的研究领域,已经在诸如回归和分类等任务中带来了许多令人难以置信的提升,并且还有望在金融时间序列预测中利用该方法。在本文中,对传统时间序列模型ARIMA与包括逻辑回归,多层感知器,支持向量机和自动编码器在内的主流机器学习模型的金融时间序列预测精度进行了实证比较,数据集包括道琼斯指数30,标准普尔500指数和纳斯达克指数在内的三个股指数据。结果表明机器学习作为一种现代方法在预测精度上实际上远远超过了传统模型。

  • 《借助长期短期记忆网络的深度学习预测金融市场》

    原文:《Deep learning with long short-term memory networks for financial market predictions【pdf下载】target=_self;url=https://pan.baidu.com/s/1mJNlHNZRYCsc02cLLxcqwA

    摘要: 长期短期记忆(LSTM)网络是用于序列学习的最新技术。它们不太常用于金融时间序列预测,但本质上适用于该领域。我们使用LSTM网络来预测1992年至2015年标普500成份股的样本外价格变动方向。策略日交易量为0.46%,去除交易成本之前的夏普比率为5.8,我们发现LSTM网络的表现优于内存 - 自由分类方法,即随机森林(RAF),深度神经网络(DNN)和逻辑回归分类器(LOG)。我们揭示了盈利来源,从而为人工神经网络的黑匣子打开了亮光。特别,我们发现在选择交易的股票中有一个常见的模式:它们表现出高波动性和短期收益率反转。利用这些发现,我们能够形成一套基于规则的短期反转策略,能够解释LSTM的部分回报。

  • 《利用深度学习进行股价预测》

    原文:《Stock prediction using deep learning【pdf下载】target=_self;url=https://pan.baidu.com/s/1JAG5fQlULhQ9iiSb1cFgJw

    摘要:股市被认为是混乱的,复杂的,波动的和动态的。毫无疑问,它的预测是时间序列预测中最具挑战性的任务之一。此外,现有的人工神经网络(ANN)方法未能提供令人鼓舞的结果。与此同时,机器学习的进步为语音识别,图像分类和语言处理提供了有利的结果。应用于数字信号处理的方法可以应用于股票数据,因为它们都是时间序列。同样,本文的学习成果可以应用于语音时间序列数据。本文介绍了用于股票预测的深度学习,其性能是根据纳斯达克的Google股票价格多媒体数据(图表)进行评估的。本文的目的是证明深度学习可以提高股市预测的准确性。为此,二维主成分分析(2D)2PCA +深度神经网络(DNN)方法与 二维主成分分析(2D)2PCA +径向基函数神经网络(RBFNN)进行比较。结果表明,(2D)2PCA +深度神经网络(DNN)方法与现有技术方法(2D)2PCA +径向基函数神经网络(RBFNN)进行比较,该方法的性能优于现有的RBFNN方法,对窗口大小为20的预测准确率提高了4.8%。并将该模型的结果与递归神经网络(RNN)进行比较,发现预测准确率提高了15.6%。DNN实际收益与预测收益之间的相关系数比RBFNN高17.1%,比RNN好43.4%。

  • 《基于人工神经网络使用技术分析和大数据框架的股票交易系统》

    原文:《An Artificial Neural Network-based Stock Trading System Using Technical Analysis and Big Data Framework【pdf下载】target=_self;url=https://pan.baidu.com/s/1ivgfl_Fja7DZDkKm_yOzTw

    摘要: 本文提出了一个使用技术分析指标的基于神经网络的股票价格预测和交易系统。首先模型使用最常用的技术分析指标将金融时间序列数据转换为一系列买入卖出触发信号。然后,在学习阶段,对所有道琼斯30指数股票在1997年至2007年期间的每日股价进行多层感知器(MLP)人工神经网络(ANN)模型的训练。Apache Spark大数据框架用于训练阶段。然后用2007年到2017年的数据对训练后的模型进行测试。结果表明,通过选择最合适的技术指标,神经网络模型在大多数情况下优于买入并持有策略。此外,微调技术指标参数和优化策略可以提升整体策略表现。

  • 《使用堆叠式自动编码器和长期记忆的金融时间序列的深度学习框架》

    原文:《A deep learning framework for financial time series using stacked autoencoders and long- short term memory【pdf下载】target=_self;url=https://pan.baidu.com/s/1p7QxFDptauImgvtnu4P6nA

    摘要: 深度学习方法在金融领域的应用受到投资者和研究人员的高度关注。这项研究提出了一个新颖的深度学习框架,其中小波变换(WT),堆叠自动编码器(SAEs)和长期短期记忆(LSTM)被合并用于股票价格预测。用于分级提取的深度特征的SAE首次引入到股票价格预测中。深度学习框架包含三个阶段。首先,通过WT(小波变换)对股票价格时间序列进行分解以消除噪音。其次,应用SAE来生成用于预测股票价格的深层次高级特征。第三,高层次的降噪特征被送入LSTM以预测第二天的收盘价格。选择六个市场指数及其相应的指数期货来检验该模型的表现。结果表明,该模型在预测准确性和盈利能力两方面均优于其他类似模型。

  • 《深度学习和横截面预期收益》

    原文:《Deep Learning and the Cross-Section of Expected Returns【pdf下载】target=_self;url=https://pan.baidu.com/s/1yVdoUflsFAO8JAxalaF5IQ

    摘要: 深度学习是机器学习研究的一个活跃领域。我根据一组68个公司特征(FC)对深度前馈神经网络(DFN)进行训练,以预测美国股票的横截面收益。应用网络优化策略之后,我发现DFN多空投资组合可以产生具有吸引力的风险调整回报,与线性基准相比。这些发现表明了FC和预期收益之间的非线性关系的重要性。结果对大小,加权方案和投资组合截止点都很有效。此外,我发现与价格相关的FC(公司特征),比如短期反转特征和12个月的动量特征,是回归预测的主要特征之一。 大部分FC在这些预测中发挥的作用很小。

  • 《使用机器学习和常规技术预测财务实力评级》

    原文:《Prediction of financial strength ratings using machine learning and conventional techniques【pdf下载】target=_self;url=https://pan.baidu.com/s/14vYB_7SHqEtB0I69F4Lobg

    摘要: 特别是自2007-09财政年度的金融危机以来,财务实力评级(FSR)变得更加重要,评级机构未能预测一些银行的违约和降级状况。本文的目的是使用机器学习和传统技术来预测银行的财务实力评级(FSR)以判断其是否满足组员资格。这里我们使用五种不同的统计技术,即CHAID,CART,多层感知器神经网络,判别分析和逻辑回归。我们还使用三种不同的评估标准,即平均正确分类率,错误分类成本和收益图表。我们的数据收集自Bankscope数据库,提供了21世纪的第一个十年的中东商业银行参考数据。我们的研究结果表明,在预测2007 - 2009年期间的银行FSR时,判别分析出奇地优于本文中使用的所有其他技术。当只使用机器学习技术时,CHAID优于其他技术。另外,我们的研究结果强调,当随机样本用于预测银行FSR时,CART将优于所有其他技术。我们的评估标准证实了我们的发现,CART和判别分析在预测银行FSR方面优于其他技术。这对中东银行意义深远,因为我们认为改善他们的银行FSR可以提高他们在市场上的竞争力。

  • 《一个稳健的股价预测模型》

    原文:《A Robust Predictive Model for Stock Price Forecasting【pdf下载】target=_self;url=https://pan.baidu.com/s/1Y1weDPLLPJQvHp1EUoqCeg

    摘要: 对股票价格未来走势的预测一直是许多研究工作的主题。一方面,我们有效市场假说的支持者声称股票价格无法准确预测。另一方面,有些命题表明,如果适当地建模,股票价格可以相当准确地预测。后者侧重于特征的选择,适当的功能形式和预测技术。这项工作通过将统计学和机器学习方法与技术分析文献中已经提出的一些概念相结合,提出了一种精细的股票价格预测方法。我们的工作目标是每天从印度国家证券交易所(NSE)的股票价格获取每日5分钟K线数据,并制定股票价格的预测框架。我们的观点是,这种细粒度的方法可以对股价内在变化进行建模,并可以进行微调以实现即时预测。采用六种不同的技术,包括三种基于回归的方法和三种基于分类的方法来模拟和预测NSE上两只股票:塔塔钢铁和英雄摩托的价格变动。这些预测技术在全部股票上的表现已经获得了广泛的验证。

  • 《深度神经网络的宏观经济指标预测》

    原文:《Macroeconomic Indicator Forecasting with Deep Neural Networks【pdf下载】target=_self;url=https://pan.baidu.com/s/1SGG4IefF1603MCryUnIYTg

    摘要: 经济决策依赖于对经济状况的准确预测。目前用于无条件预测的方法主要由呈现模型依赖性和高数据需求的遗传线性模型支配。我们开发的深层神经网络,可以利用有限的数据改进预测精度,同时对功能形式保持不可知论的态度。我们专注于使用基于四种不同神经网络架构的模型来预测居民失业率。这些模型中的每一个在短时间范围内均优于基准模型。一种基于自编码架构的模型在每个预测范围内(最多四个季度)胜过基准模型。

  • 《使用人工神经网络进行股市指数预测》

    原文:《Stock market index prediction using artificial neural network【pdf下载】target=_self;url=https://pan.baidu.com/s/1eIrvXLPSd7eSQ_UetcQZyw

    摘要: 本文研究了人工神经网络(ANN)在预测美国纳斯达克证券交易所日变动的能力。评估完成了由反向传播算法训练的几个前馈神经网络。本研究中使用的方法将短期历史股票价格以及一周中的第几天天作为输入。纳斯达克2015年1月28日至2015年6月18日期间的每日股票变动用于开发稳健的模型。将前70天(1月28日至3月7日)选作训练数据集,最后29天用于验证模型预测能力。针对两种输入数据集(前四天和前九天)的NAS-DAQ指数预测网络模型已经开发和得到验证。

  • 《预测标准普尔500指数-基于递归神经网络》

    原文:《Recurrent Neural Networks in Forecasting S&P 500 Index

    摘要: 本研究的目的是使用递归神经网络的变化预测标准普尔500指数的变动。所考虑的变化是简单的递归神经网络,长短期记忆和门限循环单元。除了这些网络之外,我们还讨论了考虑金融市场典型冲击的纠错神经网络。在预测标准普尔500指数时,我们考虑了14个经济变量,4个网络隐层神经元层和5个epoch层。 我们可以使用实验设计选择相关特征。根据准确度得分和图形处理单元(GPU)运行时间选择具有正确特征的实验。实验(针对每个神经网络)用于预测标准普尔500指数的向上或向下移动。通过标准普尔500指数的预测和构建的策略,我们在选定的时间段上买卖标准普尔500指数并将策略表现和买入并持有策略进行比较。

  • 《用k-最近邻、岭回归和前馈神经网络预测外汇汇率变动》

    原文:《Forecasting Foreign Exchange Rate Movements with k-Nearest-Neighbour, Ridge Regression and Feed-Forward Neural Networks【pdf下载】target=_self;url=https://pan.baidu.com/s/1kltnx7E7DsMOvonGk4pEQw

    摘要: 采用三种不同的数据挖掘方法(k-最近邻域,岭回归和多层感知器前馈神经网络)用于10个模拟的时间序列外汇数据的量化交易,以及10个货币汇率从1999年11月1日至2015年6月12日的实际时间序列。每种方法都经过多种测试。k-NN算法与Euclidian,Manhattan,Mahalanobis和Maximum距离函数交替使用。Ridge回归应用为线性和二次型,并且前馈神经网络应用了1,2或3个隐藏层。除了主成分分析(PCA)最终应用于预测集的降维以外,方法的元参数在验证集上进行优化。在模拟研究中,使用随机 - 波动率跳跃 - 扩散模型,用10种不同的非线性条件均值模式进行扩展,以模拟应用测试方法的资产价格行为。结果表明,没有一种单一方法能够在模拟时间序列中的所有非线性模式中获利,但相反,对于不同的模式,不同的方法表现良好。或者,过去的价格变动和过去的收益被用作预测变量,在使用过去的价格变动的情况下,二次岭回归得到了最稳健的结果,其次是一些k-NN方法。在使用过去收益的情况下,基于k-NN的方法是最能持续盈利的,其次是线性岭回归和二次岭回归。神经网络,虽然能够在一些时间序列中获利,但其他大多数情形下没有获得利润。没有进一步发现PCA方法以系统方式改进测试方法结果的证据。在研究的第二部分,模型被应用于经验性汇率时间序列,总的来说,这些方法的盈利能力相当低,其中大多数货币以损失而告终。最赚钱的货币是EURUSD,其次是EURJPY,GBPJPY和EURGBP。最成功的方法是线性岭回归和基于曼哈顿距离的k-NN方法,这两种方法在大多数时间序列中都盈利(与其他方法不同)。最后,使用线性岭回归的前向选择程序和技术指标用于扩展原始预测因子集。选择程序在改善线性岭回归模型的样本外取得了有限的成功,但在其他模型中没有取得成功。


原文链接:《 Deep Learning Papers on Investing

量化研究每周精选》定期更新,为大家提精选研报、前沿研究、热门文章等优质内容。
查看所有 量化研究每周精选。欢迎投稿 (i@bigquant.com)。

本文由BigQuant《量化研究每周精选》原创推出,版权归BigQuant所有,转载请注明出处。