量化研究每周精选-20171012

量化研究每周精选
标签: #<Tag:0x00007fcf789e07b0>

(iQuant) #1

导语:本周精选了5篇机器学习相关文章,其中3篇涉及股票市场上机器学习的相关应用,1篇文章为Bloomberg对AI在对冲基金中应用进行的深度调研,这些文章将帮助大家了解机器学习在投资界的使用情况及遇到的问题。BigQuant拥有海量的数据和主流开源AI框架,赋能每一位爱好机器学习/深度学习和量化交易的人。

$$目录$$

  1. 《机器学习交易:股市和混沌过程》
  2. 《如何将机器学习算法应用于股票市场?》
  3. 《股市价格预测:大数据和机器学习》
  4. 《大规模对冲基金押注AI》
  5. 《过拟合的解决之道:更多的数据还是更少的自变量?》

  • 《机器学习交易:股市和混沌过程》

    原文:《Machine Learning Trading, Stock Market, and Chaos》

    关键词:混沌,统计学,机器学习

    本文首先介绍随机过程与混沌过程的差别。平稳随机过程不能被预测但是混沌过程包括地震、人口增长和股市等都可以在一定精度范围内预测。混沌过程被三个范式控制:稳定性,记忆性和突变性。一般来说,利用统计学可进行混沌过程建模,但十分困难,可以使用1/f噪音模型或者采用肥尾概率分布的分形时间序列。而机器学习可以更有效地模拟混沌过程。大多数金融数据显示出典型的混沌现象,I know first平台使用机器学习中基因算法对股市进行预测,预测结果包含不同时间段的信号(价格偏差值)和可预测性(历史相关性),证明了机器学习对混沌结构建模和预测的有效性。

  • 《如何将机器学习算法应用于股票市场? 》

    原文:《How can I go about applying machine learning algorithms to stock markets?》

    关键词:机器学习,统计学,金融

    本文为StackExchange网站上的回答。对于不了解机器学习和股市的初学者,如何才能掌握将机器学习应用于股市并开始盈利的窍门?高票答案是:将机器学习或者AI算法当做黑箱使用是谬论。初学者应该先学习统计学和机器学习,再尝试建立交易模型。当同时掌握数据分析与金融知识后,如何应用将是显而易见的事情。算法的所有意义在于匹配数据,降低预测的偏差和方差。如果不理解其基础,贸然使用深奥的知识,只会事倍功半。同时,很多回答也给出具体学习资源和方向,有兴趣的朋友可以仔细阅读原文。

  • 《股市价格预测:大数据和机器学习》

    原文:《Stock Price Prediction With Big Data and Machine Learning》

    关键词:大数据,机器学习,决策树

    本文基于交易历史数据,使用Apache Spark计算系统,利用决策树算法进行股票价格预测。框架如下:获取2个交易日的历史数据(order log),将其组织为交易簿数据(order book)后,从中提取特征,分为3个特征集,分别包含基本特征,时间不敏感特征和时间敏感特征。同时将第一个交易日数据作为训练数据,进行标记,标记每个数据点在某段时间范围内的价格运动方向(比如1秒钟以内)-- 向上,向下或者静止。接下来3个特征集中36个特征向量作为算法输入向量,基于已标记的训练数据,决策树算法构造分类模型。以第二个交易日数据作为测试数据验证分类效果,可成功分类70%的数据。本文模型还有很多改进空间,可应用于更复杂的项目。大数据技术允许使用所有数据构造模型,获取数据集中所有细节,无需采样。

  • 《大规模对冲基金押注AI》

    原文:《the massive hedge fund betting on AI》

    关键词:对冲基金,人工智能,算法交易

    本文讲述世界上最大对冲基金之一, Man Group Plc. 是如何一步步从对AI怀疑、恐惧到拥抱,开发并大规模应用AI进行交易,并获取巨大成功的故事。计算能力的指数级增长和数据的可用性、数据储存成本的降低促使AI迅速发展,AI交易系统可在设定的合规和风控范围内对输入数据进行自适应,在一瞬间决定最佳交易位置,远超人类能力。Man Group也与牛津大学合作,进一步研发深度学习和强化学习系统。文章指出,在未来资产管理中,权力将逐步移交到技术最佳的人手中,并且需要更多聪明的脑袋研发和维护AI系统。对于算法交易,监管是必要的,但是过度的恐惧只会是庸人自扰。

  • 《过拟合的解决之道:更多的数据还是更少的自变量?》

    原文:《More Data or Fewer Predictors: Which is a Better Cure for Overfitting?》

    关键词:过拟合,自变量,逐步回归

    构造交易模型长久以来的问题是数据的贫乏和伴随而来的过拟合。本文以获取股票季回报率为目标,选取27个股票因子为自变量,系统性介绍处理这两方面问题的方法。对于数据的贫乏,现有数据集可重新取样,或者过取样,这种方法叫Bagging。在原有数据基础上,随机挑选N个数据点,重复K次,形成K个BAG并训练模型,最终结果取K个模型结果平均值。另一方面可以利用逐步回归算法,减少自变量数量,以BIC作为判断准则,使模型BIC值最小,最终仅选取2个自变量即可满足预测需求。



量化研究每周精选》每周一期,为大家提精选研报、前沿研究、热门文章等优质内容。
查看所有 量化研究每周精选。欢迎投稿 (i@bigquant.com)。