机器学习

机器学习在金融领域的应用日益广泛,为金融业务的智能化提供了强大动力。它运用算法和模型,自动从海量数据中学习和提取有用信息,无需人工进行复杂编程。在金融风控方面,机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为,降低信贷风险。在投资策略上,通过对历史数据的深度学习,机器能预测市场走势,为投资者提供更精准的建议。同时,机器学习还能优化客户服务,例如通过聊天机器人提供24小时在线咨询,或根据客户行为数据提供个性化金融产品推荐。总的来说,机器学习不仅提升了金融业的效率和智能化水平,也在重塑我们的金融生态。

机器学习实战系列之二:收益复制的LASSO回归方法实践-长江证券-20171206

摘要

收益复制策略的应用场景

广义的收益复制策略在许多场景中都有应用价值。较为典型的收益复制应用情景包括三类:(1)极小型股票池、低调仓频率实现宽基指数跟踪;(2)通过直接持有底层资产,近似模拟基金组合收益,降低管理费用;(3)在持股受限的情形下解决受限个股替代性持仓的权重分配问题。同时,海外市场中的对冲基金指数ETF产品的设计思路对我们也有一定的参考意义。

核心方法:LASSO回归筛选和二次优化模型

系统化地实现收益复制框架并非易事,它需要回答两个核心问题:选什么股票和如何在它们之间进行权重配置。通过机器学习方法中的LASSO回归模型筛选最优股票池,然后求解二次

更新时间:2021-11-26 07:34

华泰人工智能系列之三十:从关联到逻辑,因果推断初探-华泰证券-20200424

摘要

本文介绍了因果推断的框架,并研究了股票所属概念和收益的因果关系

人工智能领域中,机器学习的优势在于强大的关联挖掘能力,然而由于缺乏逻辑推理能力,机器学习无法区分数据中的因果关联和虚假关联。因果推断是用于解释分析的建模工具,可帮助恢复数据中的因果关联,有望实现可解释的稳定预测。本文介绍了基于倾向性评分法的因果推断框架,归纳了三个关键步骤,并分别在Lalonde数据集和A股概念数据中进行因果效应估计。结果显示,2016年以来在中证800成分股中,基金重仓(季调)概念与股票未来一个月收益有正向因果关系,股票质押概念与股票未来一个月收益有反向因果关系,预增和护城河概念与股票收益

更新时间:2021-11-26 07:32

华泰人工智能系列之十二:人工智能选股之特征选择-华泰证券-20180725

摘要

特征选择是人工智能选股策略的重要步骤,能够提升基学习器的预测效果

特征选择是机器学习数据预处理环节的重要步骤,核心思想是从全体特征中选择一组优质的子集作为输入训练集,从而提升模型的学习和预测效果。我们将特征选择方法应用于多因子选股,发现特征选择对逻辑回归_6m、XGBoost_6m基学习器的预测效果有一定提升。我们以全A股为股票池,以沪深300和中证500为基准,构建行业中性和市值中性的选股策略。基于F值和互信息的方法对于逻辑回归_6m、XGBoost_6m、XGBoost_72m基学习器的回测表现具有明显的提升效果。

**随着入选特征数的增加,模型预测效果先上升后下

更新时间:2021-11-26 07:28

金工研究:华泰人工智能系列之七-人工智能选股之Python实战-华泰证券-20170912

摘要

介绍Python安装方法、与机器学习相关的包以及常用命令

Python语言是目前机器学习领域使用最广泛的编程语言之一,拥有众多优秀的包和模块,并且相对简单易学。我们将简单介绍Python语言的特性,常用命令,以及和机器学习相关的包,例如NumPy,pandas,scikit-learn等,希望帮助有一定编程基础的读者迅速上手Python语言。

机器学习选股框架与多因子选股框架类似,具有一定优越性

机器学习中最为主流的方法监督学习,其核心思想是挖掘自变量和因变量之间的规律。我们将经典多因子模型稍加改造,以机器学习的语言描述。在训练阶段,根据历史的因子值X和收益

更新时间:2021-11-26 07:28

华泰人工智能系列之四:人工智能选股之朴素贝叶斯模型-华泰证券-20170817

摘要

本报告对朴素贝叶斯模型及线性判别分析、二次判别分析进行系统测试

“生成模型”是机器学习中监督学习方法的一类。与“判别模型”学习决策函数和条件概率不同,生成模型主要学习的是联合概率分布𝑃(𝑋,𝑌)。本文中,我们从朴素贝叶斯算法入手,分析比较了几种常见的生成模型(包括线性判别分析和二次判别分析)应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。

朴素贝叶斯模型构建细节:月频滚动训练,结合基于时间序列的交叉验证

朴素贝叶斯模型的构建包括特征和标签提取、特征预处理、训练集合成和滚动训练等步骤。我们的模型设置为月频换仓,在每个月月底重新训练并

更新时间:2021-11-26 07:28

2021全球Quant发展报告:高频交易、薪酬、激励

/wiki/static/upload/db/db0cc25a-7ae5-4f16-8c66-4fa58c738cf1.pdf

\

全球著名猎头公司 Selby Jennings在最近的一份Quant全球市场报告中,根据其服务的量化对冲基金及自营交易公司的招聘需求,阐述了2021年全球Quant相关的招聘趋势、激励机制及薪酬现状。我们节选部分跟大家分享。


交易执行与高频交易的现状

对于很多头部的高频交易对冲基金来说,2020年是非常不可

更新时间:2021-11-24 08:20

选股因子系列研究(六十四):基于直观逻辑和机器学习的高频数据低频化应用-海通证券-20200424

在系列前期报告中,我们从不同角度探寻了分钟成交数据、TICK盘口委托数据以及逐笔数据中所包含的选股能力。研究结果表明,高频数据中包含着较为显著的选股能力。即使在剔除了常规低频因子的影响后,高频因子依旧具有显著的选股能力。考虑到系列前期报告在研究构建高频因子时,大多仅使用某一类高频数据进行因子构建,并未将相关数据搭配使用。本文从逻辑以及机器学习两个角度出发,尝试将不同类别的高频数据混合使用并构建低频选股因子。

买入意愿与主动买入的结合。总结前期研究成果可知,委托挂单数据中包含了投资者还未释放的交易意愿,而逐笔成交数据中包含了投资者已进行的交易行为。两者的结合能够更加全面地刻画投资者的交易意愿。

更新时间:2021-11-22 09:43

《因子选股系列研究之二十八》:用机器学习解释市值,特异市值因子-东方证券-20170804

在某个时点上的股票的横截面市值基本上都可以被公司的财务指标和市场因素所解释,也就是说市值解释模型依据了市场上股票的情况,给出了每个公司当期投资者认为的内生市场价值,而解释模型的残差部分,也就是当前市值和内生市值的差,代表了不可解释的部分。残差值越大,代表公司当前的市值向上偏离内生市值越多,那么公司的市值越倾向于回复到其内生市值,也就是说公司股价下跌的可能性越大,反之亦然,特异市值(残差值)是一个相对估值指标,因子值较小的股票在未来表示

我们用线性模型构建了特异市值指标,发现虽然因子表现较好,但是增量信息不明显,究其原因是因为线性的方法没有办法解释市值与财务指标之间的非线性关系,所以导致回归的

更新时间:2021-11-22 07:53

《因子选股系列研究之十五》:东方机器选股模型Ver1.0-东方证券-20161107

机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果

机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力

机器选股模型省去了“因子筛选”、“因子加权

更新时间:2021-11-22 07:53

实盘数据同步功能

机器学习在股票市场上应用价值初见成效,不少机器学习的策略远远超过大盘。虽然目前平台的实盘交易功能还未对外开放,但是不少策略开发者已经在实盘跟踪自己的策略了。

1.功能背景

用户在实盘中可能会遇到实盘账户数据和模拟交易运行数据不一致的情形,比如模拟交易的交易计划里提醒今天收盘时卖出A股票1000股,但今天碰巧由于断网导致卖单失败了。于是当日清算后,模拟交易策略里没有1000股A,但是实盘账户里该股票还继续持有。 策略次日会买入新股票,但实际由于收盘卖出失败,其实没有资金买入新股票。如果不对此类问题进行调整处理的话,随着交易日逐渐增多,那么实盘和模拟交易的差异会逐渐扩大,时间长了会

更新时间:2021-11-19 11:07

CTA程序化交易实务研究之六:基于机器学习的订单簿高频交易策略-民生-131211

/wiki/static/upload/7e/7e6629bc-ac8d-42ad-85a0-c74ecff7229b.pdf

\

更新时间:2021-11-12 11:39

【精品】全网人工智能机器学习免费资源汇总清单

作者:Robbie Allen
编译:BigQuant

早在21世纪初,我在编写关于网络和编程的书的时候,我就发现,互联网是一个很好的资源,但是它还不完善。 那时,博客已开始流行。但是YouTube还不是很普遍,同样Quora,Twitter和播客用户也很少。十年过后,我一直在潜心钻研人工智能和机器学习,局面发生了翻天覆地的变化。互联网上现在有非常丰富的资源——当你要寻找选择你想要的资源时,你很难抉择你应该从哪里开始(和停止)!

![微信图片_20180306160704|690x277](/community/uploads/default/original/2X/5/

更新时间:2021-11-11 07:27

海通金工—基于机器学习和知识图谱的行业轮动

时间:2020 年 07 月 21 日

分析师:冯佳睿、张振岗

摘要

研究背景。我们在之前的行业轮动系列报告中挖掘了几大类的行业因子,例如,量价、宏观、情绪面、高频因子、预期基本面、历史基本面、公募基金观点等。 这些因子通常可以分为两类:行业本身的特征以及基于共同外生变量变动的行业预期收益,但这两类因子都没有考虑行业之间的关联性。因此,在本篇报告中, 我们从另一个角度研究行业收益的可预测性:相关行业的滞后收益率。

理论基础。投资者处理信息的能力有限,当某个行业出现信息或冲击时,专门从事相关行业的投资者可能也无法迅速把握冲击的全部影响。因此,信息会逐渐在各个行业间扩散,导致不同行业的

更新时间:2021-11-04 03:25

XGBoost入门

导语

本文旨在普及机器学习的使用,对于文章涉及到的模型策略不具有实盘参考意义。

Boosted Trees

XGBoost 是 “Extreme Gradient Boosting”的简称,其中“Gradient Boosting”来源于附录1.Friedman的这篇论文。本文基于 gradient boosted tree ,中文可以叫梯度提升决策树,下面简称GBDT,同时也有简称GBRT,GBM。针对gradient boosted tree的细节也可以参考附录2.这篇网页。

监督学习

XGBoost 主要是用来解决有监督学习问题,此类问题利用包含多个特征的训练

更新时间:2021-10-21 08:34

人工智能和机器学习对交易和投资的影响

作者:Michael Harris 编译:caoxiyang


导语

以下是我几个月前在欧洲做的一次演讲的摘录,当时我应邀为一群低调但净资产很高的投资者和交易员做演讲。该主题由主办方决定,是关于人工智能和机器学习对交易和投资的影响。下面的节选分为四个部分,涵盖了原始报告的50%。

人工智能和机器学习对交易的一般影响

人工智能(AI)允许用机器代替人。在20世纪80年代,人工智能研究主要集中在专家系统和模糊逻辑。随着供应算力的成本降低,使用机器解决大规模优化问题变得经济可行。由于硬件和软件方面的进步,如今人工智能专注于使用神经网络和其他学习方法来识别和分析预测变量,

更新时间:2021-10-21 06:30

BigQuant使用指南

{{use_style}}

一.导语

欢迎您来到BigQuant!

BigQuant是一个人工智能量化投资平台,平台内聚集了各类人工智能量化开发者、订阅者和学习者。

二.开发者

如果您是一位充满好奇心的学习者,在BigQuant您可以前往:

1.培训报名

与知识经验丰富的讲师团队,通过线上+线下的方式,学习AI量化入门、因子构建分析、AI量化实践、实战等,纵观全局获得AI量化全貌,由浅入深进阶成为量化大神。

![{w:100}{w:100}{w:100}{w:100}{w:10

更新时间:2021-10-09 02:39

AI量化策略的初步理解

导语

人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。

理解机器学习算法

以StockRanker为例

机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量Y未来的取值,并找到了影响变量Y取值的K个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数 ![](/wi

更新时间:2021-10-08 07:51

《风从海外来 海外AI量化最新前沿》Deep Alpha 海内外最佳实践探索研讨会文字实录

主题:The Impact of AI to Global Asset Managers: The Responses and Adoptions

演讲人:关子敬 先生 Kevin Kwan 彭博亚太区量化及数据科学专家

{w:100}{w:100}谢谢Big Quant的邀请,今天所有策略的绩效仅作交流的用途展示概念,投资人如果对策略本身有兴趣的话,请在我们网站下载白皮书或是与我们的客户经理联系。

1全球资产管理报告 AUM升高 收

更新时间:2021-09-29 03:51

2021上半年金融工程研报暗含量化5大趋势

分析师研报也是行业发展风向标,小Q援引惠博平台及“量化投资与机器学习”回顾2021年1月1日~2021年7月29日热门金融研报,总结量化行业发展趋势,做出如下5个方向猜想:

由于基础因子广为人知,在此基础上进行因子挖掘的收益提升空间相对有限。而且日频数据由于本身的数据量和信息量有限,过度

更新时间:2021-09-23 09:53

【4周年】年度AI量化大课,4大进阶模块12课时,点亮技能树

《AI 量化概览》:认识 AI 量化及其发展应用

《Python 编程基础》:Python 基础语法 + Numpy (Cheatsheet )+ 线上 DataSource 的使用

《Pandas 数据分析》:Panda 语法案例 + Pandas Cheatsheet 与绘图模块使用(K 线图)

![](/wiki/api/attachments.redirect?id=9c5a2a7c-89b8-4bb5-91cf-3d1a557

更新时间:2021-08-25 05:44

自动交易如何增加交易利润?


作者:Harry Nicholls编译:caoxiyang


导语

你有没有想过如何使你的交易策略自动化并增加交易利润?在本文中,我们将介绍算法交易的基本知识,好处和风险。准备好开始自动交易吧! 很多技术分析都涉及观察信号指标,然后根据信号进行交易。正如我在之前的文章“一个让优秀交易者高于其他交易者的行为”中所讨论的那样,你应该在你的交易日志中记录下你所有的交易,当你获得更多的经验时,你应

更新时间:2021-08-24 05:46

关于机器学习,你必须知道的10件事情

很多时候需要为非专业人士解释机器学习,本文提供以下参考。

1.机器学习意味着:从数据中学习

机器学习目前风头正劲,AI也是热搜词汇。只要将合适的数据放入合适的模型,许多问题可以迎刃而解。如果能够帮助你宣传,就叫它AI吧。但请记住,AI,除了在学术界以外,常常是大家可以随意使用的热门词汇,用于描述他们想描述的一切东西。

2.机器学习主要关乎算法与数据,尤其是数据

很高兴能够在机器学习算法,特别是深度学习领域有一些进展,但是数据才是机器学习算法实现的关键因素。机器学习可以没有复杂的算法,但不能没有好的数据。

3.除非你有许多数据,否则你应该坚持使用简单的模型

更新时间:2021-08-24 05:46

关于过拟合:机器学习方法 vs. 传统人工方法

BigQuant AI策略详解 继续讨论: @soft05jun

拟合是一种学习能力,过度拟合是机器学习方法重点在优化解决的问题之一。

关于过拟合,机器学习方法相对传统人工调参有明显的优势:

  1. 让过拟合可衡量:if you cannot measure it, you cannot improve it
    • 机器学习中,我们一般会将数据划分训练集和测试集,通过对比训练集和测试集上的效果差异,我们

更新时间:2021-08-24 05:46

最具价值的50个机器学习应用[2017年]

作者:Mybridge
翻译:BigQuant

我们比较了2017年全年近2万篇关于机器学习应用的文章,并且从中挑选出50篇最有价值的文章分享给大家。

“在硅谷,招聘一名机器学习工程师或数据科学家正在变得像招聘一名职业运动员一样。 这就是对他的要求”——[纽约时报](https://www.nytimes.com/2017/10/22/technology/artificial-in

更新时间:2021-08-24 05:46

机器学习新手十大算法之旅

作者:James Le 编译:caoxiyang


在机器学习中,有一个叫做“世上没有免费午餐”的定理(NFL)。简而言之,我们无法找到一个放之四海而皆准的最优方案,这一点对于监督学习(即预测建模)尤为重要。例如,你不能说神经网络总是比决策树好,反之亦然。因为其中有很多因素在起作用,比如数据集的大小和结构。

因此,您应该针对您的问题尝试多种不同的算法,同时,保留一组数据,即“测试集”来评估性能并选

更新时间:2021-08-24 05:46

分页第1页第2页第3页第4页第5页第14页
{link}