机器学习

机器学习在金融领域的应用日益广泛,为金融业务的智能化提供了强大动力。它运用算法和模型,自动从海量数据中学习和提取有用信息,无需人工进行复杂编程。在金融风控方面,机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为,降低信贷风险。在投资策略上,通过对历史数据的深度学习,机器能预测市场走势,为投资者提供更精准的建议。同时,机器学习还能优化客户服务,例如通过聊天机器人提供24小时在线咨询,或根据客户行为数据提供个性化金融产品推荐。总的来说,机器学习不仅提升了金融业的效率和智能化水平,也在重塑我们的金融生态。

怎么用bigquant的架构来获取每天涨停的个股

怎么用bigquant的架构来获取每天涨停的个股,不是用传统的代码打出来的那种,试过好多次!老是运行的结果错误!

更新时间:2022-01-12 06:18

因子过滤

https://bigquant.com/experimentshare/b6bb3c84df0c4da5bb0b495bc52feb06

\

更新时间:2021-12-14 13:18

金融强化学习的最新进展

论文原名

Recent Advances in Reinforcement Learning in Finance

论文作者

Ben Hambly-牛津大学数学研究所

Renyuan Xu-南加州大学工业与系统工程系

Huining Yang

发布时间

2021 年 12 月 10 日

引言

随着数据量的不断增加,金融行业的快速变化已经彻底改变了解决了数据处理和数据分析技术,带来了新的理论和计算挑战。与经典随机控制理论和其他分析应用相比,解决严重依赖模型假设的财务决策问题的方法,强化学习(RL)的新发展能够充分利用大量减少模型假设的财务数据,并改进复杂

更新时间:2021-12-13 07:43

华泰人工智能系列之二:人工智能选股之广义线性模型-华泰证券-20170622

摘要

采 用统一的视角解释与测试所有的广义线性模型

多因子模型的本质是关于股票当期因子暴露和未来收益之间的线性回归模型。我们希望引入机器学习的思想,对传统多因子模型进行优化,最自然的想法正是从简单的线性模型入手。本文中,我们试图采用统一的视角解释与测试所有的广义线性模型,并分析它们应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。

广 义线性模型的构建和回测

广义线性模型的构建包括特征和标签提取、特征预处理、训练集合成和滚动训练等步骤。最终在每个月底可以产生对全部个股下期收益的预测值,也可以将广义线性模型看作一个因子合成模型,即在每个月底将因子

更新时间:2021-12-10 16:54

中国的股票回报是否可预测?机器学习方法(SSRN-3971419)

论文原名

《Are Stock Returns Predictable in China? A Machine Learning Approach》

论文作者

Huihang Wu, Xingkong Wei, Xiaoyan Zhang

修订时间

2021 年 10 月

关键词

回报预测、样本外预测、机器学习、金融科技

引言

股票收益的可预测性一直是研究的核心问题之一。金融。本文试图引入机器学习方法来回答股票是否在中国,回报是可以预见的。中国股市的108个特征数据来自1997 年 1 月至 2019 年 12 月,本文比较了传统计量经济学模型与

更新时间:2021-12-10 03:34

通过机器学习的经验资产定价(NBER-25398)

NBER工作论文第25398号,2018年12月,2019年9月修订

Shihao Gu 芝加哥大学布斯商学院

Bryan T. Kelly

耶鲁大学; AQR资本管理有限责任公司;美国国家经济研究局 (NBER)

Dacheng Xiu 芝加哥大学布斯商学院

摘要

我们对机器学习方法的典型问题进行了比较分析经验资产定价:衡量资产风险溢价。我们展示了巨大的经济收益投资者使用机器学习预测,在某些情况下将领先的业绩翻倍文献中基于回归的策略。我们确定性能最佳的方法(树和神经网络)并追踪它们的预测增益以允许非线性预测器其他方法错过的交互。所有方法都同意同一组显性预测信号,包括动量、流

更新时间:2021-12-08 03:48

超参搜索状态保存

test h1

test h2

test h3

test h1


\

更新时间:2021-11-30 03:40

跟着李沐学AI—Transformer论文精读 【含研报及视频】

原研报标题:Transformer: Attention is all you need

发布时间:2017年

作者:Ashish Vaswani、 Noam Shazeer、 Niki Parma 、Jakob Uszkoreit、 Llion Jones 、Aidan N. Gomez、 Łukasz Kaiser

{w:100}{w:100}摘要

主流的序列转换模型都是基于复杂的循环神经网络或卷积神经网络,且都包含一个enc

更新时间:2021-11-30 03:07

基于小波分析和支持向量机的指数预测模型-国信证券-20100621

摘要

支持向量机(support vector machine,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它成为克服“维数灾难”和“过学习”等传统困难的有效办法,虽然他还处在飞速发展的阶段,但它的理论基础和实现途径的基本框架已经形成。支持向量机目前主要用来解决分类问题(模式识别,判别分析)和回归问题。而股市行为预测通常为预测股市数据的走势和预测股市数据的未来数值。而当我们将走势看作两种状态(涨、跌),问题便转化为分类问题,而预测股市未来的价格是指为典型的回归问题。我们有理由相信支持向量机可以对股市进行预测。

本报告将从实际应用角度出发,用沪深300

更新时间:2021-11-26 08:52

机器学习在基金绩效评价模型中的应用

摘要

在基金产品实际运行管理的过程中,基金绩效评价具有较 强的现实意义。基金公司管理者对基金经理的业绩考核、 基金经理对历史业绩的原因分析,都需要以科学的绩效归因和 评价模型为依据。

早期的基金评价主要评价基金的收益、超额收益、夏普 率、最大回撤等较为直观的指标。对基金的风格类型、收益来 源、选股能力、风险控制等方面还没有较为客观的评价。在实 践过程中发现,这种方式对于不同主题、不同风格类型的基金 经理的评价缺乏客观性。例如 :一只策略为单纯买入小市值股 票的基金,在 2014 年到 2015 年间,能够取得非常可观的业绩,在许多指标上的表现也可能较为优秀。但是这样的基 金其实存在非

更新时间:2021-11-26 07:56

机器学习系列报告之一:量化投资新起点-申万宏源-20200901

摘要

机器学习是人工智能的一个分支,也是人工智能的核心领域。机器学习的目的在于推理,推理的过程是学习,研究计算机如何模拟人类的学习行为。从1930年代至今,机器学习逐渐发展成为一门独立的学科,已有超过数百种算法被提出。《Do we need hundreds of classifiers to solve real world classification problems?》对17大类共179个分类器,在121个数据集上进行了测试。结果显示,随机森林和支持向量机(高斯核)效果最好,其次是神经网络和Boosting集成方法。

机器学习的一大发展趋势是大众化。早期的机器学习研究人员不仅

更新时间:2021-11-26 07:50

金融科技(Fintech)和数据挖掘研究(七):基于机器学习和知识图谱的行业轮动-海通证券-20200721

摘要

研究背景

我们在之前的行业轮动系列报告中挖掘了几大类的行业因子,例如,量价、宏观、情绪面、高频因子、预期基本面、历史基本面、公募基金观点等。这些因子通常可以分为两类:行业本身的特征以及基于共同外生变量变动的行业预期收益,但这两类因子都没有考虑行业之间的关联性。因此,在本篇报告中,我们从另一个角度研究行业收益的可预测性:相关行业的滞后收益率。

理论基础

投资者处理信息的能力有限,当某个行业出现信息或冲击时,专门从事相关行业的投资者可能也无法迅速把握冲击的全部影响。因此,信息会逐渐在各个行业间扩散,导致不同行业的股票价格先后响应。这一现象构成了某些行业滞后收益率

更新时间:2021-11-26 07:44

机器学习和知识图谱在行业轮动中的应用-海通证券-20200525

摘要

我们在行业轮动系列报告中挖掘了几大类的行业因子,这些因子通常都是行业本身的特征或者基于共同外生变量变动的行业预测收益。

今天我们从另一个角度研究行业收益的可预测性:相关行业的滞后收益率

实际上,如果市场完全理性、无摩擦,滞后行业的收益率是不应该有预测效果的。但真实的市场环境下并非如此。

Lasso回归,全称Least absolute shrinkage and selection operator。该方法是一种压缩估计,也被称作线性回归的L1 正则化。相比于普通最小二乘估计,它通过构造一个惩罚函数,在变量众多的时候快速有效地提取出重要变量,简化模型。其目标函数的表达式如下

更新时间:2021-11-26 07:43

机器学习系列报告之五:锦上添花,机器学习算法助力组合优化-光大证券-20200222

摘要

因子研究一直是量化领域的重心。研究者在基于新数据新想法不断努力挖掘有效因子的同时,如何将手头上已有的因子转化为最终的投资组合也是摆在基金经理们眼前的现实问题。本篇报告的主要研究目的,是在给定最终复合因子的前提下,探索新的多头股票组合构建及优化方式,并运用机器学习算法实现具有操作意义的指数增强构建方法。

因子组合构建方式不多:多为线性优化

线性优化是主流的因子组合构建方式之一,它有着简单直观、优化计算复杂程度低,计算耗时极少的优点。但相应的,它的不足之处是丢弃了不同个股之间的相关性信息,同时会使得最终的优化结果中,个股集中程度较大。

二次规划带来的边际提升有限

更新时间:2021-11-26 07:43

机器学习视角下的考察:因子拥挤度指标及其择时作用-招商证券-20200202

摘要

美国市场对于因子拥挤度指标的重视源于2009年动量因子(Momentum Factor)的大幅回撤,研究者认为因子拥挤度可能是影响因子寿命的重要原因。在国外研究的基础上,我们构建了估值价差、配对相关性、因子波动率、因子长期反转等8个因子拥挤度指标,并分别用这些指标对单因子收益方向和多因子组合权重进行了择时。在单因子择时方面,我们使用了XGBoost和LSTM两种机器学习算法,但是并没有取得明显优于纯做多方式的结果。我们又使用合成指标对多因子模型的权重进行调整,最后根据拥挤度指标加权后的多因子模型小幅战胜了因子等权组合的模型。

正像建筑师在设计公共建筑主体时,兼顾商业价值和美观之

更新时间:2021-11-26 07:37

中高频交易策略再出发:机器学习T0-安信证券-20191230

摘要

中高频机器学习再出发

区别于传统的主观规则交易,机器学习模型可以挖掘出更多的非线性模式。我们设计的集合分类回归策略采用XGBoost机器学习模型,并使用集合学习对机器学习模型进行融合来预测日内涨幅。

日内涨幅影响因子

我们共挖掘出15个因子:隔夜涨幅,集合竞价阶段第一阶段涨幅,集合竞价阶段成交金额占比,第一阶段委比变化,第二阶段委比变化,第二阶段涨停和第二阶段持续上行与日内涨幅有正向影响;集合竞价阶段第二阶段涨幅,集合竞价阶段成交金额占当天总成交金额的比例,第一阶段涨停,第二阶段的委买一价,委卖一价均值的平均值,第二阶段的委买一价,委卖一价均值的最大值,第二

更新时间:2021-11-26 07:37

人工智能研究报告:多周期机器学习选股模型-广发证券-20191204

摘要

选股模型的时效性

信息具有时效性。选股因子对股票收益率的预测能力会随着时间的延后而衰减。机器学习股票收益预测模型的目标是将股票因子与股票未来收益率关联起来。股票因子蕴含的信息决定了模型的预测能力,包括预测准确度和预测窗口长度。如果机器学习模型所用的股票因子中包含的是市场短期情绪面的信息,那么训练出来的机器学习模型可能对市场短期走势的预测能力较强;如果机器学习模型所用的因子包含的是市场中长期的价格扭曲信息,那么训练出来的机器学习模型可能对市场中长期的预测能力较强。

模型构建

本报告按照因子在不同预测窗口长度的IC将选股因子分成不同的组别,并针对不同的股票收益预

更新时间:2021-11-26 07:36

系统化资产配置系列之三:基于AdaBoost机器学习算法的市场短期择时策略-兴业证券-20191017

摘要

本篇是系统化资产配置系列报告的第三篇,对如何利用机器学习算法进行短期市场择时进行了系统介绍。全球金融市场每天产生海量的各类数据,如何筛选并有效利用这些数据来预测股票市场走势一直是一个重要但棘手的问题。短期择时面临的主要困难包括:

  1. 短期市场走势受情绪等因素影响较大;
  2. 如何筛选有效因子;
  3. 非线性因子如何建模;
  4. 因子相关性问题如何解决;
  5. 因子较多时如何避免过拟合等。


**幸运的是,机器学习技术的发展给我们提供了一条有效利用并筛选大量因子数据的途径。本报告中,我们将股市未来的涨和跌定义为一个分类问题,利用机器学习算法来对Wind全A指数的未来

更新时间:2021-11-26 07:36

机器学习实战系列之三:截面融合模型选股框架初探-长江证券-20180311

摘要

截面融合模型选股框架设计

截面融合模型包括三个部分:选择合适的特征空间,选取特定的模型簇,确定融合规则。目前常见的机器学习模型选股多将全部因子作为输入,以单个训练的模型作为预测结果,而截面模型框架通过在特征空间和函数空间进行选择,将多个特征空间下的多个函数簇在特定目标确定的规则下进行融合,达到更加逼近预测关系的结果。

筛选的多个子空间比全空间表现更好,且可以很好捕捉非线性关系

本文从特征子空间和多个解释空间这两个角度出发验证筛选因子空间的有效性,从超额收益、夏普比、信息比、多空夏普比和Calmar比上进行对比,多个大类行业的子空间的策略表现显著优于全空间策略

更新时间:2021-11-26 07:34

机器学习实战系列之二:收益复制的LASSO回归方法实践-长江证券-20171206

摘要

收益复制策略的应用场景

广义的收益复制策略在许多场景中都有应用价值。较为典型的收益复制应用情景包括三类:(1)极小型股票池、低调仓频率实现宽基指数跟踪;(2)通过直接持有底层资产,近似模拟基金组合收益,降低管理费用;(3)在持股受限的情形下解决受限个股替代性持仓的权重分配问题。同时,海外市场中的对冲基金指数ETF产品的设计思路对我们也有一定的参考意义。

核心方法:LASSO回归筛选和二次优化模型

系统化地实现收益复制框架并非易事,它需要回答两个核心问题:选什么股票和如何在它们之间进行权重配置。通过机器学习方法中的LASSO回归模型筛选最优股票池,然后求解二次

更新时间:2021-11-26 07:34

华泰人工智能系列之三十:从关联到逻辑,因果推断初探-华泰证券-20200424

摘要

本文介绍了因果推断的框架,并研究了股票所属概念和收益的因果关系

人工智能领域中,机器学习的优势在于强大的关联挖掘能力,然而由于缺乏逻辑推理能力,机器学习无法区分数据中的因果关联和虚假关联。因果推断是用于解释分析的建模工具,可帮助恢复数据中的因果关联,有望实现可解释的稳定预测。本文介绍了基于倾向性评分法的因果推断框架,归纳了三个关键步骤,并分别在Lalonde数据集和A股概念数据中进行因果效应估计。结果显示,2016年以来在中证800成分股中,基金重仓(季调)概念与股票未来一个月收益有正向因果关系,股票质押概念与股票未来一个月收益有反向因果关系,预增和护城河概念与股票收益

更新时间:2021-11-26 07:32

华泰人工智能系列之十二:人工智能选股之特征选择-华泰证券-20180725

摘要

特征选择是人工智能选股策略的重要步骤,能够提升基学习器的预测效果

特征选择是机器学习数据预处理环节的重要步骤,核心思想是从全体特征中选择一组优质的子集作为输入训练集,从而提升模型的学习和预测效果。我们将特征选择方法应用于多因子选股,发现特征选择对逻辑回归_6m、XGBoost_6m基学习器的预测效果有一定提升。我们以全A股为股票池,以沪深300和中证500为基准,构建行业中性和市值中性的选股策略。基于F值和互信息的方法对于逻辑回归_6m、XGBoost_6m、XGBoost_72m基学习器的回测表现具有明显的提升效果。

**随着入选特征数的增加,模型预测效果先上升后下

更新时间:2021-11-26 07:28

金工研究:华泰人工智能系列之七-人工智能选股之Python实战-华泰证券-20170912

摘要

介绍Python安装方法、与机器学习相关的包以及常用命令

Python语言是目前机器学习领域使用最广泛的编程语言之一,拥有众多优秀的包和模块,并且相对简单易学。我们将简单介绍Python语言的特性,常用命令,以及和机器学习相关的包,例如NumPy,pandas,scikit-learn等,希望帮助有一定编程基础的读者迅速上手Python语言。

机器学习选股框架与多因子选股框架类似,具有一定优越性

机器学习中最为主流的方法监督学习,其核心思想是挖掘自变量和因变量之间的规律。我们将经典多因子模型稍加改造,以机器学习的语言描述。在训练阶段,根据历史的因子值X和收益

更新时间:2021-11-26 07:28

华泰人工智能系列之四:人工智能选股之朴素贝叶斯模型-华泰证券-20170817

摘要

本报告对朴素贝叶斯模型及线性判别分析、二次判别分析进行系统测试

“生成模型”是机器学习中监督学习方法的一类。与“判别模型”学习决策函数和条件概率不同,生成模型主要学习的是联合概率分布𝑃(𝑋,𝑌)。本文中,我们从朴素贝叶斯算法入手,分析比较了几种常见的生成模型(包括线性判别分析和二次判别分析)应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。

朴素贝叶斯模型构建细节:月频滚动训练,结合基于时间序列的交叉验证

朴素贝叶斯模型的构建包括特征和标签提取、特征预处理、训练集合成和滚动训练等步骤。我们的模型设置为月频换仓,在每个月月底重新训练并

更新时间:2021-11-26 07:28

2021全球Quant发展报告:高频交易、薪酬、激励

/wiki/static/upload/db/db0cc25a-7ae5-4f16-8c66-4fa58c738cf1.pdf

\

全球著名猎头公司 Selby Jennings在最近的一份Quant全球市场报告中,根据其服务的量化对冲基金及自营交易公司的招聘需求,阐述了2021年全球Quant相关的招聘趋势、激励机制及薪酬现状。我们节选部分跟大家分享。


交易执行与高频交易的现状

对于很多头部的高频交易对冲基金来说,2020年是非常不可

更新时间:2021-11-24 08:20

分页第1页第2页第3页第4页第5页第15页
{link}