机器学习

机器学习在金融领域的应用日益广泛,为金融业务的智能化提供了强大动力。它运用算法和模型,自动从海量数据中学习和提取有用信息,无需人工进行复杂编程。在金融风控方面,机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为,降低信贷风险。在投资策略上,通过对历史数据的深度学习,机器能预测市场走势,为投资者提供更精准的建议。同时,机器学习还能优化客户服务,例如通过聊天机器人提供24小时在线咨询,或根据客户行为数据提供个性化金融产品推荐。总的来说,机器学习不仅提升了金融业的效率和智能化水平,也在重塑我们的金融生态。

机器学习:4-线性回归构建因子

  • 运行环境:AIStudio 3.0.0
  • 线性回归:构建因子+单因子策略回测
  • 策略说明:==本代码以教学目的为主,请自行调参==


回测图:

\

策略源码:

{{membership}}

[https://bigquant.com/codeshare/cd8638d7-21c0-4df4-8a29-e9f1cc227df0](https://bigquant.com/codeshare/cd8638

更新时间:2024-04-25 07:38

机器学习:3-逻辑回归预测上涨概率

  • 运行环境:AIStudio 3.0.0
  • 机器学习:逻辑回归策略:预测上涨概率
  • 策略说明:==本代码以教学目的为主,请自行调参==


回测图:

\

策略源码:

{{membership}}

[https://bigquant.com/codeshare/b2a658f9-e445-422b-95f9-b57a50e23562](https://bigquant.com/codeshare/b2a65

更新时间:2024-04-25 07:38

机器学习:2-线性回归预测上涨概率

  • 运行环境:AIStudio 3.0.0
  • 机器学习:线性回归策略:预测上涨概率
  • 策略说明:==本代码以教学目的为主,请自行调参==


回测图:


\

策略源码:

{{membership}}

[https://bigquant.com/codeshare/3c3165db-d37e-4c8a-90f6-8af10855fb18](https://bigquant.com/codeshare/3c3

更新时间:2024-04-25 07:38

量化机器学习系列分享(六)无监督学习常见算法

1. 无监督学习之聚类算法

1.1 聚类方法简介

聚类算法是一种无监督学习算法,它和监督学习任务下的分类算法是有明显对比的

  • 监督学习的分类算法:数据属于哪一个类别是有标签定义的,模型有没有分类正确我们也是可以明显评判出来的
  • 无监督学习的聚类算法:数据没有明确的标签表明类别,聚类的正确与否、好与坏,都是很难评价的

聚类算法的目的,是将数据集中的数据,划分为不同的类别,但是这个类别没有标签去衡量

  • 目的可能是为了人为地将数据按照特征归类,比方说数据集中的个体,我想按照身高和体重,分出胖和瘦的区别来
  • 目的可能是为了探寻数据背后的隐藏标签,比方说数据集中的个体,我在采

更新时间:2024-01-10 11:34

量化机器学习系列分享(三)逻辑回归与优化方法

1. 逻辑回归

1.1 分类问题的定义

分类问题的标签是离散型的变量,我们的目的是用特征,来预测标签归属于几个类别当中的某一种

  • 如果是预测标签属于两个类别当中的哪一种,就叫二分类问题,比方说预测股票明天是涨,还是不涨,两个类别
  • 如果是预测标签属于多个类别当中的哪一种,就叫多分类问题,比方说预测股票明天是涨,还是跌,还是不涨不跌,还是涨停,还是跌停,五个类别

本次分享我们主要讨论二分类问题

对于二分类问题,我们需要把定性的类别,转换为定量的数字,来让计算机理解类别的概念

  • 一种做法是将一个分类定义为1,另一个分类定义为0,比方说预测股票明天是涨,还

更新时间:2024-01-10 03:19

量化机器学习系列分享(二)模型评估与特征选择

1. 模型评估

1.1 偏差与方差

上次分享我们提到过,模型的好坏评价标准,是模型在测试集上的预测是否准确,好比一个学生在期末考试当中拿高分才是学的好

模型在测试集上的预测误差(Error),可以分为三种来源

  • 偏差(Bias):高偏差的模型表现为:

    对于一个预测样本,不仅预测不准,而且如果模型再训练一遍,还是同样地预测不准

    好比我们期待一个同学期末考90分,但是他只考了50分,如果再给他一次机会,重学一遍再参加考试,他还是考了50分,距离90分一直很远

  • 方差(Variance):高方差的模型表现为:

    对于一个预测样本,

更新时间:2024-01-10 03:19

量化机器学习系列分享(四)更多种类的分类模型

我们今天分享的四种模型,包括上次分享的逻辑回归,都是一些轻量级的分类模型,适用于数据量少,特征量少的分类任务

\

1. 支持向量机(SVM)

1.1 SVM的概念

支持向量机(Support Vector Machine)是在神经网络流行之前最强大的机器学习算法

SVM在二分类问题上的逻辑原理是:

  • 假设我们的样本中有两个类别,我们可以把样本画到图上
  • 如果切一刀下去,怎样切可以尽可能地把两个类别尽可能地分开

比方说以下图像中

![](/wiki/api/attachments.redirect?id=620959a3-ac1c-4a55-ab93-cd1

更新时间:2024-01-10 03:19

量化机器学习系列分享(五)树模型与组合模型

nan1. 决策树模型

1.1 决策树模型的概念

决策树是机器学习中的一个典型的非参数模型,它使用规则,而不是参数,来定义模型

  • 这种决策方式其实是和人类最直接的思考方式是类似的
  • 例如,我们使用身高这一特征,去预测性别这一标签的时候,一个比较直觉的方式是,如果身高大于 175 就分类为男生,如果身高小于 175 就分类为女生

以下是一个典型的决策树模型:使用三个特征:X1,X2,X3;预测一个标签 Y

  • 图中的圆圈和

更新时间:2024-01-09 11:51

dai+optuna+vectorbt编写CTA策略并调参

https://bigquant.com/codeshare/0ffb5755-3b0a-4e5f-95d8-4d37e9d5fac0


https://bigquant.com/codeshare/77aeff8a-3028-44b5-93ec-68867a08466d

\

更新时间:2023-11-13 02:45

开源金工|看看顶级量化私募择时选股能力

222

更新时间:2023-07-21 03:16

BigQuant 最佳实践

  • BigQuant使用案例
  • 最佳使用方式

\

更新时间:2023-06-29 06:56

华西证券机器学习择时系列之三:LSTM模型市场择时策略 2021/09/09

摘要

量化择时交易策略

机器学习量化交易策略的制定,是通过从海量历史数据中,利用计算机强大的处理能力,挖掘并分析出那些能够为投资者带来收益的各种大概率可行的投资方式来实现的。通过数学模型对这些策略进行分析并加以验证,以期望让投资者获得更高更稳定的收益,或更合理地规避风险。

长短期记忆模型具有明显优势

长短期记忆模型通过记忆单元有效地学习长期依赖关系,在金融市场预测中具有明显优势长短期记忆网络是人工神经网络的一种,具有负责计算时间序列中各个观测值之间依赖性的能力,同时具有快速适应趋势中急剧变化的固有能力。所以,长短期记忆模型可以在波动的时间序列中很好地工作。在处理股

更新时间:2023-06-13 06:53

基于条件随机场的周频择时策略 广发证券_20180403

摘要

报告摘要:条件随机场模型及股市择时思路自1988年,西蒙斯成立了大奖章基金并在多次股灾中取得稳定的收益后,纯技术量化型的投资策略开始受到投资者的广泛关注,而机器学习正是这种技术量化型策略的中坚力量。目前使用较为成熟的模型之一是隐马尔可夫模型HMM,其与条件随机场是一对“生成判别对”。相比起HMM,条件随机场具有更加灵活等优点。事实上,条件随机场(Conditional Random Field,CRF)是描述给定一组输入随机变量条件下另一组输出变量的条件概率分布的模型。基于条件随机场,我们可以建立观测指标值和走势状态及走势状态与走势状态之间复杂的函数依赖关系,从而,当给定新的观测

更新时间:2023-06-13 06:53

Table_Title 机器学习多因子动态调仓策略 广发证券_20180426

摘要

传统因子表现不佳,因子择时大显身手在历史上表现良好的规模、反转和流动性因子在17年以来都出现了明显的回撤,导致主流多因子选股策略表现欠佳。在这样的大背景下,如何把握Alpha因子的风格轮动,选择最有效的风格因子,成为重要的研究课题。

基于机器学习的因子择时框架本报告选择常见的7个风格因子,通过机器学习方法,基于历史数据提炼因子风格轮动的规律,将因子IC历史信息、宏观经济变量、市场变量等信息作为特征,采用性能优良的XGBoost模型对因子未来的IC进行预测,来衡量不同风格因子未来选股的有效性。在因子配权时,赋予预期表现好的因子更高的权重,而减小预期表现不佳的因子的权重。

更新时间:2023-06-13 06:53

BigQuant复现研报


\

更新时间:2023-06-13 06:50

基于深度学习理念的高频交易策略-国泰君安-20200319

本报告导读:机器学习寻找的是适宜交易异象的稳定周期频率,并不是寻找特定参数组下的高收益曲线(即参数过拟合)。

摘要

目前获取战胜基准指数的主要途径是从多因子模型角度来考虑的,其本质上都是通过股票间的横向比较来获取超额收益,这也是我们提出T0系列策略的初衷,希望将==个股择时与多因子模型结合==起来,给投资者带来更多思路。

深度学习在图像处理领域更加成熟,其类似于一种图像降维技术,通过提取图像中的特征值对类似图像进行匹配。本文通过深度学习的方法对参数组及胜率的多维空间进行降维,并对其分布形态进行评估,从而确定模型泛化能力。

自2015年5月至2019年5月,相对上证50指数(股票采

更新时间:2023-06-01 14:28

学界纵横系列:基于机器学习的日内波动率预测

摘要

历史背景

长时间来,学界及业界开发了包括日内估计、GARCH、连续时间模型等近200-300种描述及预测波动率的模型。从交易信号到算法策略,这些模型为许多量化组合提供了极为重要的参考。

预测波动率的重要性

波动率模型为建立交易信号、算法策略、量化组合的分配都提供了重要参考。

波动率预测的难点

对于金融市场上不同类的资产,仅仅一类模型将很难给出一个有效的预测。我们需要对不同的资产标的针对性地使用不同种类的波动率模型来得到可靠的结果。

人工选择合适的模型是一个非常复杂且低效的方法。通过监督性学习算法,我们可以自动化这一过程。同时,通过对一些指标的监

更新时间:2023-06-01 14:28

中高频交易策略再出发:机器学习T0-安信证券-20191230

摘要

中高频机器学习再出发

区别于传统的主观规则交易,机器学习模型可以挖掘出更多的非线性模式。我们设计的集合分类回归策略采用XGBoost机器学习模型,并使用集合学习对机器学习模型进行融合来预测日内涨幅。

日内涨幅影响因子

我们共挖掘出15个因子:隔夜涨幅,集合竞价阶段第一阶段涨幅,集合竞价阶段成交金额占比,第一阶段委比变化,第二阶段委比变化,第二阶段涨停和第二阶段持续上行与日内涨幅有正向影响;集合竞价阶段第二阶段涨幅,集合竞价阶段成交金额占当天总成交金额的比例,第一阶段涨停,第二阶段的委买一价,委卖一价均值的平均值,第二阶段的委买一价,委卖一价均值的最大值,第二

更新时间:2023-06-01 14:28

机器学习高频交易-安信证券-20180223

摘要

从高频到低频

机器学习在高频量化策略上应用更加容易

从线性到非线性

机器学习下的非线性比线性更能榨取数据的价值,但也更容易过度拟合,因此需要合理使用

从单次分析到推进分析

推进分析更加符合实盘状态下盘后更新模型的实际情况

从分类到回归

回归经常能优于简单的分成两类

预测值相关

好的预测值不一定带来好的交易信号

正文

[/wiki/static/upload/92/925cb7dc-1b8c-46db-aed5-54ccb355b557.pdf](/wiki/static/upload/92/925cb7dc-1b

更新时间:2023-06-01 14:28

基于雪球网负面情绪比因子的择时研究 兴业证券-20180409

摘要

作为“猎金系列二十一”,我们研究雪球网负面情绪指标在择时方面的效用。研究的时间窗为2014年1月至2018年2月底,期间雪球网共计有万左右的帖子,涵盖425万用户的行为。通过机器学习的方式对帖子进行情绪判断,进一步构建周度情绪择时因子,并用该因子对主流指数进行择时,效果显著。构建相应指数的周度负面情绪比因子,观察当前负面情绪比因子与过去一年历史三分位数的位置关系,如果当前负面情绪比因子下穿历史上三分位点或者下三分位点(分别对应两种策略),那么满仓操作,否则空仓操作。

对上证50指数、中证100指数、沪深300指数、中证500指数、中证800指数、国证1000指数分别进行择时,时

更新时间:2023-06-01 14:28

用机器学习解释市值:特异市值因子-东方证券-20170804

研究结论

在某个时点上的股票的横截面市值基本上都可以被公司的财务指标和市场因素所解释,也就是说市值解释模型依据了市场上股票的情况,给出了每个公司当期投资者认为的内生市场价值,而解释模型的残差部分,也就是当前市值和内生市值的差,代表了不可解释的部分。残差值越大,代表公司当前的市值向上偏离内生市值越多,那么公司的市值越倾向于回复到其内生市值,也就是说公司股价下跌的可能性越大,反之亦然,特异市值(残差值)是一个相对估值指标,因子值较小的股票在未来表现更好。

我们用线性模型构建了特异市值指标,发现虽然因子表现较好,但是增量信息不明显,究其原因是因为线性的方法没有办法解释市值与财务指标

更新时间:2023-06-01 14:28

基于直观逻辑和机器学习的高频数据低频化应用-海通证券-20200424

摘要

在系列前期报告中,我们从不同角度探寻了分钟成交数据、TICK盘口委托数据以及逐笔数据中所包含的选股能力。研究结果表明,高频数据中包含着较为显著的选股能力。即使在剔除了常规低频因子的影响后,高频因子依旧具有显著的选股能力。考虑到系列前期报告在研究构建高频因子时,大多仅使用某一类高频数据进行因子构建,并未将相关数据搭配使用。本文从逻辑以及机器学习两个角度出发,尝试将不同类别的高频数据混合使用并构建低频选股因子。

买入意愿与主动买入的结合。总结前期研究成果可知,委托挂单数据中包含了投资者还未释放的交易意愿,而逐笔成交数据中包含了投资者已进行的交易行为。两者的结合能够更加全面地刻画投资

更新时间:2023-06-01 14:28

机器学习多因子动态调仓策略 广发证券_20180426_

摘要

传统因子表现不佳,因子择时大显身手

在历史上表现良好的规模、反转和流动性因子在17年以来都出现了明显的回撤,导致主流多因子选股策略表现欠佳。在这样的大背景下,如何把握Alpha因子的风格轮动,选择最有效的风格因子,成为重要的研究课题。

基于机器学习的因子择时框架

本报告选择常见的7个风格因子,通过机器学习方法,基于历史数据提炼因子风格轮动的规律,将因子IC历史信息、宏观经济变量、市场变量等信息作为特征,采用性能优良的XGBoost模型对因子未来的IC进行预测,来衡量不同风格因子未来选股的有效性。在因子配权时,赋予预期表现好的因子更高的权重,而减小预期表现不佳

更新时间:2023-06-01 14:28

以TMLE为例介绍机器学习下的因果性分析-安信证券-20180309

摘要

从IC、IR到另类线性归因

基于IC、IR的单因子分析是传统多因子分析的基石。但是IC、IR分析出却不能考虑到多因子模型中因子与因子之间的相互影响。因此我们以之前报告介绍的标准神经网络回归为例,用另类线性归因对因子进行了分析

从线性归因到非线性归因

所有线性归因都是基于因子单调性(线性)的强假设。但是在机器学习的非线性世界中,这个强假设不复存在。非线性的机器学习算法需要非线性的归因方式

从相关性到因果性

所有的传统归因方式都是基于相关性的而非因果性。因果分析也是机器学习未来的一个重点。我们以TMLE为例介绍机器学习下的因果

更新时间:2023-06-01 14:28

机器学习策略止损无效0

问题

我有一个深度学习策略,我在主函数中添加了跟踪止损的逻辑没有什么用。因为某只股票达到止损条件会卖出,但是第二天机器学习策略根据算法又会将这只股票买入。所以止损策略不能发挥作用啊。请问各位高手有无办法解决?

更新时间:2023-06-01 02:13

分页第1页第2页第3页第4页第5页第14页
{link}