随机森林

随机森林是一种在金融领域中广泛应用的机器学习算法,它通过构建多个决策树并对它们的结果进行综合,以提高预测精度和稳定性。在金融风险评估、信贷审批、投资策略以及市场分析等多个场景中,随机森林能够帮助专业人士有效处理大量数据,挖掘潜在的非线性关系和复杂模式。通过这种方式,金融机构能够更准确地评估风险,制定更科学的决策,从而在竞争激烈的市场环境中保持优势。

【历史文档】策略示例-用随机森林回归算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-16 02:00

【历史文档】算子样例-机器学习

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-15 07:49

机器学习:12-随机森林

  • 运行环境:AIStudio 3.0

  • 策略说明:==本代码以教学目的为主,请自行调参==


回测图:

\

策略源码:


{{membership}}

[https://bigquant.com/codeshare/ccd34b84-4b39-4c48-b082-3859335a6c20](https://bigquant.com/codeshare/ccd34b84-4b39-4c48-b082-

更新时间:2024-04-25 07:40

ai算法根据什么学习和判断的

特征里没有写,昨天的收盘价只有今天的收盘价,dnn模型随机森林会根据两日收盘价判断涨跌吗?

更新时间:2024-01-31 17:01

Machine Learning is Fun! — 全世界最简单的机器学习入门指南

你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!

这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。

本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。

什么是机器学习?

机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene

更新时间:2024-01-26 07:22

机器学习常用35大算法盘点

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然,本文收录的算法并不完全,分类的方式也不唯一。不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。 在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式

更新时间:2024-01-23 08:14

DeepAlpha短周期因子研究系列之:随机森林在量化选股中的应用

一、引言

DeepAlpha系列报告旨在从基础量价数据中,借鉴深度学习模型,应用于量化投资领域。学习模型包括:全连接深度网络(DNN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)、对抗生成网络(GAN)、ResNet、TabNet,同时报告将引入自然语义识别NLP领域近年热门算法如BERT、Transformer、GPT、XLNet等,尝试构建各类DeepAlpha模型。

本篇文章通过传统机器学习算法对相同的量价因子进行实验,方便与深度学习模型进行对比。

二、随机森林算法介绍

随机森林属于集成学习的一种,通过集成学习的Bagging思想将多棵树集成的一种算法:它的基本单

更新时间:2023-12-02 14:12

随机森林的直观理解

导语

对于那些认为随机森林是黑匣子算法的人来说,这篇帖子会提供一个不同的观点。接下来,我将从4个方面去理解随机森林模型。

特征有多重要

在sklearn随机森林中使用model.feature_importance来研究其重要特征是很常见的。重要特征是指与因变量密切相关的特征,并且对因变量的变化影响较大。我们通常将尽可能多的特征提供给随机森林模型,并让算法反馈对预测最有用的特征列表。但仔细选择正确的特征可以使我们的目标预测更加准确。

计算feature_importances的想法很简单,但却很有效。

步骤

  1. 训练随机森林模型(假定有正确的超

更新时间:2023-11-26 16:58

用随机森林预测股价走势


机器学习已经广泛地应用在对于资产市场的分析中。但是,在浩如烟海的机器学习算法中,到底哪种算法能取得更优的预测效果呢?发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后的涨跌方向进行了预测。发现相比于SVM、线性判别分析等模型,随机森林可以取得更优秀的预测结果:能够达到85%-95%的准确率。

摘要

为了最小化预测误差,文章将预测股价的走势看做一个二分类问题(涨or跌),使用集成机器学习建模解决。文章里利用RSI(相对强弱指数)、KD随机指标、MACD等6个常用的技术指标作为分类的特征,对随机森林模型进行训练。最后发现,模型中

更新时间:2023-11-26 16:58

读取csv文件是乱码怎么办?

根据《如何固化深度学习、随机森林和StockRanker模型|模型固化》https://bigquant.com/wiki/doc/shendu-senlin-moxing-fT26iI6EAI中的StockRanker模型的固化形成了model_stockranker.csv,为了了解model_stockranker.csv的内容,想打开model_stockranker.csv文件,不过,用ss=pd.read_csv('model_stockranker.csv'),print(ss)显示乱码,如何解决,谢谢?

[https://bigquant.com/experimentsh

更新时间:2023-10-09 06:17

随机森林的pred_label预测的是什么值

{w:100} {w:100}采用如图标注方式,将收益率分为20类,但是pred_label的值是预测的分类值还是收益率的值呢?有点迷糊了,这种数据标注方式怎么实现模型回归的评估数据呢?如MSE、MAE等

更新时间:2023-10-09 06:05

如何在随机森林里面使用自定义因子进行回测

随机森林的例子里是使用特征列表里面已有的预计算因子作为因子添加的, 请问 不是预计算的因子 或者是一些自定义的因子 如何去作为输入源输入到随机森林里面 请技术大佬指点一下

\

更新时间:2023-10-09 03:32

关于随机森林的输入因子问题

https://bigquant.com/experimentshare/8cd8ab7f055741c09a365fdf91ffd9b7

随机森林的例子里是使用特征列表里面已有的预计算因子作为因子添加的, 请问 不是预计算的因子 或者是一些自定义的因子 如何去作为输入源输入到随机森林里面 请技术大佬指点一下

\

更新时间:2023-10-09 03:25

能跨组件拿到组件的输入参数么?

问题1:比如在其他自定义的python组件,拿到随机森林训练:树的个数

问题2: 这种在超参数调优的时候,是不是也能正确拿到。(如果我在超参数调优时候有调整该参数) {w:100}{w:100}

更新时间:2023-10-09 02:54

平台、资源配置——已经加到了16G,才跑随机森林100棵树就挂了

{w:100}{w:100}已经解决,似乎跑超参数调优时候,cpu不是真正的运行cpu

更新时间:2023-10-09 02:51

随机森林入门

0.相关概念

**分类器:**分类器就是给定一个样本的数据,判定这个样本属于哪个类别的算法。例如在股票涨跌预测中,我们认为前一天的交易量和收盘价对于第二天的涨跌是有影响的,那么分类器就是通过样本的交易量和收盘价预测第二天的涨跌情况的算法。

**分裂:**在决策树的训练过程中,需要一次次的将训练数据集分裂成两个子数据集,这个过程就叫做分裂。

**特征:**在分类问题中,输入到分类器中的数据叫做特征。以上面的股票涨跌预测问题为例,特征就是前一天的交易量和收盘价。

**待选特征:**在决策树的构建过程中,需要按照一定的次序从全部的特征中选取特征。待选特征就是

更新时间:2023-06-14 03:02

【数学】随机森林入门

\

导语


随机森林要做的事情呢,与上一篇SVM一样,其实也是一个分类的过程。解决的问题是:给一堆数据,我们想把它们分为两类,贴上相应的标签。

相关概念

分类器:分类器就是给定一个样本的数据,判定这个样本属于哪个类别的算法。例如在股票涨跌预测中,我们认为前一天的交易量和收盘价对于第二天的涨跌是有影响的,那么分类器就是通过样本的交易量和收盘价预测第二天的涨跌情况的算法。

分裂:在决策树的训练过程中,需要一次次的将训练数据集分裂成两个子数据集,这个过程就叫做分裂。

特征:在分类问题中,输入到分类器中的数据叫做特征。以上面的股票涨跌预测问题为例,特征就

更新时间:2023-06-14 03:02

初学者应该知道的十大机器学习算法

摘要

机器学习算法被描述为学习一个目标函数 (f),它最好地将输入变量 (X) 映射到输出变量 (Y):Y = f(X)

最常见的机器学习类型是学习映射 Y = f(X) 以针对新 X 预测 Y。这称为预测建模或预测分析,目标就是要做出最准确的预测。

{w:100}{w:100}{w:100}{w:100}

十种机器学习算法

TOP MACHINE LEARNING ALGORITHMS YOU SHOULD KNOW

更新时间:2023-06-14 03:02

各模型比较

1、StockRanker

{w:100}

2、随机森林

{w:100}

3、XGBoost

{w:100}

4、D

更新时间:2023-01-30 08:11

用随机森林-分类算法实现A股股票选股

策略案例


https://bigquant.com/experimentshare/a326c3952ba54193aa9b19576d1e0c22

\

更新时间:2022-12-30 01:01

xgboost和随机森林为什么没有loss和mse

问题

也没有模型训练过程,直接就1分钟不到就直接输出 预测结果了


\

解答

①数据量太少

②xgboost建议使用这个模块: {w:100}

随机森林建议使用这个模块:

{w:100}

更新时间:2022-12-20 14:20

StockRanker选股+随机森林大盘风控

https://bigquant.com/experimentshare/22203b7b143a409c9c6ef54b8be573cb

\

更新时间:2022-10-29 10:52

MSCI-机器学习各模型性能比较:树模型、随机森林、神经网络与22个因子有效性

本文由BigQuant翻译来自于MSCI研究,原文标题为《机器学习因子:在线性因子模型中捕捉非线性》

作者:George Bonne, Jun Wang, Howard Zhang

发表时间:2021年3月

概要

虽然机器学习(机器学习)算法已经存在了几十年,但最近它们在包括金融在内的许多领域受到了越来越多的关注,尤其是在解释资产回报的应用上。虽然线性因子模型多年来一直是理解风险敞口、风险和投资组合表现的重要工具,但没有哪一种模型是一成不变的,即因子敞口和回报之间的关系必须是线性的。

在这里,我们研究了在去除线性成分后,机器学习算法在多大程度上可以检测因子暴露和安全回报之间的关

更新时间:2022-10-14 01:29

机器学习模型在因子选股上的比较分析-20190512-广发证券

摘要

研究内容本报告采用机器学习方法从历史数据中学习股票因子和收益率的关系,建立股票收益预测模型。本报告研究的机器学习方法包括多类别逻辑回归(MLR)、支持向量机(SVM)、随机森林(RF)、极限梯度提升树(XGBoost)、深层神经网络(DNN)等5类模型。

机器学习模型介绍本报告考察的5种机器学习模型中,MLR和线性SVM属于线性分类器,但优化目标不同。RF、XGBoost和DNN属于非线性分类器。其中,RF和XGBoost是以决策树为基学习器的集成学习方法,但模型集成的方式不一样。DNN是深度学习方法。这5种模型在机器学习领域具有很强的代表性。

策略表现从实证结果来看,5种机

更新时间:2022-10-09 06:01

随机森林模型优化调参的尝试

引言

之前的随机森林选股策略的回测效果并不是很好,笔者参考一篇硕士论文得到了因子选择的思路,对原有模型进行优化调参,得到了不错的回测收益效果。笔者将模型链接附到下方,方便大家可以尝试一下不同的因子组合。

/wiki/static/upload/f6/f60ca050-8291-48bb-9e28-fb650601f075.pdf

因子研究思路

![优化流程{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}]

更新时间:2022-08-09 07:07

分页第1页第2页