你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!
这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。
本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。
机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene
更新时间:2024-12-04 08:53
最近上传了一个新版的随机森林模块,大家可以尝试使用一下。
因子为市盈率和过去30天和过去90天价格, 标签为未来五日收益率。
[https://bigquant.com/codesharev3/471c0bcd-ec7
更新时间:2024-08-22 05:01
机器学习已经广泛地应用在对于资产市场的分析中。但是,在浩如烟海的机器学习算法中,到底哪种算法能取得更优的预测效果呢?发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后的涨跌方向进行了预测。发现相比于SVM、线性判别分析等模型,随机森林可以取得更优秀的预测结果:能够达到85%-95%的准确率。
为了最小化预测误差,文章将预测股价的走势看做一个二分类问题(涨or跌),使用集成机器学习建模解决。文章里利用RSI(相对强弱指数)、KD随机指标、MACD等6个常用的技术指标作为分类的特征,对随机森林模型进行训练。最后发现,模型中
更新时间:2024-05-20 02:09
本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然,本文收录的算法并不完全,分类的方式也不唯一。不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。 在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式
更新时间:2024-05-20 02:09
对于那些认为随机森林是黑匣子算法的人来说,这篇帖子会提供一个不同的观点。接下来,我将从4个方面去理解随机森林模型。
在sklearn随机森林中使用model.feature_importance来研究其重要特征是很常见的。重要特征是指与因变量密切相关的特征,并且对因变量的变化影响较大。我们通常将尽可能多的特征提供给随机森林模型,并让算法反馈对预测最有用的特征列表。但仔细选择正确的特征可以使我们的目标预测更加准确。
计算feature_importances的想法很简单,但却很有效。
更新时间:2024-05-20 02:09
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-17 07:25
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-17 06:42
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-16 02:00
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-15 07:49
运行环境:AIStudio 3.0
策略说明:==本代码以教学目的为主,请自行调参==
回测图:
\
{{membership}}
[https://bigquant.com/codeshare/ccd34b84-4b39-4c48-b082-3859335a6c20](https://bigquant.com/codeshare/ccd34b84-4b39-4c48-b082-
更新时间:2024-04-25 07:40
特征里没有写,昨天的收盘价只有今天的收盘价,dnn模型随机森林会根据两日收盘价判断涨跌吗?
更新时间:2024-01-31 17:01
DeepAlpha系列报告旨在从基础量价数据中,借鉴深度学习模型,应用于量化投资领域。学习模型包括:全连接深度网络(DNN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)、对抗生成网络(GAN)、ResNet、TabNet,同时报告将引入自然语义识别NLP领域近年热门算法如BERT、Transformer、GPT、XLNet等,尝试构建各类DeepAlpha模型。
本篇文章通过传统机器学习算法对相同的量价因子进行实验,方便与深度学习模型进行对比。
随机森林属于集成学习的一种,通过集成学习的Bagging思想将多棵树集成的一种算法:它的基本单
更新时间:2023-12-02 14:12
根据《如何固化深度学习、随机森林和StockRanker模型|模型固化》https://bigquant.com/wiki/doc/shendu-senlin-moxing-fT26iI6EAI中的StockRanker模型的固化形成了model_stockranker.csv,为了了解model_stockranker.csv的内容,想打开model_stockranker.csv文件,不过,用ss=pd.read_csv('model_stockranker.csv'),print(ss)显示乱码,如何解决,谢谢?
[https://bigquant.com/experimentsh
更新时间:2023-10-09 06:17
采用如图标注方式,将收益率分为20类,但是pred_label的值是预测的分类值还是收益率的值呢?有点迷糊了,这种数据标注方式怎么实现模型回归的评估数据呢?如MSE、MAE等
更新时间:2023-10-09 06:05
随机森林的例子里是使用特征列表里面已有的预计算因子作为因子添加的, 请问 不是预计算的因子 或者是一些自定义的因子 如何去作为输入源输入到随机森林里面 请技术大佬指点一下
\
更新时间:2023-10-09 03:32
https://bigquant.com/experimentshare/8cd8ab7f055741c09a365fdf91ffd9b7
随机森林的例子里是使用特征列表里面已有的预计算因子作为因子添加的, 请问 不是预计算的因子 或者是一些自定义的因子 如何去作为输入源输入到随机森林里面 请技术大佬指点一下
\
更新时间:2023-10-09 03:25
问题1:比如在其他自定义的python组件,拿到随机森林训练:树的个数
问题2: 这种在超参数调优的时候,是不是也能正确拿到。(如果我在超参数调优时候有调整该参数)
更新时间:2023-10-09 02:54
已经解决,似乎跑超参数调优时候,cpu不是真正的运行cpu
更新时间:2023-10-09 02:51
更新时间:2023-01-30 08:11
也没有模型训练过程,直接就1分钟不到就直接输出 预测结果了
\
①数据量太少
②xgboost建议使用这个模块:
随机森林建议使用这个模块:
更新时间:2022-12-20 14:20
本文由BigQuant翻译来自于MSCI研究,原文标题为《机器学习因子:在线性因子模型中捕捉非线性》
作者:George Bonne, Jun Wang, Howard Zhang
发表时间:2021年3月
虽然机器学习(机器学习)算法已经存在了几十年,但最近它们在包括金融在内的许多领域受到了越来越多的关注,尤其是在解释资产回报的应用上。虽然线性因子模型多年来一直是理解风险敞口、风险和投资组合表现的重要工具,但没有哪一种模型是一成不变的,即因子敞口和回报之间的关系必须是线性的。
在这里,我们研究了在去除线性成分后,机器学习算法在多大程度上可以检测因子暴露和安全回报之间的关
更新时间:2022-10-14 01:29
研究内容本报告采用机器学习方法从历史数据中学习股票因子和收益率的关系,建立股票收益预测模型。本报告研究的机器学习方法包括多类别逻辑回归(MLR)、支持向量机(SVM)、随机森林(RF)、极限梯度提升树(XGBoost)、深层神经网络(DNN)等5类模型。
机器学习模型介绍本报告考察的5种机器学习模型中,MLR和线性SVM属于线性分类器,但优化目标不同。RF、XGBoost和DNN属于非线性分类器。其中,RF和XGBoost是以决策树为基学习器的集成学习方法,但模型集成的方式不一样。DNN是深度学习方法。这5种模型在机器学习领域具有很强的代表性。
策略表现从实证结果来看,5种机
更新时间:2022-10-09 06:01
之前的随机森林选股策略的回测效果并不是很好,笔者参考一篇硕士论文得到了因子选择的思路,对原有模型进行优化调参,得到了不错的回测收益效果。笔者将模型链接附到下方,方便大家可以尝试一下不同的因子组合。
/wiki/static/upload/f6/f60ca050-8291-48bb-9e28-fb650601f075.pdf
![优化流程{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}]
更新时间:2022-08-09 07:07
本周全A选股(沪深300行业市值中性)朴素贝叶斯表现最好本周沪深300涨跌幅为-5.85%。本周3个模型跑赢基准,超额收益最高的模型是朴素贝叶斯,该模型本周获得绝对收益-5.40%,超额收益0.45%。 最近一月超额收益最高的模型是随机森林,该模型最近一月获得绝对收益,超额收益1.13%。2018年以来超额收益最高的模型是随机森林,该模型2018年以来获得绝对收益-14.16%,超额收益4.73%。2018年以来RankIC均值最高的模型是Stacking,该模型RankIC均值为0.119。 本周全A选股(中证500行业市值中性)XGBoost表现最好本周中证500涨跌幅为-6
更新时间:2022-07-29 07:12
本周全A选股(非行业中性)随机森林表现最好本周中证500涨跌幅为-5.90%。本周4个人工智能组合跑赢基准,超额收益最高的策略是随机森林,该策略本周获得绝对收益-3.64%,超额收益。最近三月超额收益最高的策略是随机森林,该策略最近三月获得绝对收益-6.05%,超额收益9.37%。最近一年超额收益最高的策略是随机森林,该策略最近一年获得绝对收益10.24%,超额收益24.13%。 本周全A选股(沪深300行业中性)随机森林表现最好本周沪深300涨跌幅为-3.85%。本周1个人工智能组合跑赢基准,超额收益最高的策略是随机森林,该策略本周获得绝对收益-3.70%,超额收益。最近三月超
更新时间:2022-07-29 06:02