回归是一种挖掘因变量和自变量之间关系的技术。它经常出现在机器学习中,主要用于预测建模。在本系列的最后一部分中,我们将范围扩大到涵盖其他类型的回归分析及其在金融中的用途。
简单的线性回归允许我们研究两个连续变量之间的关系——一个自变量和一个因变量。
简单线性回归方程的一般形式如下:
其中 (β_{0}) 是截距,(β_{1}) 是斜率,(ϵ_{i}) 是误差项。在这个等
更新时间:2024-02-21 09:48
本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然,本文收录的算法并不完全,分类的方式也不唯一。不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。 在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式
更新时间:2024-01-23 08:14
更新时间:2023-12-15 02:54
更新时间:2023-11-26 16:58
算法交易起源于上世纪中叶的配对交易
历史上最早使用算法交易的例子可以追溯到1949年。对冲基金之父阿尔弗雷德·琼斯,利用空对多3:7的比例进行配对交易,在1955年到1964年间,综合回报率高达28%。到了上世纪60年代早期,投资者开始利用计算机通过分析股票的周线和月线来预测价格运动方向。
配对交易逐渐成熟,发展成后来的算法交易。随后算法交易策略慢慢在华尔街流传开来并被广泛使用,同时也带来了非常可观的盈利。原来在摩根士丹利从事配对交易的研究员,后来逐渐成为如大卫·肖、詹姆斯·西蒙斯这类明星基金经理手下的精英,算法交易的“黑盒子”便由此诞生。
随着计算机的广泛普及,华尔街各大
更新时间:2023-11-26 16:58
至2021年,前30家百亿私募量化机构中29家在官网介绍了其人工智能开发,或正在招募人工智能人才。
编号 | 公司简称 | 成立时间 | 是否涉及AI | 编号 | 公司简称 | 成立时间 | 是否涉及AI |
---|---|---|---|---|---|---|---|
1 | 鸣石投资 | 2i010/12/9 | 是 | 11 | 幻方量化 | 2015/6/11 | 是 |
2 | 天演资本 | 2014/8/5 | 是 | 12 | 衍复投资 | 2019/7/25 | 是 |
3 | 世纪前沿资产 | 2015/8/24 | 是 | 13 |
更新时间:2023-11-26 16:58
几天前,我着手解决一个实际问题——大型超市销售问题。在使用了几个简单模型做了一些特征工程之后,我在排行榜上名列第 219 名。
虽然结果不错,但是我还是想做得更好。于是,我开始研究可以提高分数的优化方法。结果我果然找到了一个,它叫遗传算法。在把它应用到超市销售问题之后,最终我的分数在排行榜上一下跃居前列。
![{w:100%}{w:100}{w:100}{w:100}](/
更新时间:2023-11-26 16:58
《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰写的机器学习系列文章 ,本文主要介绍其第二部分内容——《监督式机器学习算法的应用》,并将其思想和代码应用在中国股票市场,开发出具有择时功能的监督式机器学习算法,最后进行策略回测。对此感兴趣的小伙伴可以直接在本文文末克隆策略源代码,进行深入和扩展研究。
Ali El-Shayeb通过价格和成交量相关的9个特征训练模型,特征列表和数据来源见下图。
![](/community/uploads/default/origin
更新时间:2023-11-26 16:58
遗传算法TerminatedWorkerError-SIGKILL,是否是内存不够导致的?
https://bigquant.com/experimentshare/278930a2314440919cd243a105f2452d
跑大数据都要3级及以上,可以分享下你的资源情况,我们复现一下
更新时间:2023-10-09 07:34
平台支持AI算法选双均线最佳金叉死叉参数吗,有没有相应的模板呢,若没有该怎么去实现呢。看到平台上的均线都属于传统策略,参数好坏需要自己去调整 感谢并期待攻城狮的回复
可以参考一下“超参搜索”和“自定义运行”两个模块的使用,可以进行参数调优
更新时间:2023-10-09 07:32
#逻辑回归
这也称为 logit 回归。逻辑回归是一种基于过去数据预测事件二元结果的分析方法。
当因变量是定性的并且取二进制值时,它被称为二分变量。
如果我们使用线性回归来预测这样的变量,它将产生 0 到 1 范围之外的值。此外,由于二分变量只能取两个值,残差不会围绕预测线呈正态分布。
Logistic 回归是一种非线性模型,它产生一条逻辑曲线,其中值限制为 0 和 1。
将此概率与阈值 0.5 进行比较,以决定将数据最终分类为一个类别。因此,如果一个类的概率大于 0.5,则将其标记为 1,否则标记为 0。
金融中逻辑回归的用例之一是它可以用来预测股票的表现。
#分位数回归
更新时间:2023-10-09 07:12
一般排序算法中个,需要设置哪些样本和哪些样本是在同一个group里,这样才能在每个group内做排序训练。对于股票的话,我想训练的时候应该是按照交易日期来做group的。
不过在stockRanker里,好像只有常规的boosting tree的超参,并没有看到设置group的地方(如果有验证集,还需要对验证集设置group),请问这里有什么问题吗?
更新时间:2023-10-09 07:08
https://bigquant.com/experimentshare/8139094d2dce46b5a449b795538f131a
这是一个示例stockranker策略,我了解到stockranker算法是GBDT和listwise算法的结合,如何将GBDT算法换成其他的集成学习算法例如XGBoost算法,形成一个以XGBoost为核心的类似stockranker的算法策略。
第二个问题是stockranker算法的基本原理到底是什么,
更新时间:2023-10-09 06:48
更新时间:2023-10-09 06:20
麻烦工程师小哥看一下
更新时间:2023-10-09 06:10
求一个范例,谢谢
更新时间:2023-10-09 03:24
{{membership}}
https://bigquant.com/codeshare/25fee71f-dcef-4fe4-a8a1-75bf511d9466
[ https://bigquant.com/codeshare/79b84aec-5eeb-4218-8c38-67e06f477216]( https://bigquant.com/codeshare/79b84ae
更新时间:2023-08-30 03:28
在市场上,对于资产、基金的分类一直是大家讨论的话题,根据业绩走势对于基金进行分类我们也曾有相关研究。研究资产的相关性一个重要的应用就是可以利用相似资产找到原资产中不可购买的一部分资产。本期琢璞系列我们推荐Chen, Chun-Hao, and Chih-Hung Yu(2017)的《A Series-based group stock portfolio optimization approach using the grouping genetic algorithm with symbolic aggregate approximations》,文献利用遗传算
更新时间:2023-07-14 03:51
更新时间:2023-06-26 08:17
机器学习模型可以简单分为传统机器学习模型和深度学习模型,传统的机器学习又可以根据模型的表达式分为树模型和线性模型。
树模型以决策树为基础,在之上衍生出了各种算法,从集成学习的角度考虑,树模型可以分为 Bagging 和 Boosting 模型,Boosting 方法是另一种通过弱学习器提高准确度的方法,和 Bagging 方法不同的是,Boosting 每次根据之前模型的表现,进行新的模型的训练,以改变训练数据的权值和弱分类器的组合方式,得到最后的强学习器。
对于
更新时间:2023-06-14 06:11
今天编辑部带来关于在基于金融时间序列的预测模型案例,我们将通过神经网络来增强一个经典的移动平均策略,并表明它真的是有所改善相对原策略。
但这种交易策略有一个主要的缺陷:在震荡行情中,策略没有过多的触及信号并交易,这样我们也很难赚到钱。 ![image|690x376](/community/uploads/default/original/3X
更新时间:2023-06-14 03:02
原创文章,转载请注明出处:用Python的交易员
Python在2016年里可以说是风靡国内量化投资圈,目前整个生态链已经初具规模:
随着用户越来越多,Python语言的性能问题也就逐渐成为整个社区关注的重点,经常遇到新手问:Python写的量化交易程序是不是很慢啊?
在他们心中,Python估计是这个样子:
![{w:100}](/community/uploads/default/orig
更新时间:2023-06-14 03:02
(!!!超多gif图片预警)
(本文旨在优化一维函数,实际上模型参数有数百万维以上,差距很大,因此本文最好作为辅助法的理解,而非对算法优劣的判断依据。)
8.13更新算法6:二阶算法牛顿法,算法7:牛顿法+正则化
在深度学习中,有很多种优化算法,这些算法需要在极高维度(通常参数有数百万个以上)也即数百万维的空间进行梯度下降,从最开始的初始点开始,寻找最优化的参数,通常这一过程可能会遇到多种的情况,诸如:
1.提前遇到局部最小值从而卡住,再也找不到全局最小值了
2.遇到极为平坦的地方:“平原”,在这里梯度极小,经过多次迭代也无法离开。同理,鞍点也是一样的,在鞍点处,各方向的梯度极
更新时间:2023-06-14 03:02
金融数据由于太易过拟合,在机器学习建模中通常对降低variance的需求会比降低bias要高很多,这也是为什么通常线性模型与树模型效果会比较稳定,而bagging又比boosting似乎要效果更佳。
在Bagging类的机器学习算法中Random Forest无疑是很常见也是大家使用的比较多的一个模型,据说高盛就很喜欢使用RF。下面文兄以RF做分类问题为例,简单介绍几个小notes,来源于经验与阅读,供大家参考,其中参数名称以sklearn中RandomForestClassifier函数为例:
更新时间:2023-06-14 03:02
很简单的字面意思,意味着你利用程序(program)进行交易。具体的交易时机,交易仓位,止损止盈获利标准可能包含在程序本身,也可能独立于程序之外,程序本身只是执行的方式。与程序交易对应的是人工交易。一般利用程序交易有几大优势,比如说较快的速度,脱离了人为情绪的影响,执行力有保证等等。同时也应注意交易程序和交易系统的区别。交易系统是一个完整的系统,具体执行的程序可能只是其中的一部分。一个良好的交易系统应该还有风险控制,资金利用,仓位管理等方面的内容,而不仅仅是买卖信号的产生。
更新时间:2023-06-14 03:02