你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!
这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。
本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。
机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene
更新时间:2024-01-26 07:22
更新时间:2024-01-12 07:01
五因子模型是由Eugene Fama和Kenneth French提出的资产定价模型。
该模型在其先前的三因子模型的基础上,增加了两个新的因子:盈利能力和投资风格因子。
模型旨在更全面地解释股票回报,并在学术界和实务界都获得了广泛的关注。
资本资产定价模型(CAPM)中的核心因子,代表市场整体的风险溢价,通常用市场超额回报表示,计算公式为:
更新时间:2023-12-25 01:41
AI量化领域结合了人工智能(AI)、机器学习(ML)以及量化金融的技术和方法。这一领域的目标是使用算法和计算模型来分析大量金融数据,从而做出投资决策或提高交易效率。
一些在AI量化领域重要技术和方法,以及在金融领域的应用:
更新时间:2023-12-18 06:15
量化交易利用数学和统计学方法来分析市场并执行交易的过程,是现代金融的一个重要组成部分。量化模型的目的是通过算法自动识别并利用市场中的规律和机会,用以获取更多收益。
量化交易模型的一般由以下几个部分组成:
1 数据处理模型: 量化交易的基石是数据。这包括了从历史价格、成交量到公司财报、宏观经济指标等各类数据。对这些数据的收集、清洗和处理是构建有效模型的首要步骤。**[BigQuant策略编写平台](http
更新时间:2023-12-01 11:22
请教一下,用1000多个股票一年的收益率数据和20个因子做多元回归模型,这里有多只股票和多个日期,应该要怎么处理呢?如何预测股票收益率?
更新时间:2023-11-27 06:10
机器学习已经成为量化策略设计中的一大利器,了解各种机器学习算法的原理、特点、优劣,对于量化建模有着极大的帮助。因此,本系列【专题研究】介绍几种在资本市场中非常流行的机器学习算法及其在选股方面的相应应用,希望能对大家有所帮助。
随机森林是当前使用最广泛的机器学习集成算法之一。由于其简单灵活、不容易过拟合、准确率高的特性,随机森林在很多应用中都体现了较好的效果。
本文从单棵决策树讲起,逐步解释了随机森林的工作原理,然后将随机森林预测应用于二级市场,介绍了基于随机森林模型的智能选股策略。
随机森林是一种集成算法(Ensemble
更新时间:2023-11-26 16:58
这是本系列专题研究的第五篇:基于长短期记忆网络LSTM的深度学习因子选股模型。LSTM作为改进的RNN(循环神经网络),是一种非常成熟的能够处理变化的序列数据的神经网络。此算法在keras, tensorflow上都有可以直接调用的api,在BigQuant平台中也有封装好的可视化模块。本文首先大致介绍了RNN和LSTM的原理,然后以一个可视化实例展示LSTM模型在因子选股方面的应用。
更新时间:2023-11-26 16:58
上篇报告介绍了集成学习里Bagging方法的代表算法随机森林,本文将着眼于另一种集成学习方法:Boosting,并深入介绍Boosting里的“王牌” XGBoost 模型。最后,以一个实例介绍XGBoost模型在智能选股方面的应用。
作为集成学习的两大分支,Boosting和Bagging都秉持着“三个臭皮匠顶个诸葛亮”的想法,致力于将单个弱学习器组合成为一个强学习器。他们的不同主要在组合方式上:
Bagging如上篇报告介绍的,采用bootstrap随机抽样从整体数据集中得到很多个小数据集(小
更新时间:2023-11-26 16:58
BigQuant平台会不断封装机器学习算法策略,方便用户直接使用策略生成器开发策略,降低策略开发难度。本文对BigQuant平台上策略生成器已经支持的机器学习模型进行简单介绍。
目前,BigQuant策略研究平台支持的机器学习模型有分类模型、回归模型、排序模型和聚类模型四类。
分类模型主要包含以下模型:
模型名称 | 模块名称 |
---|---|
线性分类 | M.logistic_regression. |
线性随机梯度下降分类 | M.linear_sgd_classifier |
支 |
更新时间:2023-11-26 16:58
本文介绍了如何用BigQuant的策略生成器进行StockRanker模型可视化。
在策略生成器中,可以直接菜单化操作的方式新建一个StockRanker实验,通过plot_model
我们可以看到StockRanker模型是什么样子的,这样就能够完全透明的将模型可视化的展示出来,包括结构和参数等信息。
# m6 = M.stock_ranker_train.v2
m6.plot_model()
一般情况下AI机器在大量数据上训练出来的模型会远比人做出来的复杂,这也是AI有更好的效果的原因之一。
更新时间:2023-11-26 16:58
更新时间:2023-11-26 16:58
这是本系列专题研究的第六篇:基于DNN模型的深度学习智能选股策略。本文简单介绍了和DNN相关的原理,并举了一个实例,具体展示了如何应用以及应用的结果。
神经网络的每个单元结构如下:
其对应公式如下: ![](/wiki/api/attachments.redirect?id=786ada84-4578-45b9-98a9-a281762597d
更新时间:2023-11-26 16:58
这是本系列专题研究的第四篇:基于卷积神经网络CNN的深度学习因子选股模型。卷积神经网络(Convolutional Neural Network, CNN),是计算机视觉研究和应用领域中最具影响力的模型之一。同样,如果将时间看作一个空间维度,类似于二维图像的高度或宽度,CNN也可以对时间序列处理产生令人惊喜的效果。本文首先大致介绍了CNN的原理,然后详细解释了一维CNN模型如何进行应用于时间序列并进行特征选取,最后以一个实
更新时间:2023-11-26 16:58
BigQuant平台不仅支持传统机器学习模型,同时还对深度学习模型模块进行了封装,方便用户直接使用策略生成器开发策略,降低策略开发难度。本文对BigQuant平台上策略生成器已经支持的深度学习模块进行简单介绍。
深度学习模型通过功能层进行积木式拼接,典型的模型构架如下: 通常模型由输入层、中间层和输出层组成。中间层包括卷积层、池化层、噪声层、循环层和激活层等。输出层通常是一个全连接层(Dens
更新时间:2023-11-26 16:58
不管你是管理自己的资金还是客户资金,只要你在做资产管理,每一步的投资决策都意义重大,做技术分析或基本面分析的朋友很清楚地知道每一个决策的细节,但是通过机器学习、深度学习建模的朋友可能就会很苦恼,因为直接产出决策信号的模型可能是个黑盒子,很难明白为什么模型会产出某一个信号,甚至很多保守的私募基金把模型的可解释性放入了事前风控。其实,模型的可解释性是很容易做到的,难点在于研究员是否对模型有深入的思考和理解。
机器学习领域在过去十年中发生了显著的变化。从一个纯粹的学术和研究领域方向开始,我们已经看到了机器学习在各个领域都有着广泛的应用,如零售,技术,医疗保健,科学等等。
更新时间:2023-11-26 16:58
在这个数据驱动的时代,量化交易不仅是金融领域的革命,更是智慧投资的未来。
通过精确的数学模型和强大的算法,洞察市场动态,捕捉那些传统交易方法难以觉察的盈利机会。
量化交易赚钱的核心包括以下要点:
1 市场分析与策略开发
量化交易的核心在于市场分析和策略开发。这包括使用历史数据来测试和验证交易策略的有效性。
例如,通过回溯测试(backtesting),交易员可以评估一个策略在过去市场条件下的表现。
这种方
更新时间:2023-11-24 09:54
QuantChat是由BigQuant基于QuantLLM研发的下一代金融投资交互体验工具,依托于BigQuant平台大规模能力,内嵌于BigQuant平台以AI为核心的Cloud IDE——AIStudio,主要应用于量化投资领域。
QuantChat可以与用户进行自然语言交互,在多个领域都有广泛的应用。它可以用于回答常见问题、提供技术支持、解决用户的疑问,甚至可以进行智能对话和提供娱乐,但其不同于其他对话交互应用的功能在于提供有关量化投资方面的信息、建议和帮助。QuantChat基于强大的机器学习算法
更新时间:2023-10-11 02:05
机器学习给股票排序,如果我要获得买预测前5或者预测后5的的股票,该怎么写代码。 如上图,我用了图形化LightGBM模型,我怀疑我买错了方向,请教该怎么改平台默认的代码?
更新时间:2023-10-09 08:27
在阅读本文之前,请确定你已经了解了神经网络的基本结构以及前向传播、后向传播的基本原理。
前向传播是神经网络最重要的算法之一,他的目的是通过输入层的输入进行推断,得到输出层的结果,下面假定一个简单的神经网络如下图,包含:一个输入层,一个隐藏层,一个输出层。
则该算法的tensorFlow表达为:
import tensorflow as tf
# 初始化权重
w1 = tf.
更新时间:2023-06-14 03:02
本文收录在无痛的机器学习第一季。
上一回我们聊完了算法,这回我们正式开始写代码。上回在做公式推导的时候,我们实际上只是针对一个数据样本进行推导,而实际中,计算和训练都是一批一批完成的。大多数机器学习训练都有batch的概念,而训练中batch的计算不是一个一个地算,而是一批数据集中算,那么就需要用上矩阵了。
首先给出Loss的代码,这里y和t都是按列存储的,每一列都是一个样本:
class SquareLoss:
def forward(self, y, t):
self.l
更新时间:2023-06-14 03:02
提起机器学习,我们不得不给机器学习下一个准确的定义。在直观的层面,如果说计算机科学是研究关于算法的科学,那么机器学习就是研究关于“学习算法”的科学,或者说,不同于一般的显式编程,机器学习就是研究如何使得计算机在无法被显式编程的情况下进行学习的领域,需要注意的是,显式与否都是对于人类而言的——人类能否明确的搞清楚每个决策步骤,对于计算机而言,构成不同算法的代码与指令没有任何区别。
更加精确的说,机器学习的定义如下:
A computer program is said to learn from experience E with respect
更新时间:2023-06-14 03:02
古代战争强调“决胜于千里之外”,现代基金经理也一样。华尔街对冲基金正通过大数据、算法和轨道技术,使用卫星、无人机等搜集和分析商业数据,提前预测趋势,制定交易策略,运筹帷幄。
每天清晨,华尔街新交易日开盘前的几个小时,对冲基金经理人会收到世界原油供应量的最新估值,他们花了重金来购买这一关键信息。
石油是全球经济中最受关注的大宗商品,且许多国家都对自己的储量都守口如瓶。因此,交易员们为消除信息不对称而付出了代价:了解石油储量丰富的路易斯安那和得克萨斯州的原油产量,或沙特阿拉伯的石油总库存。
石油数据来源于加州山景城3千英里以西的一家名为Orbital Insight的公司,该公司希望探究世界
更新时间:2023-06-14 03:02
在本文中,我将介绍机器学习中关于聚类的算法。
因为知乎中对于markdown的支持太差了,本文不在知乎直接排版,所以阅读体验不是很好,若想获得更好的阅读体验,请点击下文链接进行阅读。
[聚类-下chrer.com ](https://link.zhihu.com/?target=http%3A//chrer.com/2018/07/29/%25E8%2581%259A%25E7%25B1%25BB-%25E4%25B8%25
更新时间:2023-06-14 03:02
\
随机森林要做的事情呢,与上一篇SVM一样,其实也是一个分类的过程。解决的问题是:给一堆数据,我们想把它们分为两类,贴上相应的标签。
分类器:分类器就是给定一个样本的数据,判定这个样本属于哪个类别的算法。例如在股票涨跌预测中,我们认为前一天的交易量和收盘价对于第二天的涨跌是有影响的,那么分类器就是通过样本的交易量和收盘价预测第二天的涨跌情况的算法。
分裂:在决策树的训练过程中,需要一次次的将训练数据集分裂成两个子数据集,这个过程就叫做分裂。
特征:在分类问题中,输入到分类器中的数据叫做特征。以上面的股票涨跌预测问题为例,特征就
更新时间:2023-06-14 03:02