基于XGBoost模型的智能选股策略
导语
上篇报告介绍了集成学习里Bagging方法的代表算法随机森林,本文将着眼于另一种集成学习方法:Boosting,并深入介绍Boosting里的“王牌” XGBoost 模型。最后,以一个实例介绍XGBoost模型在智能选股方面的应用。
Boostin
由clearyf创建,最终由clearyf更新于
上篇报告介绍了集成学习里Bagging方法的代表算法随机森林,本文将着眼于另一种集成学习方法:Boosting,并深入介绍Boosting里的“王牌” XGBoost 模型。最后,以一个实例介绍XGBoost模型在智能选股方面的应用。
由clearyf创建,最终由clearyf更新于
本节主要讲解Pandas库中 DataFrame 的数据查看与选择
Pandas 是基于 Numpy 构建的,让以 Numpy 为中心的应用变得更加简单。平台获取的数据主要是以 Pandas 中DataFrame 的形式。除此之外,Pandas 还包括 一维数组Serie
由clearyf创建,最终由clearyf更新于
本文介绍Python编程中非常重要的条件与循环的相关知识点。
附件:Python编程之条件与循环
[https://bigquant.com/experimentshare/b8f57c4b437840eabcea39bc7973144b](https://bigquant.com
由clearyf创建,最终由clearyf更新于
异常值问题在数据分析中经常遇到,本文介绍了多种处理数据异常值的方法。
在金融数据分析中,常常会遇到一些值过大或者过小的情况,当用这些值来构造其他特征的时候,可能使得其他的特征也是异常点,这将严重影响对金融数据的分析,或者是影响模型的训练。下面将带大家学习一些关于异常点处理
由clearyf创建,最终由clearyf更新于
Apache arrow是高性能的,用于内存计算的,列式数据存储格式。PyArrow是apache arrow的python库,PyArrow与NumPy、pandas和内置的Python对象有很好的集成。它们是基于Arrow的C++实现。
由think创建,最终由think更新于
[https://bigquant.com/experimentshare/0548dc8cf795471bb294f79087001770](https://bigquant.com/experimentshare/0548dc8cf795471bb294f79087001770
由ypyu创建,最终由ypyu更新于
我们知道卷积神经网络(convnet)在计算机视觉问题上表现出色,原因在于它能够进行卷积运算,从局部输入图块中提取特征,并能够将表示模块化,同时可以高效地利用数据。这些性质让卷积神经网络在计算机视觉领域表现优异,同样也让它对序列处理特别有效。时间可以被看作一个空间维度
由ypyu创建,最终由ypyu更新于
数据预处理在众多深度学习算法中都起着重要作用,实际上,对数据进行适当处理后,很多算法能够发挥最佳效果。然而面对各种各样的数据,很多时候我们不知道怎么样才能针对性进行处理。本文介绍了Python下的机器学习工具scikit-learn。其中,“sklearn.preprocessi
由ypyu创建,最终由ypyu更新于
由xiaoshao创建,最终由xiaoshao更新于
IC即信息系数(Information Coefficient),表示所选股票的因子值与股票下期收益率的相关系数。IR=IC的均值/IC的标准差。
互信息 参考华泰证券研报 <https://bigquant.com/wiki/doc/yinzi-
由small_q创建,最终由small_q更新于
之前在社区分享过一个初版的强化学习策略,之后我们在那个基础上做了一些调整和优化,本文主要是关于新版策略的一些介绍和结果分析。
新版策略与初版的主要区别在于state的定义不同。初版用当天的OHLCV和7个常用因子数据作为一条state。新版设置了一个win
由clearyf创建,最终由clearyf更新于
顾名思义,“无监督”学习发生在没有监督者或老师并且学习者自己学习的情况下。
例如,考虑一个第一次看到并品尝到苹果的孩子。她记录了水果的颜色、质地、味道和气味。下次她看到一个苹果时,她就知道这个苹果和之前的苹果是相似的物体,因为它们具有非常相似的特征。她知道这和橙子很不一
由qxiao创建,最终由qxiao更新于
协方差矩阵用于计算股票投资组合的标准差,投资组合经理又使用协方差矩阵来量化与特定投资组合相关的风险。在本文中,我们将学习如何为包含 n 个股票的投资组合创建为期“m”天的协方差矩阵。
\
让我们了解投资组合分析
由small_q创建,最终由small_q更新于
机器学习已经成为量化策略设计中的一大利器,了解各种机器学习算法的原理、特点、优劣,对于量化建模有着极大的帮助。因此,本系列【专题研究】介绍几种在资本市场中非常流行的机器学习算法及其在选股方面的相应应用,希望能对大家有所帮助。
随机森林是当前使用最广泛的机器学习集成
由clearyf创建,最终由clearyf更新于
本文原载于[how-to-start-a-deep-learning-project](https://link.zhihu.com/?target=https%3A//medium.com/%40jonathan_hui/how-to-start-a-deep-lear
由ypyu创建,最终由ypyu更新于
相关性经常用来度量两个变量的相关关系,本文将对相关系数做详细讨论。
诺贝尔经济学奖得主马科维茨曾说过“资产配置多元化是投资的唯一免费午餐”。投资中有句谚语,不要把鸡蛋放在一个篮子,实际上讲的就是选择相关性不高的资产进行配置。资产之间的相关性用什么指标
由clearyf创建,最终由clearyf更新于
线性回归模型的最大特点就是简单高效,本文将对线性回归做详细介绍。
线性回归是衡量两个变量之间线性关系的一种建模技术。 如果我们有一个变量X和一个依赖变量X的变量Y,则线性回归可以确定哪个线性模型Y=α+βX能够最好地解释数据。 例如,我们考虑
由clearyf创建,最终由clearyf更新于
本文我们将讨论如何使用平均值来描述一组数据。
[https://bigquant.com/experimentshare/9ff5ed679672459bb264786b95ac877e](https://bigquant.com/experimentshare/9ff5ed6796
由clearyf创建,最终由clearyf更新于
吴恩达(1976-,英文名:Andrew Ng),华裔美国人,是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室
由qxiao创建,最终由qxiao更新于
# 102
def func(a):
'''
a: 输入数组,已经排好序
返回值:出现次数最多的元素,如果有多个,输出最早出现的
'''
dic = dict()
for x in range(len(a)):
由bqjbfe2i创建,最终由bqjbfe2i更新于
来源:elitedatascience编译:caoxiyang
成千上万的数据科学新手会在不知不觉中犯下一个错误,你知道是什么吗?这个错误可以一手毁掉你的机器学习模型,这并不夸张。我们现在来讨论应用机器学习中最棘手的障碍之一:过拟合(overfitting)。
在本文中,
由ypyu创建,最终由bq4eote3更新于
[https://bigquant.com
由jliang创建,最终由jliang更新于
#102
def func(a):
count = 0 # 当前元素的出现次数
candidate = None # 当前出现次数最多的元素
for num in a:
if count == 0: # 当前元素第一次出现
由bqnqc390创建,最终由bqnqc390更新于
#102
def int_most(arr):
max_element = None
max_count = 0
current_element = None
current_count = 0
for element in ar
由bqjdzn7f创建,最终由bqjdzn7f更新于
机器学习已经广泛地应用在对于资产市场的分析中。但是,在浩如烟海的机器学习算法中,到底哪种算法能取得更优的预测效果呢?发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后的涨跌方向进行了预测。发现相比于SVM、线性判别分析等模型,随机森林可以取
由ypyu创建,最终由ydong更新于