基于XGBoost模型的智能选股策略

导语

上篇报告介绍了集成学习里Bagging方法的代表算法随机森林,本文将着眼于另一种集成学习方法:Boosting,并深入介绍Boosting里的“王牌” XGBoost 模型。最后,以一个实例介绍XGBoost模型在智能选股方面的应用。


Boostin

由clearyf创建,最终由clearyf更新于

Pandas查看和选择

导语

本节主要讲解Pandas库中 DataFrame 的数据查看与选择


Pandas 是基于 Numpy 构建的,让以 Numpy 为中心的应用变得更加简单。平台获取的数据主要是以 Pandas 中DataFrame 的形式。除此之外,Pandas 还包括 一维数组Serie

由clearyf创建,最终由clearyf更新于

条件循环if while for

导语

本文介绍Python编程中非常重要的条件与循环的相关知识点。

附件:Python编程之条件与循环

[https://bigquant.com/experimentshare/b8f57c4b437840eabcea39bc7973144b](https://bigquant.com

由clearyf创建,最终由clearyf更新于

数据异常值处理

导论

异常值问题在数据分析中经常遇到,本文介绍了多种处理数据异常值的方法。


在金融数据分析中,常常会遇到一些值过大或者过小的情况,当用这些值来构造其他特征的时候,可能使得其他的特征也是异常点,这将严重影响对金融数据的分析,或者是影响模型的训练。下面将带大家学习一些关于异常点处理

由clearyf创建,最终由clearyf更新于

10分钟学会pyarrow

Apache Arrow介绍

Apache arrow是高性能的,用于内存计算的,列式数据存储格式。PyArrow是apache arrow的python库,PyArrow与NumPy、pandas和内置的Python对象有很好的集成。它们是基于Arrow的C++实现。

Hello

由think创建,最终由think更新于

Pandas基础操作技能get! 强烈推荐!

策略案例

[https://bigquant.com/experimentshare/0548dc8cf795471bb294f79087001770](https://bigquant.com/experimentshare/0548dc8cf795471bb294f79087001770

由ypyu创建,最终由ypyu更新于

深度学习因子选股模型-基于卷积神经网络

用卷积网络处理序列数据

我们知道卷积神经网络(convnet)在计算机视觉问题上表现出色,原因在于它能够进行卷积运算,从局部输入图块中提取特征,并能够将表示模块化,同时可以高效地利用数据。这些性质让卷积神经网络在计算机视觉领域表现优异,同样也让它对序列处理特别有效。时间可以被看作一个空间维度

由ypyu创建,最终由ypyu更新于

数据预处理方法(标准化、规范化、二值化等)

预处理数据

数据预处理在众多深度学习算法中都起着重要作用,实际上,对数据进行适当处理后,很多算法能够发挥最佳效果。然而面对各种各样的数据,很多时候我们不知道怎么样才能针对性进行处理。本文介绍了Python下的机器学习工具scikit-learn。其中,“sklearn.preprocessi

由ypyu创建,最终由ypyu更新于

遗传规划适应度函数

icir

IC即信息系数(Information Coefficient),表示所选股票的因子值与股票下期收益率的相关系数。IR=IC的均值/IC的标准差。

mutual_info

互信息 参考华泰证券研报 <https://bigquant.com/wiki/doc/yinzi-

由small_q创建,最终由small_q更新于

DQN个股择时策略研究与改进

导语

之前在社区分享过一个初版的强化学习策略,之后我们在那个基础上做了一些调整和优化,本文主要是关于新版策略的一些介绍和结果分析。

与初版策略的区别

新版策略与初版的主要区别在于state的定义不同。初版用当天的OHLCV和7个常用因子数据作为一条state。新版设置了一个win

由clearyf创建,最终由clearyf更新于

什么是无监督学习(机器学习)

什么是无监督学习?

顾名思义,“无监督”学习发生在没有监督者或老师并且学习者自己学习的情况下。

例如,考虑一个第一次看到并品尝到苹果的孩子。她记录了水果的颜色、质地、味道和气味。下次她看到一个苹果时,她就知道这个苹果和之前的苹果是相似的物体,因为它们具有非常相似的特征。她知道这和橙子很不一

由qxiao创建,最终由qxiao更新于

协方差矩阵和投资组合方差:计算和分析

什么是协方差矩阵?

协方差矩阵用于计算股票投资组合的标准差,投资组合经理又使用协方差矩阵来量化与特定投资组合相关的风险。在本文中,我们将学习如何为包含 n 个股票的投资组合创建为期“m”天的协方差矩阵。

\


投资组合分析如何运作?

让我们了解投资组合分析

由small_q创建,最终由small_q更新于

基于随机森林模型的智能选股策略

导语

机器学习已经成为量化策略设计中的一大利器,了解各种机器学习算法的原理、特点、优劣,对于量化建模有着极大的帮助。因此,本系列【专题研究】介绍几种在资本市场中非常流行的机器学习算法及其在选股方面的相应应用,希望能对大家有所帮助。


随机森林是当前使用最广泛的机器学习集成

由clearyf创建,最终由clearyf更新于

深度学习实践经验汇总

写在前面:

本文原载于[how-to-start-a-deep-learning-project](https://link.zhihu.com/?target=https%3A//medium.com/%40jonathan_hui/how-to-start-a-deep-lear

由ypyu创建,最终由ypyu更新于

相关关系

导语

相关性经常用来度量两个变量的相关关系,本文将对相关系数做详细讨论。


简介相关系数

诺贝尔经济学奖得主马科维茨曾说过“资产配置多元化是投资的唯一免费午餐”。投资中有句谚语,不要把鸡蛋放在一个篮子,实际上讲的就是选择相关性不高的资产进行配置。资产之间的相关性用什么指标

由clearyf创建,最终由clearyf更新于

线性回归

导语

线性回归模型的最大特点就是简单高效,本文将对线性回归做详细介绍。


简介线性回归

线性回归是衡量两个变量之间线性关系的一种建模技术。 如果我们有一个变量X和一个依赖变量X的变量Y,则线性回归可以确定哪个线性模型Y=α+βX能够最好地解释数据。 例如,我们考虑

由clearyf创建,最终由clearyf更新于

平均值

导语

本文我们将讨论如何使用平均值来描述一组数据。

[https://bigquant.com/experimentshare/9ff5ed679672459bb264786b95ac877e](https://bigquant.com/experimentshare/9ff5ed6796

由clearyf创建,最终由clearyf更新于

笔试

# 102
def func(a):
    '''
    a: 输入数组,已经排好序
    返回值:出现次数最多的元素,如果有多个,输出最早出现的
    '''
    dic = dict()
    for x in range(len(a)):

由bqjbfe2i创建,最终由bqjbfe2i更新于

机器学习中的过拟合

来源:elitedatascience编译:caoxiyang

导语

成千上万的数据科学新手会在不知不觉中犯下一个错误,你知道是什么吗?这个错误可以一手毁掉你的机器学习模型,这并不夸张。我们现在来讨论应用机器学习中最棘手的障碍之一:过拟合(overfitting)

在本文中,

由ypyu创建,最终由bq4eote3更新于

初级工程师面试题目

面试题目说明

  • 要求
    • 尽可能低的时间复杂度和空间复杂度
    • 代码逻辑清晰,变量命名合理,代码风格规范
  • 点击如下题目的克隆策略按钮
  • 完成代码
  • 创建策略分享链接(策略开发界面右上角),发给面试官:分享策略 > 复制 分享链接

[https://bigquant.com

由jliang创建,最终由jliang更新于

test

#102
def func(a):
    count = 0  # 当前元素的出现次数
    candidate = None  # 当前出现次数最多的元素
    for num in a:
        if count == 0:  # 当前元素第一次出现

由bqnqc390创建,最终由bqnqc390更新于

Test1

#102
def int_most(arr):
    max_element = None
    max_count = 0
    current_element = None
    current_count = 0

    for element in ar

由bqjdzn7f创建,最终由bqjdzn7f更新于

用随机森林预测股价走势


机器学习已经广泛地应用在对于资产市场的分析中。但是,在浩如烟海的机器学习算法中,到底哪种算法能取得更优的预测效果呢?发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后的涨跌方向进行了预测。发现相比于SVM、线性判别分析等模型,随机森林可以取

由ypyu创建,最终由ydong更新于

分页:第1页第3页第4页第5页第6页第7页第23页