模型训练

从金融角度看,模型训练是利用历史数据,通过特定算法构建并优化数学模型的过程。其目的是揭示隐藏在海量数据中的规律,并预测未来趋势。在金融风险评估、投资策略制定、市场预测等核心领域,模型训练发挥着至关重要的作用。它能够将复杂的金融现象转化为可量化、可操作的数学表达,帮助决策者规避风险,发现价值投资机会,以及把握市场动态。随着数据量和计算能力的不断提升,模型训练在金融领域的应用将越来越广泛,成为推动金融行业创新和发展的重要驱动力。

编写策略/AIStudio - 以AI为核心的量化策略开发IDE

简单介绍

AIStudio是BigQuant平台以AI为核心的Cloud IDE,可以用于量化投资数据分析、因子挖掘、模型训练、回测和交易以及更广泛的程序开发和AI模型开发训练等。


快速入门

启动AIStudio

点击顶部导航栏中的【编写策略】即可启动AIStudio,或点击AIStudio超链接直接跳转。

初次启动可能需要一些时间,请耐心等待。

启动过程中可以点击"签到领宽币",获得50宽币的奖励。


![加载页面](/wiki

更新时间:2024-03-19 06:52

预测下跌要怎么打标签

/* 使用DAI SQL为量化模型预测生成标签数据。标签反映了未来5日的收益率,并且被离散化为20个桶,每个桶代表一个收益率范围。这样,我们就可以训练模型来预测未来的收益率范围,而不仅仅是具体的收益率值。

  1. 首先定义了一个名为label_data的临时表,用于计算和存储未来5日收益率,其1%和99%分位数,以及离散化后的收益率(被分为20个桶,每个桶代表一个收益率范围)。
  2. 对未来5日收益率进行了截断处理,只保留在1%和99%分位数之间的值。
  3. 选择了标签值不为空,并且非涨跌停(未来一天的最高价不等于最低价)的数据
  4. 从这个临时表中选择了日期、股票代码和标签字段,以供进模

更新时间:2024-02-01 08:26

神经网络dnn模型sql标签怎么写,预测的时候总是维度不匹配,因为多了标签列

/* 使用DAI SQL为量化模型预测生成标签数据。标签反映了未来5日的收益率,并且被离散化为20个桶,每个桶代表一个收益率范围。这样,我们就可以训练模型来预测未来的收益率范围,而不仅仅是具体的收益率值。

  1. 首先定义了一个名为label_data的临时表,用于计算和存储未来5日收益率,其1%和99%分位数,以及离散化后的收益率(被分为20个桶,每个桶代表一个收益率范围)。
  2. 对未来5日收益率进行了截断处理,只保留在1%和99%分位数之间的值。
  3. 选择了标签值不为空,并且非涨跌停(未来一天的最高价不等于最低价)的数据
  4. 从这个临时表中选择了日期、股票代码和标签字段,以供进模

更新时间:2024-01-31 03:56

利用CNN对股票“图片”进行涨跌分类——一次尝试

首先解释一下标题: CNN:卷积神经网络(Convolutional Neural Network), 在图像处理方面有出色表现,不是被川普怒怼的那个新闻网站; 股票涨跌:大家都懂的,呵呵; 股票图片:既然使用CNN,那么如果输入数据是股票某个周期的K线图片就太好了。当然,本文中使用的图片并不是在看盘软件上一张一张截下来的,而是利用OHLC数据“画”出来的; 尝试:这个词委婉一点说就是“一个很好的想法^_^",比较直白的说法是“没啥效果T_T”。


进入正题: 首先是画出图片。本文目前是仿照柱线图画的。 ![{w:100}](/wi

更新时间:2023-11-28 10:03

监督式机器学习算法的应用:择时

导语

《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰写的机器学习系列文章 ,本文主要介绍其第二部分内容——《监督式机器学习算法的应用》,并将其思想和代码应用在中国股票市场,开发出具有择时功能的监督式机器学习算法,最后进行策略回测。对此感兴趣的小伙伴可以直接在本文文末克隆策略源代码,进行深入和扩展研究。

《监督式机器学习算法的应用》

Ali El-Shayeb通过价格和成交量相关的9个特征训练模型,特征列表和数据来源见下图。

![](/community/uploads/default/origin

更新时间:2023-11-26 16:58

零基础《AI挑战虚拟股票预测大赛》入门教程

https://bigquant.com/experimentshare/57c7495eba374b90b4d5747154df41b8

\

更新时间:2023-11-26 16:58

如何基于平台的xgboost,自定义目标函数呢?

自己通过import xgboost可以实现自定义目标函数,但是和平台的xgboost模块相比,自己的import xgboost比平台的xgboost模块慢了很多,时间花费几乎是30倍差距。

那么,如何基于平台的xgboost,实现自定义目标函数的定义呢?


\

更新时间:2023-10-09 07:41

请教dl中一些问题

问题

  1. 如何设置训练步长,在训练模块中没有这个选项
  2. 如何设置验证集,并打印loss、mae等,按照模板智能看训练集的

{w:100}{w:100}

验证集通过这个端口传入,构造方法和训练集一样。只需要设定开始和结束的日期。

步长可以通过

![{w:100}{w:100}](/wiki/api/attachments.redirect?id=276f2f17-0d2e

更新时间:2023-10-09 07:35

用财务因子怎么构建机器学习策略?

\

更新时间:2023-10-09 07:09

三种构建大盘风控指标的方法关于策略代码能否提供?谢谢

三种构建大盘风控指标的方法关于LSTM+CNN的模型进行大盘风控的策略代码未找到,能否提供一下,谢谢。

https://bigquant.com/wiki/doc/dapan-zhibiao-fangfa-MoB3kNcAMG

更新时间:2023-10-09 06:28

为什么LightGBM不能输出特征重要性

后面会报错

https://bigquant.com/experimentshare/16f3f6c7fa904475ac8a131e2345ab0a

\

更新时间:2023-10-09 06:22

keras调用失败

{w:100}说是有:

https://bigquant.com/wiki/doc/mokuai-aBcAf1yeFo

更新时间:2023-10-09 03:26

"模型训练报错 Segmentation fault"

{w:100}麻烦工程师兄弟看一下

更新时间:2023-10-09 02:46

了解AIStudio

AIStudio是BigQuant平台以AI为核心的Cloud IDE,可以用于量化投资数据分析、因子挖掘、模型训练、回测和交易,以及更广泛的程序开发和AI模型开发训练等。

/wiki/static/upload/31/315c1087-6d07-491a-90ef-43e717997077.mp4

从这里开始

关键概念

\

更新时间:2023-09-07 03:12

怎样用自定义函数,计算因子用于模型训练和预测?尤其是提取高频原始因子进行复杂再加工后得到的因子,怎么使用?按文档提供的方法,貌似可以提取因子,但详细比对,数据是错的,估计是与代码列表的date,ins

https://bigquant.com/codeshare/1e2b64b4-0a3a-4c86-b742-46a14e72ee0e

\

更新时间:2023-06-30 15:58

Tensorflow学习笔记(1): 张量及其属性

本文主要介绍tf.Tensor的各种常用属性,张量是对矢量和矩阵向潜在的更高维度的泛化。对内,TensorFlow 将张量表现为基本数据类型的 n 维数组。

在编写 TensorFlow 程序时,操控和传递的主要目标是 tf.Tensortf.Tensor 目标表示一个部分定义的计算,最终会产生一个值。TensorFlow 程序首先建立 tf.Tensor 目标图,详细说明如何基于其他可用张量来计算每个张量,然后运行该图的部分内容以获得所期望的结果。

tf.Tensor 有以下属性:

  • 数据类型(例如 float32int32string

更新时间:2023-06-14 03:02

【深度学习之美02】深度学习的方法论是什么?

再议“end-to-end”(端到端)

在深度学习中,经常有“end-to-end(端到端)”学习的提法,与之相对应的传统机器学习是“Divide and Conquer(分而治之)”。这些都是什么意思呢?

“end-to-end”(端到端)说的是,输入的是原始数据(始端),然后输出的直接就是最终目标(末端),中间过程不可知,也难以知。比如说,基于深度学习的图像识别系统,输入端是图片的像素数据,而输出端直接就是或猫或狗的判定。这个端到端就是:像素判定。

再比如,“end-to-end”的自动驾驶系统,输入的是前置摄像头的视频信号(其实也就是像素),而输出的直接就是控制车辆行驶指令(

更新时间:2023-06-14 03:02

神经网络浅讲:从神经元到深度学习

神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。

本文以一种简单的,循序的方式讲解神经网络。适合对神经网络了解不多的同学。本文对阅读没有一定的前提要求,但是懂一些机器学习基础会更好地帮助理解本文。

神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。

![图1 人脑神经网络](/wiki/api/attachments.redirect?id=c4bd3664-94c

更新时间:2023-06-14 03:02

CNN入门讲解:为什么要做训练(Training)?

今天我要讲的是一个很基础很基础的东西,适合初学者:

模型训练(Training)

如果你刚开始接触CNN,你一定会好奇,我给CNN灌入大量的数据做训练,到底要让CNN获得一种什么能力

首先我们的目的是:

给数据作分类

怎么给数据作分类:

要么找到数据的因果关系,要么找到数据间的关联

我们希望找到一个规则,或者一个表达式,它的作用是

理清楚数据间的关系,或者拟合数据的分布

我们就暂时给这个作用起名叫:

kernel

因为这个kernel 的作用,我们对数据之间的关系更加明晰,进而更好的分类,如下图所示:

![](/communit

更新时间:2023-06-14 03:02

深度学习对话系统实战篇--新版本chatbot代码实现

上篇文章我们使用tf.contrib.legacy_seq2seq下的API构建了一个简单的chatbot对话系统,但是我们已经说过,这部分代码是1.0版本之前所提供的API,将来会被弃用,而且API接口并不灵活,在实际使用过程中还会存在版本不同导致的各种个样的错误。所以我们有必要学习一下新版本的API,这里先来说一下二者的不同:

  • 新版本都是用dynamic_rnn来构造RNN模型,这样就避免了数据长度不同所带来的困扰,不需要再使用model_with_buckets这种方法来构建模型,使得我们数据处理和模型代码都简洁很多
  • 新版本将Attention、Decoder等几个主要的功能都

更新时间:2023-06-14 03:02

NLP系列学习:CNN文本分类

这一篇文章主要是记录下自己阅读《Convolutional Neural Networks for Sentence Classification》这篇文章思路的一个整理。这篇文章也可以算是CNN用于文本分类的开山之作了,尽管第一个使用CNN进行文本分类的不是Yoon Kim,但是Kim在这篇文章里提出来不少的方法,并且调参的过程也很详细,这些是我们应该学习的。

1:Introduction

这部分主要还是讲了讲前人使用CNN的一些工作,这部分暂且不提,主要思考的一个问题是为什么选用CNN,在这里论文里也没有详细讲,我写写我的想法,如果不对,欢迎指教。

我们传统的分类器比如朴素贝

更新时间:2023-06-14 03:02

TensorFlow系列



\

更新时间:2023-06-14 03:02

支持向量机

在本文中,我将介绍机器学习中关于传统机器学习中几乎最为强大的方法——支持向量机。

因为知乎中对于markdown的支持太差了,本文不在知乎直接排版,所以阅读体验不是很好,若想获得更好的阅读体验,请点击下文链接进行阅读。

[支持向量机​chrer.com 图标](https://link.zhihu.com/?target=http%3A//chrer.com/2018/08/04/%25E6%259

更新时间:2023-06-14 03:02

深度学习系列


\

更新时间:2023-06-14 03:02

因子库的因子怎样使用?

怎样使用因子库里的因子作为特征?

{w:100}

这个因子id没法直接使用,

{w:100}只能复制因子的表达式使用吗?

{w:100}

更新时间:2023-06-01 14:26

分页第1页第2页第3页第4页