特征工程

特征工程在金融领域的应用,实质上是利用数据和统计学方法,挖掘和提炼影响金融决策的关键因素,将之转化为模型可理解的特征,进而提高金融模型的预测能力和决策效率。特征工程涉及特征构建、特征选择以及特征转换等环节,它能从复杂多变的市场环境中提取出关键信息,帮助金融机构在风险评估、投资策略、信贷审批等核心业务上做出更精准、更智能的决策。例如,在信贷风险评估中,特征工程可以通过整合借款人的历史信用记录、财务状况、社交网络行为等多维度数据,构建出全面而深入的风险评估特征,进而增强风险模型的预测精度,提升信贷决策的科学性和有效性。总的来说,特征工程对于金融机构提升数据驱动决策的能力,实现更精细化、智能化业务管理有着重要的价值和意义。

黄金价格预测:使用 Python 机器学习的分步指南

是否有可能预测黄金价格的走向?

是的,让我们使用机器学习回归技术来预测最重要的贵金属之一黄金的价格。

我们将创建一个机器学习线性回归模型,该模型从过去的黄金 ETF (GLD) 价格中获取信息,并返回第二天的黄金价格预测。

GLD是直接投资实物黄金的最大ETF。

\


导入库并读取黄金 ETF 数据

首先要做的是:导入实施此策略所需的所有必要库。

然后,我们读取过去 12 年的每日黄金 ETF 价格数据并将其存储在 Df 中。我们

更新时间:2022-07-05 07:13

如何构建高频的订单流与成交量分布因子

问题

如何构建高频的订单流与成交量分布因子,如何分析和使用这些因子,如何与机器学习或深度学习进行融合,在股票或期货策略中获得更好的收益?

视频

https://www.bilibili.com/video/BV1E34y1W7NB?share_source=copy_web

策略源码

[https://bigquant.com/experimentshare/3a7358c79b2f424a9b73763fdd8525bc](ht

更新时间:2022-06-20 09:12

数据正态分布或方形分布对训练的准确性的影响

问题

在机器学习中策略中,数据正态分布或方形分布对训练的准确性产生重要影响吗?如果有,有什么方法处理呢?

视频

https://www.bilibili.com/video/BV1jT4y1R7wc?share_source=copy_web

\

更新时间:2022-05-31 08:34

高质量AI量化策略

https://bigquant.com/experimentshare/dd9cff01459a41f9be40d7e660164795

\

更新时间:2022-05-22 01:17

xgboost自定义目标和评估函数

https://bigquant.com/experimentshare/648ff204e53d44059c2d726e9219cfa3

\

更新时间:2022-04-21 06:21

文档整合


AI量化策略快速理解

https://bigquant.com/wiki/doc/celve-Uu3N6WbJNJ

更新时间:2022-04-11 11:00

因子(特征工程)是什么

导语

近年来,国内量化投资迎来了发展的黄金期,但涉及机器学习的量化投资还比较少。机器学习领域的大神Andrew Ng(吴恩达)老师曾经说过机器学习很大程度上就是特征工程,因此本文主要介绍下特征工程在量化投资领域的应用。


特征工程是什么?

有这么一句话在业界广泛流传: 数据和特征决定了机器学习的上限。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。简单理解为:特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

**特征工程在量化投资领域有非常适宜的土壤,

更新时间:2021-12-29 06:39

CTA程序化交易实务研究之六:基于机器学习的订单簿高频交易策略-民生-131211

/wiki/static/upload/7e/7e6629bc-ac8d-42ad-85a0-c74ecff7229b.pdf

\

更新时间:2021-11-12 11:39

严谨解决5种机器学习算法在预测股价的应用(代码+数据)

![](data:image/svg+xml;utf8,<svg xmlns='http://www.w3.org/2000/svg' width='1000' height='400'></svg>)

本期作者:Yibin Ng

译者:1+1=6

前言

机器学习有很多应用,其中之一就是预测时间序列。一个最有趣(或者可能是最赚钱)的时间序列是股票价格。

今天,我们用更严谨的

更新时间:2021-09-09 02:10

神经网络交易算法

策略案例

https://bigquant.com/experimentshare/723e10568f294571924b89f3953ce20b

\

更新时间:2021-09-08 03:03

机器学习新手十大算法之旅

作者:James Le 编译:caoxiyang


在机器学习中,有一个叫做“世上没有免费午餐”的定理(NFL)。简而言之,我们无法找到一个放之四海而皆准的最优方案,这一点对于监督学习(即预测建模)尤为重要。例如,你不能说神经网络总是比决策树好,反之亦然。因为其中有很多因素在起作用,比如数据集的大小和结构。

因此,您应该针对您的问题尝试多种不同的算法,同时,保留一组数据,即“测试集”来评估性能并选

更新时间:2021-08-24 05:46

深度学习为什么回测时间改变之后收益率不一样

\

更新时间:2021-08-23 01:56

自动机器学习工具全景图:精选22种框架,解放炼丹师

image|690x388

构建一个典型的机器学习项目,一般分成以下步骤:

收集原始数据、合并数据源、清洗数据、特征工程、模型构建、超参数调优、模型验证和设备部署。

整个过程中,模型构建最能体现创造力,而最耗时的,要数特征工程和超参数调优。

于是,有时候会因为赶时间,过早将模型从实验阶段转移到生产阶段,导致它们发挥不出最佳效果;也有时候,会因为花了太多时间调优导致部署延迟。

这时候,就体现出了自动机器

更新时间:2021-08-20 12:54

深度学习在期货高频上的应用

8月19日Meetup问题模板:

https://bigquant.com/experimentshare/f58dbfb388454407b8a2b99eb14cf1ea

\

更新时间:2021-08-20 07:30

循环神经网络(RNN)介绍2:keras代码分析

根据上一篇的介绍,我们已经对循环神经网络有了基本了解。上一篇文章的“keras部署神经网络”部分,我们提供了搭建一个简单RNN网络的代码,但是实际运行代码时总会遇见各种问题,笔者就是如此,为了方便理解代码,笔者带着大家一步步分析代码,对代码中涉及到的一些自然语言处理的概念解释,实际运行中遇到的错误进行分析并给出解决方法。

我们的目标是:使用keras搭建RNN网路,使用推文数据训练模型

实现目标的思路是:准备工作 -> 数据序列化 -> 得到词嵌入矩阵 -> 训练网络

  • 准备工作:读取相关库函数,读入数据集,划分训练集和测试集,
  • 数据序列化:将文本转换为数字序列

更新时间:2021-08-11 06:00

lightGBM_AI选股

https://bigquant.com/experimentshare/2fbb2629dcb0450bbf72e224835b4957

\

更新时间:2021-07-30 09:11

AI量化策略,我该如何理解你?

人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。

理解机器学习算法

机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量$ Y$未来的取值,并找到了影响变量$ Y$取值的$K$ 个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数$f(X_1,X_2,\ldots,X_K|

更新时间:2021-07-30 09:08

LSTM Networks应用于股票市场之Sequential Model

策略案例


https://bigquant.com/experimentshare/8594992a1d9345d98cbe949eb6297067

\

更新时间:2021-07-30 08:10

基于XGBoost的价值选股策略代码

本代码完整版一共包括三部分:数据、算法、回测交易。 由于该策略与机构有一些合作,我们只放出了数据和算法。希望大家能够理解!

策略案例

https://bigquant.com/experimentshare/5a93201876eb401e998867e0b5106175

\

更新时间:2021-07-30 08:09

用多层感知器-回归算法实现A股股票选股

策略案例


https://bigquant.com/experimentshare/a8cfb3df111c43fc9bec8f70654ecd5e

\

更新时间:2021-07-30 07:26

特征取分位数据

2021年7月8日Meetup模板:

https://bigquant.com/experimentshare/4fa50659ea5340188b574e288c0f9903

\

更新时间:2021-07-30 07:25

分页第1页第2页第3页