机器学习

机器学习在金融领域的应用日益广泛,为金融业务的智能化提供了强大动力。它运用算法和模型,自动从海量数据中学习和提取有用信息,无需人工进行复杂编程。在金融风控方面,机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为,降低信贷风险。在投资策略上,通过对历史数据的深度学习,机器能预测市场走势,为投资者提供更精准的建议。同时,机器学习还能优化客户服务,例如通过聊天机器人提供24小时在线咨询,或根据客户行为数据提供个性化金融产品推荐。总的来说,机器学习不仅提升了金融业的效率和智能化水平,也在重塑我们的金融生态。

机器学习与深度学习


传统的量化投资主要依赖于金融时间序列分析、统计学和经济学原理来构建模型。然而,金融市场是复杂、非线性、高噪声的动态系统,传统的线性模型在处理海量、高维和非结构化数据时常常力不从心。

机器学习和深度学习技术的崛起,为量化投资带来了革命性的工具。它们能够从海量数据中自动挖掘复杂的非线性模式,极大地扩展了量化策略的广度和深度。



【视频1】

video(19).mp4 165970555


【视频2】

[https://bigqu

更新时间:2025-11-27 10:19

机器学习策略综合实践

在当今信息爆炸的时代,金融市场充满了海量、高维、非结构化的数据。传统投资方法在处理这些复杂数据时常常力不从心。

而人工智能,特别是机器学习强化学习,正以其强大的数据挖掘和决策优化能力,为投资领域带来革命性的变化。

其核心思想可以概括为:利用“机器学习”从浩瀚股海中精准筛选出有潜力的股票(选股),再运用“强化学习”为这些股票寻找最佳的买卖时机(择时),从而构建一个全自动、高适应性的智能投资系统。






[https://bigquant.com/bigapis/college/v1/files/88c8f449-ccc4-4bd8-834c-4ac

更新时间:2025-11-27 10:14

神经网络算法下的风格轮动策略

我们之前已经介绍过几个风格轮动的策略了,本质上依据的就是股票市场长期存在的“强市炒成长、弱市求稳健”的轮动策略。

1.神经网络算法

1.1算法核心原理

神经网络是一种模仿人脑神经元连接结构的机器学习模型,擅长处理多维度、非线性的复杂数据关系。其核心优势在于通过多层网络结构自动学习数据中的隐藏规律,无需人工预设特征映射关系,能更精准捕捉市场风格背后的复杂驱动逻辑。

1.2神经网络架构设计

我们采用的是全连接神经网络,具体的结构如下:

  • 输入层:接收 6 个核心市场特征(市场广度指标 breadth_ma20、短期动量 avg_mom5、长期动量

更新时间:2025-11-21 02:03

策略分享-时间序列分析风格判断

《韩非子 · 五蠹》有言:“世异则事异,事异则备变”。

我们过去的策略对市场风格进行判断时,除了一些绝对化标准的方法,还介绍过用机器学习算法来学习市场风格变化的模式。但是,如果将这种风格判断应用在一些中短期策略上,可能会带来以下的问题:

(1)A 股短期波动中,突发消息(如政策微调、资金异动、情绪恐慌)的影响远大于 “可预测规律”。

(2)机器学习依赖 “特征工程”(如成交量、资金流向、行业涨跌幅等),但中短期维度下,这些特征与指数收益率的相关性极不稳定。

(3)A股各种指标特征的特点变化极大,用过去一年两年的数据进行数据很可能会匹配不上现在的行情。

那么对于中短

更新时间:2025-11-17 02:01

什么是量化投资


70年代,随着计算机技术的快速发展,量化投资开始迅速崛起,计算机的广泛应用使得大量历史数据的存储和处理成为可能,从而促进了量化分析方法在投资决策中的应用。

此时期,许多基于统计和数学模型的量化策略被开发出来,如指数化投资、算法交易等。


进入21世纪,量化投资经历了爆炸式的增长,数据的爆炸增长和机器学习技术的进步为量化投资提供了新的工具,机器学习和人工智能技术使得量化投资策略能够从大量复杂数据中提取模式,并进行更为精细的市场预测。




[Screen-2025-11-06-225619.mp4 202738252](/wiki/static/upload/42/42f033

更新时间:2025-11-13 06:36

提交代码后不出结果的几个可能原因(会实时更新)

大家在提交之前务必要在cpt_jyc_2025_stock_csi1000_bar1m上使用因子分析工具来查看。 如果在该数据集上无法展示因子分析绩效, 那么提交后也不会产生分数!

机器学习模型训练失败

经过这几天的跟踪, 有一部分的比例是因为使用了机器学习模型导致无法出得分, 此时需要各位检查一下机器学习是否预测成功。可能存在以下原因导致无法出结果:

  1. 训练数据中存在缺失值导致损失为NaN:

针对这种情况,请大家

更新时间:2025-10-17 08:25

基本面量化


\

更新时间:2025-09-10 09:27

Liujunze_提交作业

作业1:\n1)测试筛选策略不同时期的风格是否会有变化?

结论:有变化。

实验变量:策略采用一个小市值因子 c_pct_rank(total_market_cap),对比的是市场风格-市值收益率。

结果发现:策略在2020年1月至2025年8月,整体与市值因子相关系数最大,其次是beta和流动性。

阶段分析:

2020年1月-2021年2月:市场风格-市值收益率上升阶段:策略与市值因子相关系数降低,beta和流动性系数上升,其他无明显变化。
2021年2月-2024年1月:市场风格-市值收益率下降阶段:策略与beta因子相关降低,其他无明显变化。
2024年1月-2025年8

更新时间:2025-08-19 06:17

邹的作业

先感谢老韵同学,下面抄老韵同学的作业,改了3个模型进行训练,不知道为啥我这里xgboots的效果那么差,搞不清原因。感觉机器学习最重要的就是设置好因子和lable,目前没有头绪,没有对因子挖掘系统性的认知,现在就是瞎试。 之前lable没有用pct_rank_by,结果就很差,不知道如何运用pct_rank_by和pct_rank_by提升收益的逻辑,还请答疑时,老师给解答一下。


[https://bigquant.com/codesharev3/cec871c2-b428-451c-8c70-cfd4a6d1c2f9](https://bigquant.c

更新时间:2025-08-16 15:23

张伟_作业

以下是机器学习的作业,分别测试了XGBoost模型和线性回归模型,代码如下:

https://bigquant.com/codesharev3/9f8b0f0d-a863-4f0c-ab89-2508ca68d72b


一、XGBoost模型构建主要思路

1.股票池选择

策略获取盈利主要还是从优质微盘股风格中获取,因此在股票底池做如下限制:(1)pe_ttm大于0;(2)市值排名最小的20%;(3)剔除ST股及停牌股

更新时间:2025-08-12 09:54

策略分享-基于CatBoost模型与分类任务的ETF选基策略

0. 策略名词解释

(1)CatBoost模型

CatBoost 是由 Yandex(俄罗斯的一家互联网公司) 开发的一个 基于梯度提升(Gradient Boosting) 的机器学习库,主要用于 分类、回归、排序任务,以处理结构化数据为主。它的名字来自 “Category Boosting”,因为它特别擅长处理 类别特征(Categorical Features)。本策略中使用的是分类任务(二分类)。

在bigquant平台的可视化模块中暂时不支持

\

(2)分类任务

分类任务是指将输入数据划分到预定义的类别中。在 CatB

更新时间:2025-08-12 02:08

喜澄的作业

按照本次作业要求,我根据笑宇老师的讲解及给的模版,借住AI编程,分了几个步骤,完成作业如下:

1、先根据之前老师的讲解,选择小市值因子、换手率因子等有效因子,构建策略因子组合,时间关系选了4个,后续可以用老师讲解的因子分析表替换可能的有效因子\n2、基于笑宇老师给的模版,运用AI完成线性回归策略,几经周折,跑通策略;\n3、将策略打包成模块,将可用的3个模型作为参数,构建多因子多模型策略,跑通;\n4、将策略输出用图表展示出来。前后整了3天,修改了10几个版本才成型,累得够呛,但最终跑通还是欣慰的\n\n学习心得:\n1、因子重要还是模型重要?\n我的理解是二者都很重要,但因子相对更重要。从

更新时间:2025-08-11 08:58

陈雨作业,0729

1、请回顾你过去的交易经验,选择一个你曾经使用过的交易方法,尝试用量化的方式重新表达出来(用文字描述,无需代码实现)

 优选2-3个近期热点行业筹码峰低位集中的2-3之股票。最好是看的出来主力持仓开始集中了。
 量化表达:

 (一)定义板块动量因子确定热门板块

 (二)定义股票动量因子确定热门板块中的热点票,并通过量价关系因子过滤出股票

(三)通过机器学习,选取股票,形成策略。

2、在看完从0-1开发量化策略之后,请自己总结一下量化策略开发的主要流程

主要流程包括:

A想:先找到逻辑把任何能解释价格变动的灵感(经典理论、市场现象)翻译成一句可证伪的假设。例如“高动

更新时间:2025-08-10 07:19

bqcj06gr_作业提交

1、请回顾你过去的交易经验,选择一个你曾经使用过的交易方法,尝试用量化的方式重新表达出来(用文字描述,无需代码实现)。

答:股票池筛选:当连续10日最小值大于34日均线的0.99倍时纳入初选股票池;若获利筹码高于73%,则买入;当最大值低于34日均线时卖出。


2、在看完从0-1开发量化策略之后,请自己总结一下量化策略开发的主要流程。

答:1、进行单因子分析筛选出IC和IC_IR较高的因子,积累初步的因子库;

2、对有效的因子进行单因子选股回测,看看初步效果,确定哪些因子是核心收益率因子,哪些可用于控制风险,并对这些有效因子进行相关性分析;

3、选择前面有效的收益因子进行机器学习或

更新时间:2025-07-29 09:40

Liujunze_作业提交

【今日作业】:

1、请用自己的话解释什么是量化投资。

量化投资就是找出收益率与某个参数存在关系,然后用历史的数据来证实这个关系,最后是用近期参数的变化来找出收益率高的股票。

在这个过程中:

收益率就是未来的的收益,各有各的定义,有些用三天,有些用五天

某个参数,简单来说可以是开盘价、收盘价这些单个因子,也可以是单个因子之间所形成的公式组

关系,就是趋向于线性关系,参数上涨/下跌时,收益率大概率也跟着一起;

       非线性关系,就是通过复杂的机器算法来找出参数内高收益的部分,自学习两者关系,然后用它预测未来收益。

历史数据:就是用发现的关系,在已经过去的数据,来进行

更新时间:2025-07-28 10:22

策略分享-基于随机森林的半自动量价多因子策略

0.策略名词解释

0.1 随机森林

随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和回归上表现出了十分惊人的性能。

1、用有抽样放回的方法(bugging)从样本集中选取n个样本作为一个训练集

2、用抽样得到的样本集生成一棵决策树。在生成数的每一个结点:

  • 随机不重复地选择d个特征
  • 利用这d个特征分别对样本集进行划分,找到最佳的划分特征

3、重复步骤1到步骤2共k次,k即为随机森林中决策树的个数。

4、用训练得到的随机森林对测试样本进行预测,并用票选法决定预测的结果。

下图比较直观地展示了随机森林算

更新时间:2025-06-27 07:43

使用M.tune写一个超参优化

本文是旧文,最佳实践见:160-alpha挖掘大杀器——并行模块tune

前言

M.tune可调节的参数仅限于模块中的参数, 具体用法可参考**尝试用M.tune写一个滚动训练.**

使用方法

我们创建一个机器学习算法策略, 将可视化画布转化为代码形式:

![](/wiki/api/attachments.redirect?id=bcfc8a07-292d-4319-9143-42

更新时间:2025-06-09 05:53

埃及和金砖国家双边贸易的决定因素:使用传统计量经济学和机器学习算法的引力模型

摘要

文章首先介绍了国际贸易的基本概念,包括进口和出口的定义,以及国际贸易的起源和重要性。文章提到,由于各国资源分配不均,国际贸易成为满足国内需求的重要手段。文章还回顾了国际贸易理论的发展,从亚当·斯密的绝对优势理论、大卫·李嘉图的比较优势理论,到赫克歇尔-俄林模型和克鲁格曼的新贸易理论。这些理论为理解国际贸易的模式和影响因素提供了基础。

研究方法

研究采用了以下方法:

  1. **泊松牛顿-拉夫森方法:**这是一种经典的计量经济学方法,用于分析贸易量与各种因素之间的相关性。
  2. **梯度提升(GB)和随机森林(RF):**这两种机器学习算法用于识别对贸易量有显著影响的独

更新时间:2025-05-12 09:57

机器学习应用于底部反转策略的表现

策略简介

A股表现整体呈现震荡趋势,熊市周期长,且经常出现虽然指数跌幅较低,但市场上的个股跌幅较大。于是提出猜想:是否能找到比较抗跌的策略,在市场表现一般的时候策略回测较小。

策略的特点:在大盘下跌时,策略相对大盘比较抗跌,策略回撤相对小。

构建步骤

确定策略目标市场

策略的目标市场:中小板(波动率高,活跃度高,流动率高,做出alpha可能性高;且在反转时,上涨的幅度较大)

构建策略核心因子

2个技术指标因子+1个换手率因子+1个资金流因子+1个量价因子

![](/wiki/api/attachments.redirect?id=5fbec9e0-

更新时间:2025-04-18 10:11

如何使用超参搜索持仓天数

视频讲解

点此查看视频

策略源码

https://bigquant.com/codeshare/769aba37-1960-4fc6-bedc-1d7a8a4dee0a

\

更新时间:2025-04-15 07:19

2021-AI量化Meetup导览

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}导语

2020年我们开展了近半年的Meetup,共11场Meetup活动,90个问题,7场专题,持续地为大家服务和提供新鲜的灵感。2021年,Me

更新时间:2025-04-15 07:19

2023-AI量化Meetup

\

更新时间:2025-04-15 07:19

机器学习/深度学习策略理解

视频讲解

可看视频听老师的详细讲解

机器学习逻辑理解

问:机器学习在量化中,怎样在过程中查看策略、理解机器学习的逻辑和修正?

答:

1)可解释性

2)如何减少过拟合

3)机器学习/深度学习课程

常见的机器学习/深度学习模型

目前

更新时间:2025-04-15 07:19

49th Meetup

Q1-@james:有什么另类的标注可以推荐下?

https://bigquant.com/wiki/doc/-0kcMgSnQXw

https://bigquant.com/wiki/doc/rengongzhineng-xilie-ershijiu-shouyi-linglei-biaoqian-zhengquan-fuben-xRMNFmmg00

{w:100}{w:100}{w:100}

更新时间:2025-04-15 07:19

如何构建高频的订单流与成交量分布因子

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2025-04-15 07:19

分页第1页第2页第3页第4页第5页第6页第7页第8页第9页第14页
{link}