欠拟合

《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰写的机器学习系列文章，本文主要介绍其第二部分内容——《监督式机器学习算法的应用》，并将其思想和代码应用在中国股票市场，开发出具有择时功能的监督式机器学习算法，最后进行策略回测。对此感兴趣的小伙伴可以直接在

更新时间：2024-06-12 05:57

导语

本文为Mehmet Süzen撰写文章的译文，稍有删改。文章清晰地阐释和区分过度拟合及过度拟合等概念，对于本领域学习者正确理解专业术语多有帮助。正如作者在原文末所指出的：对待简单的概念，我们也应抱着积极求学的态度，了解其成立的基础。

前言

大多数从业者对”过拟合“这一概念存在误解。在数据科学界，始终存在一种类似于民间说法的观点：“利用交叉验证可以防止过拟合。在样本外对模型进行验证，如果不存在泛化误差，则模型不存在过拟合”

这个说法显然是不对的：交叉验证并不能阻止模型过拟合。样本外的良好预测性能并不能保证模型不存在过拟合。在这个说法中，前部分说的概念其实是“过度训练”。

更新时间：2024-06-12 05:53

关于线性回归、岭回归和Lasso回归的综合入门指南

https://bigquant.com/experimentshare/c451f287332a411cb4c7756c457318f6

更新时间：2024-06-12 05:48

AI量化策略，我该如何理解你？

人工智能（AI）技术得到了飞速发展，其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术，因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。

理解机器学习算法

机器学习算法太多，本文讨论只针对适用于金融数据预测的常用有监督型机器学习（Supervised Machine Learning）算法：StockRanker。假设我们要去预测某个连续变量$ Y$未来的取值,并找到了影响变量$ Y$取值的$K$ 个变量，这些变量也称为特征变量（Feature Variable）。机器学习即是要找到一个拟合函数$f(X_1,X_2,\ldots,X_K|

更新时间：2024-06-11 03:20

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-20 07:17

背景

机器学习的研究领域包括有监督学习（Supervised Learning），无监督学习（Unsupervised Learning），半监督学习（Semi-supervised Learning）和强化学习（Reinforcement Learning）等诸多内容。针对有监督学习和半监督学习，都需要一定数量的标注数据，也就是说在训练模型的时候，全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中，工作人员获得样本的成本其实是不低的，甚至在某些时候是相对较高的，那么如何通过较少成本来获得较大价值的标注数据，进一步地提升

更新时间：2024-05-20 06:19

【历史文档】算子样例-StockRanker训练曲线(Learning Curve)

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-15 08:22

【历史文档】算子样例-机器学习

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-15 07:49

向导式生成的普通策略报错

https://bigquant.com/experimentshare/4d787bfaafaa40578641e6d2ae0b6fd0

更新时间：2023-06-01 02:13

用传统框架测试机器学习-GBDT算法

策略案例

https://bigquant.com/experimentshare/44cc116a1dad4c37983b9be35da208ee

更新时间：2022-11-20 03:34

lighGBM训练出错

https://bigquant.com/experimentshare/ada6ffe2d3f94a6f9e0ccac744524604

更新时间：2022-11-09 01:23

【如何检验过拟合？】学会这招减少你实盘踩坑的概率

如何检测过拟合or 欠拟合？

首先祝大家五一快乐。

趁着假期没事，虫哥给大家唠嗑唠嗑实盘中踩的那些坑。

4月不易，且行且珍惜，跑的最好的一个小账户只有一点安慰奖（别笑，差不多一个月工资了…………）。平均下来每个账户只有5-7%的平均收益，可以看到最近的行情真的不是很好赚钱。

{w:100}{w:100}{w:100}

做数据分析和建模的过程中很多时候，我们最害怕和担心的就是为了优化模型，会不自觉引入一些过于复杂的条件拟合

更新时间：2022-09-18 14:10

监督学习的方法介绍及金融领域应用实例-长江证券-20170727

摘要

机器学习系列报告

本系列报告试图系统全面性的介绍各种不同的机器学习方法，并且结合具体的在投资研究领域应用实例、交易策略及code示例，说明其应用情景和实现方法。机器学习的方法可以分为以下几类：监督学习、无监督学习、深度学习及其他机器学习方法（例如强化学习），对应到具体的模型上数量则更是繁多，目前大部分机器学习模型并未广泛的应用在投研领域，因此本系列主要偏重于在投研领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主

监督学习模型之回归类模型及其应用

与普通线性回归不同，监督学习中的惩罚回归模型和非参数回归，可以分别用于处理输入变量中存在大量线性相关性关系

更新时间：2022-08-31 01:52