交叉验证

交叉验证在金融领域中是一种重要的分析和风险管理工具。其核心思想是利用多来源、多维度的数据或方法,对同一问题或假设进行反复检验,以提高决策的准确性和稳健性。在投资决策中,交叉验证可确保信息的真实性和完整性,降低因单一数据来源或模型错误导致的风险。例如,在评估投资标的时,除了分析公司公开的财务报表,还会结合行业趋势、市场情绪等多方数据进行交叉验证,以得出更可靠的结论。在风险管理中,交叉验证可增强模型的预测能力和稳定性,帮助金融机构更精准地量化风险,从而优化资本配置和提升风险调整后的回报。通过交叉验证,金融机构能够提升决策质量,增强抵御市场不确定性的能力,最终实现更加稳健和可持续的发展。

用线性-回归算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-20 07:17

主动学习(Active Learning)

\

背景

机器学习的研究领域包括有监督学习(Supervised Learning)无监督学习(Unsupervised Learning),半监督学习(Semi-supervised Learning)和强化学习(Reinforcement Learning)等诸多内容。针对有监督学习和半监督学习,都需要一定数量的标注数据,也就是说在训练模型的时候,全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中,工作人员获得样本的成本其实是不低的,甚至在某些时候是相对较高的,那么如何通过较少成本来获得较大价值的标注数据,进一步地提升

更新时间:2024-05-20 06:19

交叉验证防止过拟合

交叉验证是一种在统计学和机器学习领域广泛使用的技术,主要用于评估模型的泛化能力,即模型对未见数据的预测能力。这种技术在金融领域的量化交易策略开发中尤为重要,因为金融市场的数据通常具有高度的不确定性和变化性。交叉验证通过在不同的数据子集上训练和测试模型来帮助识别和防止过拟合,过拟合是指模型对训练数据过度优化,从而导致其泛化能力下降。

精华参考:【研报分享】华泰证券——对抗过拟合:从时序交叉验证谈起

![](/wiki/api/attachments.red

更新时间:2024-05-20 05:56

Machine Learning is Fun! — 全世界最简单的机器学习入门指南

你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!

这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。

本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。

什么是机器学习?

机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene

更新时间:2024-05-20 03:18

机器学习中的过拟合

来源:elitedatascience编译:caoxiyang

导语

成千上万的数据科学新手会在不知不觉中犯下一个错误,你知道是什么吗?这个错误可以一手毁掉你的机器学习模型,这并不夸张。我们现在来讨论应用机器学习中最棘手的障碍之一:过拟合(overfitting)

在本文中,我们将详细介绍过拟合、如何在模型中识别过拟合,以及如何处理过拟合。 最后你会学会如何一劳永逸地处理这个棘手的问题。你将读到下面这些内容:

  1. 过拟合的例子
  2. 信号与噪音
  3. 拟合优度
  4. 过拟合和欠拟合
  5. 如何检查过拟合
  6. 如何避免过拟合

过拟合的例子

假设我们想根据

更新时间:2024-05-20 02:27

机器学习常用35大算法盘点

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然,本文收录的算法并不完全,分类的方式也不唯一。不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。 在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式

更新时间:2024-05-20 02:09

关于线性回归、岭回归和Lasso回归的综合入门指南

https://bigquant.com/experimentshare/c451f287332a411cb4c7756c457318f6

\

更新时间:2024-05-20 02:09

零基础《AI挑战虚拟股票预测大赛》入门教程

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-20 02:09

用随机森林-分类算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-17 06:42

【历史文档】算子样例-机器学习

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-15 07:49

用财务因子怎么构建机器学习策略?

\

更新时间:2023-10-09 07:09

Tabnet如何实现分类任务

https://bigquant.com/experimentshare/75aff243f241447da1d1994ed9d29c44

如何实现分类任务啊,怎么在原有策略上修改

更新时间:2023-10-09 07:05

二分类模型的评估组件报错

https://bigquant.com/experimentshare/20119409c088405dbb7e14dca685958a

\

更新时间:2023-10-09 03:40

纯代码参数优化

可以发一个纯代码模型下参数优化的策略例子么?想学习一下纯代码下的参数寻优

更新时间:2023-10-09 02:22

深度学习与TensorFlow:FCN论文翻译(二)

文章居然超长了,接上篇


Fully convolutional networks

Each layer of data in a convnet is a three-dimensional array of size h × w × d, where h and w are spatial dimensions, and d is the feature or channel dimension. The first layer is the image, with pixel size h × w, and d color channels. Locations in hi

更新时间:2023-06-14 03:02

金融交易中的机器学习与统计

金融数据的特点是时间序列,这意味着传统预测模型(包括机器学习和统计,为避免不必要的学派之争,统一称为预测模型)使用的训练集、验证集、测试集的方法或许不大适用,特别是交叉验证,很难说用后面的数据验证前面的数据算不算样本外,毕竟现实中只能前面的数据先发生。但也有人说我近期观察到一个pattern,最近几天都出现,想看看在历史行情中表现如何......

另外还有人说我拿奇数年的数据做个模型,然后拿偶数年的数据验证一下,这样是否靠谱?比如十年数据,一般来说,1-5做训练,6-10做预测,效果会最差;1-5预测6,1-6预测7,这样滚动着来,效果可以好一些,这些都可以算作严格的样本外;如果是1

更新时间:2023-06-14 03:02

《机器学习》笔记-模型评估与选择(2)

写在最前面

如今机器学习和深度学习如此火热,相信很多像我一样的普通程序猿或者还在大学校园中的同学,一定也想参与其中。不管是出于好奇,还是自身充电,跟上潮流,我觉得都值得试一试。对于自己,经历了一段时间的系统学习(参考[《机器学习/深度学习入门资料汇总》](https://link.zhihu.com/?target=https%3A//link.jianshu.com/%3Ft%3Dhttps%253A%252F%252Fcaiquanliu.github.io%252F2017%252F11%252F12%252F%2525E6%25259C%2525BA%2525E5%25

更新时间:2023-06-14 03:02

模型的选择、评估和优化-上

在本文中,我将介绍机器学习的模型选择、评估和优化

因为知乎中对于markdown的支持太差了,本文不在知乎直接排版,所以阅读体验不是很好,若想获得更好的阅读体验,请点击下文链接进行阅读。

[模型的选择、评估和优化-上​chrer.com](https://link.zhihu.com/?target=http%3A//chrer.com/2018/07/21/%25E6%25A8%25A1%25E5%259E%258B%25E7%259A%2584%25E9%2580%2589%25E6%258B%25A9%25E3%2580%2581%25E8%25AF%2584%25E4%25

更新时间:2023-06-14 03:02

量化系列


\

更新时间:2023-06-14 03:02

分类模型评估

https://bigquant.com/experimentshare/1660319553994a9282db074e02e51f9f

\

更新时间:2023-06-14 03:02

回归问题的标签设置

问题

回归问题的标签设置

\

更新时间:2023-06-01 02:13

用传统框架测试机器学习-GBDT算法

策略案例

https://bigquant.com/experimentshare/44cc116a1dad4c37983b9be35da208ee

\

更新时间:2022-11-20 03:34

分享一个可视化深度学习建模的例子

策略案例

https://bigquant.com/experimentshare/9426627188af4f488644532c01328c14

\

更新时间:2022-11-20 03:34

lighGBM训练出错

https://bigquant.com/experimentshare/ada6ffe2d3f94a6f9e0ccac744524604

\

更新时间:2022-11-09 01:23

滚动训练和自定义运行如何一起使用,能给个例子吗?

问题

滚动训练和自定义运行如何一起使用,能给个例子吗

更新时间:2022-11-09 01:23

分页第1页第2页