数据预处理在众多深度学习算法中都起着重要作用,实际上,对数据进行适当处理后,很多算法能够发挥最佳效果。然而面对各种各样的数据,很多时候我们不知道怎么样才能针对性进行处理。本文介绍了Python下的机器学习工具scikit-learn。其中,“sklearn.preprocessing”模块提供了几种常见的函数和转换类,把原始的特征向量变得更适合估计器使用。
[https://bigquant.com/experimentshare/45cc0fe6c95b43848f64032bbef0a440](https://bigquant.com/experimentshare/
更新时间:2024-06-12 05:56
更新时间:2024-06-07 10:55
在机器学习中策略中,数据正态分布或方形分布对训练的准确性产生重要影响吗?如果有,有什么方法处理呢?
https://www.bilibili.com/video/BV1jT4y1R7wc?share_source=copy_web
\
更新时间:2024-06-07 10:55
更新时间:2024-06-07 10:55
更新时间:2024-05-24 10:28
本文内容已经过期,不再适合平台最新版本,请查看以下最新内容,作为参考资料学习。
本文为旧版实现,仅供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
\
[https://bigquant.com/experimentshare/42bf93884b1246ad83c2874f06765732](https://bigquant.com/experimentshare/42bf93884b12
更新时间:2024-05-20 06:39
起源于 1901 年 Pearson 的主成分分析(PCA),通过对协方差矩阵的特征值分解或 SVD 分解,通过对特征值排序选取相应的特征向量,将高维特征映射到低维上,达到降维的目的。用于数据预处理。
1998 年,降维算法PCA首次与核方法结合,先将数据集通过核函数(Kernel Function)映射到高维空间,然后在高维特征空间中做 PCA。核 PCA 有更好的降维效果。
2000 年,始于局部线性嵌入(Locally Linear Embedding)的流形学习(Manifold Learning)引领了降维算法的新浪潮。
2008 年 ,t-SNE 作为非线性降维方法,可更好地
更新时间:2024-05-20 03:21
更新时间:2024-05-20 02:09
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-17 06:42
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-16 01:52
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-15 08:18
/* 使用DAI SQL为量化模型预测生成标签数据。标签反映了未来5日的收益率,并且被离散化为20个桶,每个桶代表一个收益率范围。这样,我们就可以训练模型来预测未来的收益率范围,而不仅仅是具体的收益率值。
更新时间:2024-01-31 03:56
更新时间:2023-11-27 05:55
更新时间:2023-10-09 07:46
\
更新时间:2023-10-09 07:09
https://bigquant.com/experimentshare/75aff243f241447da1d1994ed9d29c44
如何实现分类任务啊,怎么在原有策略上修改
更新时间:2023-10-09 07:05
更新时间:2023-10-09 03:36
怎样使用因子库里的因子作为特征?
这个因子id没法直接使用,
只能复制因子的表达式使用吗?
更新时间:2023-06-01 14:26
更新时间:2023-06-01 14:26
运行资源充足,但总是自动重启,100%复现
https://bigquant.com/experimentshare/721a8a757c1941e3b06b628c35279ce3
可能是训练集数据存在异常值导致的,对数据进行预处理,可以参考以下策略
\
[https://bigquant.com/experimentshare/596e737dfe9b423095685612871eed
更新时间:2023-06-01 02:13
预测数据前我想做个自定义筛选,策略中只是举例,但我想实现这个功能,应该怎么把DataFrame输入模型,目前的报错是
这里需要把dataframe格式的数据转换成DataSource的类型,用如下代码就可以了。 data=DataSource.write_df(df),
更新时间:2023-06-01 02:13
回归问题的标签设置
\
更新时间:2023-06-01 02:13
例如我要在特征中加入一个因子:统计30日内收益小于5%的天数,该怎么写
更新时间:2023-06-01 02:13
更新时间:2022-11-20 03:34
特征选择是人工智能选股策略的重要步骤,能够提升基学习器的预测效果特征选择是机器学习数据预处理环节的重要步骤,核心思想是从全体特征中选择一组优质的子集作为输入训练集,从而提升模型的学习和预测效果。 我们将特征选择方法应用于多因子选股,发现特征选择对逻辑回归_6m、基学习器的预测效果有一定提升。我们以全A股为股票池,以沪深300和中证500为基准,构建行业中性和市值中性的选股策略。基于F值和互信息的方法对于逻辑回归_6m、XGBoost_6m、基学习器的回测表现具有明显的提升效果。 随着入选特征数的增加,模型预测效果先上升后下降特征个数并非越多越好。以逻辑回归_6m和XGBoost_
更新时间:2022-07-29 07:12