首先获取训练集“Stanford V1.0”和使用Glove模型训练好的词向量矩阵。
我们使用shell命令获取以上文档,脚本如下:
DATASETS_DIR="utils/datasets"
mkdir -p $DATASETS_DIR
cd $DATASETS_DIR
# Get Stanford Sentiment Treebank
if hash wget 2>/dev/null; then
wget http://nlp.stanford.edu/~socherr/stanfordSentimentTreebank.zip
else
c
更新时间:2024-05-20 06:39
Numpy(Numerical Python)和Pandas两个库是Python编程语言中两个极其重要的库,尤其在数据科学、金融分析和量化投资领域。尽管它们在处理数据方面有所重叠,但各自设计的初衷和优势领域有所不同。
更新时间:2024-05-20 02:35
本文为旧版实现,仅供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
下列代码在读取数据时,使用最新dai.query接口即可。
\
本文继续讲解Pandas库在数据分析和处理上的一些应用。
[https://b
更新时间:2024-05-20 02:34
更新时间:2024-05-20 02:34
新版数据导入部分使用dai库
本节主要讲解Pandas库中 DataFrame 的数据查看与选择
Pandas 是基于 Numpy 构建的,让以 Numpy 为中心的应用变得更加简单。平台获取的数据主要是以 Pandas 中DataFrame 的形式。除此之外,Pandas 还包括 一维数组Series 以及三维的Panel。
下面将进行详细介绍:
Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而
更新时间:2024-05-20 02:33
\
更新时间:2024-05-20 02:32
\
更新时间:2024-05-20 02:32
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-16 06:03
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-16 02:44
完成了数据处理,接下来就可利用平台集成的各算法进行模型训练和模型预测啦。本文将详细介绍“模型训练”、“模型预测”两大模块操作、原理。
模型训练和模型预测是AI策略区别于传统量化策略的核心,我们通过模型训练模块利用训练集因子和标注数据构建一个模型,并通过模型预测模型将预测集的因子数据输入模型进行预测。 \n
在模块列表的 机器学习 、 **深度学习
更新时间:2024-05-15 09:51
{{use_style}}
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
[https://bigquant.com/wiki/doc/demos-ecdRvuM1TU](https://bigquant.com/wiki/doc/demos-ecd
更新时间:2024-05-15 07:29
更新时间:2024-05-15 03:34
neutralize(sum(turn_0,90), total_market_cap) as hsl, 报错。
更新时间:2024-05-02 09:55
BigQuant是专业但易用的AI量化投资平台。如下知识可以帮助我们更好的开始策略开发。
如果没有特别说明,请在 AIStuido 3.0使用。
BigQuant平台同时支持可视化编程开发和代码编程开发,并且两种模式可以无缝切换和融合
更新时间:2024-04-29 11:14
SELECT
sf.instrument,
sf.date as date,
sf.total_market_cap,
-- 从技术指标表中选择的字段
ta.ma_golden,
ta.ma_long,
ta.volume_golden,
ta.volume_long,
ta.three_red_soldiers,
ta.hammer,
ta.morning_star,
ta.kdj_golden,
ta.kdj_long,
更新时间:2024-04-06 11:36
最近读到中金量化多因子系列中提到一些高频因子,比如50分钟K线最高与最低价相关系数平方的均值、成交量最高50根K线成交量收益率动量等等,那么根据分钟行情数据构建出来的话,应该是计算出多行的数据,那么对于我们量化爱好者来说,做因子测试的话是利用这些日内多行的数据吗?还是需要做降频处理到每日只取一行数据?之前听万老师讲课听过一般会对高频因子做降频处理,这样处理数据算力负担不会太大。所以有些疑惑,一、想确认下刚才所讲的这两个高频因子是需要取多行数据还是可以降频处理?二、如果可以做降频处理,那么采用什么方式处理比较好?比如取它们均值还是什么?
更新时间:2024-03-26 12:56
with t1 as (
SELECT
date,
date_format(date,"%Y-%m-%d") as new_date,
instrument,
close,
FROM
cn_stock_bar1m
WHERE
1 = 1
AND date >= '2024-03-01'
AND date <= '2024-03-02'
)
SELECT * FROM t
更新时间:2024-03-25 09:10
模拟交易中使用到CSV文件怎么处理呢
更新时间:2024-03-19 09:30
在因子开发研究完之后,选取了|IC|较高的几个因子后,一般如何合成一个策略,即在工程方法论上的一般步骤是什么?比如应该如何选择哪些模型进行合成(树模型or深度学习模型,是否有规律),分别是否都必须在训练前进行特征工程的处理再训练(去极值、中性化去除相关性),比如是否需要探查各个因子的相关性(如果多个因子存在一定的相关性,一般相关度大于多少需要进行处理,是否需要逐对特征两两取残差)
\
方正的==“水中行舟”研报==中提到“取市场上所有股票在当日“不分化时刻”的成交额序列
更新时间:2024-03-15 03:36
https://bigquant.com/wiki/doc/5zug5a2q5yig5p6q-Tzo0w3iZgs
“因子分析”的使用文档是如下的调用,实际操作可行
\
m2 = M.input_features.v1(
features='f
更新时间:2024-03-06 07:11
默认可视化线性模板里,sql就加了几个条件,其他没改,就回测不了,提示日期为空或属性不存在,能帮忙看下吗?\n策略:https://bigquant.com/codeshare/6316cf34-e449-4b15-87b1-1754a9b5a2e5
回测时出现错误
ValueError: NaTType does not support strftime
添加“缺失数据模块”后,出现这个错误
AttributeError: 'DataSource' object has no attribute 'iter_df'
怎么解决?
更新时间:2024-02-19 05:57
join_area_data = M.sql_join_2.v1(
sql1=ori_data.data, # 标签数据
sql2=area_ds, # 地区数据
sql_join="""WITH
sql1 AS (
{sql1}
),
sql2 AS (
{sql2}
)
SELECT * FROM sql1 JOIN sql2 USING (instrument)
"""
)
area_ds是自定义数据集,类型为dai.DataSource,在使用Join的时候报错:**ArrowInva
更新时间:2024-02-15 07:44
更新时间:2024-02-05 04:59
更新时间:2024-01-23 03:53
如何构建跨周期数据项,并利用这些数据项构建因子?
平时处理的都是日线数据,但如果需要用日线和上月的月线数据进行一些计算形成一些因子,我应该如何构建?
更新时间:2024-01-12 02:34