做了一个关于2日均线的梯度因子,如下,将其放入Stockrank中呈现非常好的收益,怀疑有未来函数,投放模拟盘后无交易数据输出,但是放在xgboost求解器里没有这种现象发生,模拟盘也正常输出,所以是梯度函数和StockRanker一起使用导致的吗?原理上均线数据是用过去数据构成的,应该不会造成未来。梯度函数按np里的帮助应该也是用过去数据构成的,不会造成未来,所以很迷惑,希望有工程师能帮忙查一下。下面分别是因子分析,sr,xgb的策略,因子分析的收益看起来就很离谱,但似乎并不影响xgboost的结果.,还是说系统在处理梯度函数时带入了未来数据?
[https://bigquant.co
更新时间:2023-10-09 06:50
一个最基本的策略测试,发现回测模块买卖和持仓数据不符合逻辑,不知是什么问题?
在print 中的交易数据与回测模块中的详情完全对不上!回测模块中没有买的股票,怎么有持仓?
买卖也不对!
https://bigquant.com/experimentshare/bac3a381371b4b338a84bbd3092e8398
\
更新时间:2023-10-09 03:36
更新时间:2023-09-27 02:30
随着陆股通的推进,内地投资者对港股的关注度也越来越高。在本报告中,我们对港股 Barra 模型进行了介绍,并对数据结果及应用进 行展示。
数据是分析的基础。我们在本地搭建了港股基础信息、行情序列、 交易数据、恒生行业分类、股票估值数据、资产负债、利润和现金 流量等数据表。港股数据质量相对于 A 股存在一定不足,还需进一 步完善。
对于行业分类,我们使用的是恒生一级行业分类:公用事业、原材 料业、地产建筑业、工业、消费品制造业、消费者服务业、电讯业、 综合企业、能源业、资讯科技业和金融业;风格包括市值、贝塔、 动量、波动率、非线性市值、BP、流动性、盈利、成长和杠杆等十 个因子。
更新时间:2023-06-01 14:28
咨询各位大神一个问题,如果已有持续盈利操盘手的交易数据,是否可以通过AI对数据进行分析,让AI程序识别出操盘手下单的策略,让这个Ai具备操盘手相似的交易能力,然后用程序代替人工交易,减轻人工看盘和下单的工作量。
更新时间:2023-06-01 02:13
请问在模拟交易时,标准化是怎么做的,是每一天都重新把所有数据做一次标准化吗?
你好,可以具体分享一下策略代码吗?我这边具体看看
如果是绑定实盘参数的数据,模拟交易是对每天的数据做标准化
以模版策略为例,如果要提交到模拟交易需要绑定实盘参数,这样策略每天都会以最新的日期来跑。
\
更新时间:2023-06-01 02:13
ps:非本人代码,来自网络开源分享 分享一篇,科赛网《〈 公开新闻预测A股行业板块动向〉〉比赛第三名的开源方案: 本次比赛使用的tushare免费数据,个人可以复现。
import datetime
import os
import sys
from multiprocessing.pool import Pool
import numpy as np
import pandas as pd
import talib
from loguru import logger
from sklearn.ensemble import RandomForestClassifier
更新时间:2022-11-20 03:34
尝试构建以真假序列识别为起点基于量价的主动投资研究框架
真假序列识别是检验市场有效性的有力工具。主动投资的核心是市场能否预测,如果市场无法预测,满足有效市场理论,主动投资就没有存在的价值。随机序列满足有效市场理论,无法预测。暂且抛开宏观、财务等数据,仅就交易数据看,如果人工智能算法无法识别真实量价序列和随机序列,那么弱有效市场假说可能成立;如果人工智能可以识别真假,那么可以进一步采用网络可视化技术挖掘模式,或采用遗传规划等算法来暴力挖掘特征。随后通过检验有效模式/特征、过拟合检验、风险控制等步骤,控制整体风险,实现完整的以真假序列识别为起点基于量价的主动投资研究流程。
更新时间:2021-11-26 07:30