数据获取思路:
1 用with , 将sql 分成三步 data_base,data_normalized ,以及features ,label 定义
2 data_base 获取初始字段,data_normalized 标准化, 以及pck_rank_by,获取横截面因子,m_leg 避免未来函数
模型fit
1 取 50天 训练数据,10 天测试数据
2 用线性回顾计算(xgboost 计算时间太长。。)
2 打印 r2
[https://bigquant.com/codesharev3/bc775119-ade8-4d25-ad2b-78ea8beee677]
更新时间:2025-08-12 11:41
一、作业结论:
本次作业采用了线性回归和xgboost两种模型:
年收益分别是:线性回归30%、xgboost 52%。
二、作业过程:
1、搭建模型的框架
(1)框架的模型是按照“滚动训练策略”搭建起来的
(感受:原本自己在结合AI 搭建的,后来因为处理各种各样的错误花了很多时间,所以就直接借用了)
(2)策略搭建后直接测试线性回归,然后替换框架内的模型测试xgboost模型
(感受:搭建框架后相对简单多了,就是替换对应模型的代码,更多的是需要等待模型的训练)
2、加入因子进行训练
(1)用的都是“滚动训练策略”,有些经过微改
(
更新时间:2025-08-11 12:00
按照本次作业要求,我根据笑宇老师的讲解及给的模版,借住AI编程,分了几个步骤,完成作业如下:
1、先根据之前老师的讲解,选择小市值因子、换手率因子等有效因子,构建策略因子组合,时间关系选了4个,后续可以用老师讲解的因子分析表替换可能的有效因子\n2、基于笑宇老师给的模版,运用AI完成线性回归策略,几经周折,跑通策略;\n3、将策略打包成模块,将可用的3个模型作为参数,构建多因子多模型策略,跑通;\n4、将策略输出用图表展示出来。前后整了3天,修改了10几个版本才成型,累得够呛,但最终跑通还是欣慰的\n\n学习心得:\n1、因子重要还是模型重要?\n我的理解是二者都很重要,但因子相对更重要。从
更新时间:2025-08-11 08:58
•因子更重要还是模型更重要?
我认为因子更重要,只有好的因子才能做出好的策略。
相同因子下不同模型的区别:
每次训练时间比较长,时间有限,只跑了线性回归的策略。而且收益也没有调的很好。
后续有时间再持续优化,并跑其他策略比较。
https://bigquant.com/codesharev3/e70d145b-3a0d-4f3b-bb4e-df2b8a905e12
\
更新时间:2025-08-10 15:07
regr_slope可以计算两个变量之间线性回归的斜率,例如收盘价和开盘价的斜率regr_slope(close,open,10), 但是为了计算一段时间的趋势是上涨还是下跌,需要计算close与交易日之间的回归斜率,请问怎么实现?相当于需要一个数组(1,2,3,4,5,6,7,8,9,10)跟连续10个交易日的收盘价做线性回归。但是用现有提供的函数我不知道怎么实现。请指教!
更新时间:2025-06-16 02:41
本文为旧版实现,仅供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors
https://bigquant.com/wiki/doc/dai-PLSbc1SbZX
[ht
更新时间:2025-04-15 07:19
ahsing+想问一下如何在bigquant环境下复现rsrs指标
rsrs指标
取前N日最高价与最低价
线性回归,找到beta值即,rsrs斜率指标值
可以通过平台因子表达式构建
https://www.bilibili.com/video/BV1rW4y177HB/?spm_id_from=333.999.0.0
[https://bigquant.com/exp
更新时间:2025-04-15 07:19
#逻辑回归
这也称为 logit 回归。逻辑回归是一种基于过去数据预测事件二元结果的分析方法。
当因变量是定性的并且取二进制值时,它被称为二分变量。
如果我们使用线性回归来预测这样的变量,它将产生 0 到 1 范围之外的值。此外,由于二分变量只能取两个值,残差不会围绕预测线呈正态分布。
Logistic 回归是一种非线性模型,它产生一条逻辑曲线,其中值限制为 0 和 1。
将此概率与阈值 0.5 进行比较,以决定将数据最终分类为一个类别。因此,如果一个类的概率大于 0.5,则将其标记为 1,否则标记为 0。
金融中逻辑回归的用例之一是它可以用来预测股票的表现。
#分位数回归
更新时间:2025-02-16 03:24
如何把我的因子中创建的因子,引入输入特征列表模块中
假设我们采用新的模版代替原来输入特征列表的部分?直接用“输入特征(DAI SQL)”代替,貌似报错了。或者有相关用新模版建立线性-回归算法策略的文档吗,这样就可以用自己的数据进行策略分析了。
 / m_lead(open, 1) - 1 > 0, 1, 0) AS label
但是特征label只有0,1两个值和特征进行训练,使用linearRegression是不是不合理,训练集中的label也只有两个值,那预测集的label结果能用么?
[https://bigquant.com/codesharev3/12ee99fc-3c41-46bd-bdb0-7d0993d0f845](https://bigquant.com/codeshar
更新时间:2024-11-25 01:45
回测图:
\
[https://bigquant.com/codeshare/ead656f5-c6a0-4a6d-9226-2ed3474d2a20](https://bigquant.com/codeshare/ead656f5-c6a0-4a6d-9226-2
更新时间:2024-08-09 10:35
更新时间:2024-06-12 05:48
本文内容已经过期,不再适合平台最新版本,请查看如下最新内容:
[https://bigquant.com/wiki/doc/6yep5yyw5py65zmo5a2m5lmg57o75yix5yig5lqr77yi5lia77yj5py65zmo5a2m5lmg5lul57un5lio57q5ocn5zue5b2s5qih5z6l-NIQe5FA4dS](https://bigquant.com/wiki/doc/6yep5yyw5py65zmo5a2m5lmg57o75yix5yig5lqr77yi5lia77yj5py65zmo5a2m5lmg5lul57un5li
更新时间:2024-05-20 06:55
1. 人工智能与机器学习的概念
人工智能(Artificial Intelligence,AI)是一门研究如何使计算机系统具备类似于人类智能的能力的领域
人工智能的子领域示例:
更新时间:2024-05-20 06:52
回归是一种挖掘因变量和自变量之间关系的技术。它经常出现在机器学习中,主要用于预测建模。在本系列的最后一部分中,我们将范围扩大到涵盖其他类型的回归分析及其在金融中的用途。
简单的线性回归允许我们研究两个连续变量之间的关系——一个自变量和一个因变量。
简单线性回归方程的一般形式如下:
其中 (β_{0}) 是截距,(β_{1}) 是斜率,(ϵ_{i}) 是误差项。在这个等
更新时间:2024-05-20 03:17
线性回归模型的最大特点就是简单高效,本文将对线性回归做详细介绍。
线性回归是衡量两个变量之间线性关系的一种建模技术。 如果我们有一个变量X和一个依赖变量X的变量Y,则线性回归可以确定哪个线性模型Y=α+βX能够最好地解释数据。 例如,我们考虑浦发银行和沪深300的价格指数, 我们想知道浦发银行如何随着沪深300的变化而变化,因此我们将对这两个标的的日收益率进行回归。
Python的statsmodels库具有内置的线性回归功能。 它将给出最能够拟合数据的一条的直线,并且能够帮助你决定该线性关系是否显著。 线性回归的输出还包括一些有关模
更新时间:2024-05-20 02:09
文档代码有更新, 请移步:
https://bigquant.com/wiki/doc/5oyh5a6a5lqk5pit5pel5yaf5ps255uy5lu355qe5pac546h6k6h566x-3vmHty3GJJ
laosha+如何计算前5-10个交易日收盘价的斜率。
发展到套利定价理论(APT),在数理统计方面就是从应用一元线性回归发展到应用多元线性回归。在实际运用中,**多元线性回归比
更新时间:2024-05-16 06:35
\
{{membership}}
https://bigquant.com/codeshare/66c560a3-335b-407c-aa2f-7053322141f4
\
更新时间:2024-04-25 07:41
回测图:
\
{{membership}}
[https://bigquant.com/codeshare/cd8638d7-21c0-4df4-8a29-e9f1cc227df0](https://bigquant.com/codeshare/cd8638
更新时间:2024-04-25 07:38
回测图:
\
{{membership}}
[https://bigquant.com/codeshare/3c3165db-d37e-4c8a-90f6-8af10855fb18](https://bigquant.com/codeshare/3c3
更新时间:2024-04-25 07:38
本文尝试在因子的框架体系中考察分析师覆盖度与股票未来收益之间的关系。提出对于传统的离散覆盖度指标,可通过线性回归方式剥离掉公司特征(如市值、流动性、前期股价表现)的影响,分解出独属于公司的特质覆盖度ATOT。覆盖度因子反映了分析师群体对其时间、精力和注意力的分配。
特质覆盖度对公司未来基本面具有较强的预测能力。特质覆盖度越高的公司,其未来盈利能力和营运有效性向好的可能性越大。从盈利能力来看,分析师倾向于将其研究精力分配给经营净现金流为正、净利润为正、同时相比于上一年同期净利润增加的公司。从营运有效性来看,分析师倾向
更新时间:2023-06-01 14:28
基差收敛因素的研究。排除分红影响后,我们发现基差收敛速度还受到当前合约年化基差、指数未来收益率以及当前全部合约基差期限结构的影响。
对冲策略的优化。我们对股指期货的基差收敛速度进行归因分析,并通过历史统计数据做出线性回归,量化了在不同市场条件下股指期货合约的基差收敛速 度,并据此做出期现对冲策略。
[/wiki/static/upload/34/3474a069-3410-4281-9dcf-dee3b9994283.pdf](/wiki/static/upload/34/3474a069-3410-4281-9dcf-dee3b9994283.
更新时间:2022-08-31 08:39
机器学习系列报告
本系列报告试图系统全面性的介绍各种不同的机器学习方法,并且结合具体的在投资研究领域应用实例、交易策略及code示例,说明其应用情景和实现方法。机器学习的方法可以分为以下几类:监督学习、无监督学习、深度学习及其他机器学习方法(例如强化学习),对应到具体的模型上数量则更是繁多,目前大部分机器学习模型并未广泛的应用在投研领域,因此本系列主要偏重于在投研领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主
监督学习模型之回归类模型及其应用
与普通线性回归不同,监督学习中的惩罚回归模型和非参数回归,可以分别用于处理输入变量中存在大量线性相关性关系
更新时间:2022-08-31 01:52