【重磅】AI Alphas(A股版)

alpha
alpha101
ai_alphas
alpha策略
stockranker
标签: #<Tag:0x00007f61dc16e7d0> #<Tag:0x00007f61dc16e690> #<Tag:0x00007f61dc16e550> #<Tag:0x00007f61dc16e410> #<Tag:0x00007f61dc16e2d0>

(小Q) #22

传统回归使用的是线性回归模型。本文是使用的机器学习监督模型,属于不同的算法。和线性回归一样,监督学习也是一种拟合算法,在拟合的过程中由于损失函数不同、求极值的方式不同等等,导致的最终算法是不一样的。
机器学习是一个宽广的海洋,建议多储备一些机器学习理论知识。
下文是一篇入门的好文章,建议阅读:什么是机器学习?


(ziyue170) #23

我是小白,想问一下,如果我想通过自己下载的股票数据计算各个因子,比如因子是当日换手率,那这个数怎么作为因子带入某个算法呢?是单只股票在一段时间所有的当日换手率作为一个行向量代表这只股票特征,然后把不同股票的向量合在一起吗? 还有那些什么什么排名的因子,排名是单个股票的不同时间来排,还是按照什么维度来排序呀? 我刚接触,不知道这问题是不是太幼稚了。。。


(大胡子) #24

我觉得每只股票每天的换手率应该作为一个观察,这和统计学是一样的。
排名的因子包括横截面的排名和时间序列的排名,这是两类不同的因子。


(ziyue170) #25

那文中的排名因子是哪一类呀?


(大胡子) #26

是横截面排名因子。如果是时间序列排名的因子,一般以rank_ts开头。


(macro) #27

AI,the future!


(ziyue170) #28

那升序百分比排名是什么意思呢,同一时间点对某因子排序,哪来的百分比呀,如果用排完了的名次值相互除,也没有意义呀?


(iQuant) #29

比如这个因子:

rank_market_cap_0	# 总市值,升序百分比排名

如果某个公司该因子比较小,说明其总市值比较小。如果某公司该因子为0.5,那么表明其因子(总市值)刚好处于全市场中位数。
具体因子相除,需要明白其为什么要除,除了是否有意义,例如:

rank_market_cap_0/group_mean(industry_sw_level1_0, rank_market_cap_0)

该因子表明经行业调整过后的总市值因子排序。
比如,一共三家公司,其总市值排序和行业平均排序因子分别如下:

  • A: 0.1, 0.1
  • B: 0.2, 0.1
  • C: 0.2, 0.5
    其中A,B为同一个行业,如果单看总市值排序的话,B和C是相等的,但是如果看经过行业调整过的总市值排序因子,
  • A: 1
  • B: 2
  • C: 0.4

此时C反而是最小的,这样更能反映出一家公司真正的因子状况。


(ghw) #30

我还是没明白呀。单因子市净率,又不是多因子,排名并不需要回归呀,市净率最小的排第一个,次小的排第二个,传统阿尔法就是这样,AI有什么不同呢?


(pivotll) #31

请问怎么复现这篇文章的研究,用附件的克隆出不来结果。


(iQuant) #32

附件3的结果可能不存在了。但你可以通过附件1和附件2 复现本文的分析。


(pivotll) #33

初学不太熟悉调不出来,请问怎么从 “本文使用的因子收益测试AI策略代码” 转为,统计需要使用的df并生成策略结果ID


(henhenhahi) #34

AI真的与量化投资结合起来还是很让人兴奋!


(Bella_Liu) #35

请问其中财务因子部分有日频的数据嘛?


(xuesir) #36

概览比较多,需要好好的消化一下


(小Q) #37

您好,有日频数据的。


(Bingle) #38

为什么我克隆了附件中的测试AI策略代码来验证结果,得不到研究报告中相接近的结果呢? 是我打开方式不正确吗? 比如我用单因子rank_pb_lf_0,40天持仓只能得到20%+的收益,而稳重缺高的多,其他的几个因子差距更大。


(iQuant) #39

您好,请确保策略的每个细节一致。
如果还有问题,可以单独把您的策略分享出来,我们帮你查看原因。


(Bingle) #40

你好,我是在文章里(https://community.bigquant.com/t/AI-AlphasA股版-因子测试AI策略代码示例/1003) 直接克隆策略,日期什么都不变,单因子rank_pb_lf_0也不变,只把40天持仓改为90天持仓,最后只能得到22%的年化收益,但是在这篇文章中测出来的结果是55%


(gengen_1988) #41

gtja_100 就是 “20日成交量标准差” 对吧?对应的就是 std(volume_0,20) 对吗?