AI量化策略快速理解
由clearyf创建,最终由qxiao 被浏览 5788 用户
导语
在上一篇文章中,大家对新建一个AI可视化模板策略有了初步的认识,但看到策略中众多的模块与看似复杂的连线心中不免存在疑惑,没关系,本篇文章中,我们就来为大家完整介绍一个AI量化策略的组成结构以及涉及的基本概念,希望可以帮助大家对AI量化策略建立一个全面初步的认识。
基本概念
概念介绍
在认识一个人工智能量化投资策略之前,我们首先来了解几个基本概念:人工智能 、 量化投资和机器学习,大家可以通过快速浏览下面这两篇文章,对前两个概念进行初步了解。
机器学习被评为人工智能中最能体现人类智慧的技术,开发AI量化策略我们可以理解为将机器学习应用在量化投资领域。我们通过下面一张图来直观理解一下什么是机器学习:人类对新问题做出有效决策依靠的是过去积累的许多经验,并对经验进行利用,而对机器来说,“经验”以“数据”方式存在,机器从过去众多“数据”中总结规律,生产出模型,并用模型对新数据进行预测,这个过程就可理解为“机器学习”。
简单了解基本概念后,下面我们正式来学习如何搭建一个完整的人工智能量化策略,为了避免大家一上来就被一个个专业术语搞蒙,我们先通过一个生活中的样例,来类比AI量化策略的工作流程,帮助大家快速理解AI量化策略:
案例分析:老王挑瓜
一天,我们接到了隔壁老王求助:要我们帮他去瓜田从一堆西瓜中挑出其中的好瓜,并且需要在保证正确率的情况下独自完成。如果我们对此毫无经验,那我们应该如何应对呢?大家可以先思考一下再与下面步骤进行对比。
- 第一步:获取资源,资源划分。
- 为了可以独自完成这个任务,我们首先应想办法去学习寻找挑选好瓜的方法,先去找来一堆西瓜用来学习实验,积累挑瓜的经验;
- 考虑到后面也需要对学习成果进行一个检验,我们应将这些瓜进行合理分配,我们将其分为两堆,其中第一堆瓜用来练手总结规律,第二堆瓜来验证我们总结的规律,确保其是真实可靠,可用于实际生活中的。
- 第二步:明确目标,标记每只西瓜好坏
- 此次任务,我们的目标就是分辨西瓜好坏,在学习之前我们首先要清楚用来学习的第一堆瓜中每个西瓜的好坏情况,我们进行切瓜检验,将第一堆瓜全部切开,标记下每只瓜的好坏;
- 第三步:观察记录西瓜系列特征
- 我们的任务是在不切瓜的情况下判断出瓜的好坏,那么此时我们应对每个瓜进行一个细致的观察和思考,挑选出一些可能会影响瓜好坏的特征也可以称为属性,例如颜色、大小、产地、纹理、瓜蒂形态等;
- 第四步:将每个西瓜特征与好坏一一对应
- 了解每个西瓜的具备的特征及其好坏过后,我们需要将其一一对应,以便我们进一步发掘其中的规律;
- 第五步:总结规律,进行预测
- 现在我们获取了每个瓜的特征与其对应的好坏结果,现在我们需要通过归纳总结找到瓜的好坏与瓜的属性之间的关联,最后制定一套标准的判断模型,例如一个瓜具备青绿色、纹理整齐、瓜蒂卷曲等特征,那么这是一个好瓜的概率较大。就是我们的经验。
- 下一步我们需要对上述总结的“判断模型”进行进一步检验,此时对第二堆瓜进行预测,我们通过将第二堆瓜每个瓜的特征值套入“判断模型”中,来预测第二堆瓜的好坏。
- 第六步:检验
- 最后,在预测环节中我们得出了每个西瓜的预测结果,为了检验我们预测结果是否准确,我们需要切瓜来验证我们的预测值是否与真实情况相符。
这一过程我们可以表示为流程图:
AI量化策略构建流程
类比上述挑瓜过程,我们可以对AI量化策略流程进行分解:
- 第一步:确定数据(如股票池),划分训练集、测试集
- 首先我们应明确我们构建何种AI量化策略,如A股、港股还是期货等,确定数据后,接着我们把历史数据按时间顺序切分为两部分,类比于分瓜任务中的两堆瓜。
训练集: 第一部分的数据用来训练模型,类比第一堆瓜; 验证集: 第二部分的数据用来验证模型效果,类比第二堆瓜;
- 第二步:定目标:数据标注
- 其次我们要明确我们模型的训练目标,是预测股票收益率高低还是波动率高低,就好比是预测西瓜好坏还是年份;
- 在样例模板中,我们用5日收益率高低来定义股票的走势好坏等级,并将每只对应等级标记在每只股票上,类比于上述切瓜后记录每个瓜的好坏。
AI量化策略的目标(Label):人为定义的模型预测目标,例如未来N日收益率、未来N日波动率、未来N日的收益率排序等统计量,平台AI量化策略默认使用股票收益率作为目标。
AI量化策略的标注: 我们计算训练集数据所在时间阶段的每日目标值,比如按每日的未来N日收益率高低来定义股票的走势好坏等级,计算出每只股票未来N日收益率的好坏等级并标记在每只股票上。
- 第三步:找因子
- 选择构建可能影响目标的特征(量化策略中可称为因子),如模板策略中的return_5(5日收益)、return_10(10日收益)等,类比于瓜的产地、大小等特征。
AI量化策略的特征(features): 反映事物在某方面的表现或性质的事项,在AI量化策略中,特征可以是换手率、市盈率、KDJ技术指标等等
- 第四步:数据连接+缺失数据处理
- 将上述每只股票的标注数据与特征数据注意链接,以便下一步模型的学习与使用,类比于上述将每个西瓜特征与好坏一一对应;
- 第五步:模型训练+股票预测
- 我们通过“好坏等级”对股票进行标注,贴上标签,连同其所对应的特征值一起来构建训练模型,类比于上述我们获取每个瓜的特征与其对应的好坏结果,通过归纳总结找到瓜的好坏与瓜的属性之间的关联,总结出瓜的分类经验;
- 用验证集数据来检验训练前面构建好的模型,即检验模型根据验证集的特征数据预测出的目标值(股票走势好坏等级)是否准确。这步类比于鉴瓜任务中根据第一堆瓜总结的鉴瓜经验用第二堆西瓜的大小、颜色等特征数据来判断预测瓜的好坏。
- 第六步:回测
- 将验证集的预测结果放入历史真实数据中检测,类比于鉴瓜过程中根据第二堆瓜预测出瓜的好坏最后进行切瓜验证。
因此,AI量化策略的构建过程也可以用流程图的方式表达如下:
认识了机器学习流程和AI量化策略流程,就能够理解BigQuant平台的BigStudio实验工作流。BigStudio实验工作流是AI量化策略在BigStudio上的可视化展示。一个典型的AI可视化量化策略流程图如下:
简单划分:
具体而言:
- 策略流程图的左支是训练集特征数据(features)的抽取和训练集目标(label)的标注,标注结果和训练集特征数据通过合并和数据缺失值清洗处理,然后传给机器学习模型进行模型训练。
- 策略流程图的右支是测试集特征数据的抽取,通过缺失值清洗处理,然后传给机器学习模型进行预测,这里机器学习模型采用StockRanker模型,是一个排序模型,预测的结果是每日的股票排名。
- 这个排名列表即预测结果最后传给回测模块按一定的规则进行买卖模拟交易,进行检测。
以上就是一个AI量化策略构建大体流程,初学者可先尝试修改特征值来寻找有效因子,往往好的因子组合是策略成功的关键。
快来新建一个人工智能量化策略检测一下你的学习成果吧,在新建策略过程中,回想一下每一步操作对应我们上述的第几步,掌握后,你已经可以超越60%的传统交易员啦,快快行动起来!
小结: 本文介绍了AI量化策略的构建流程,并展示了在BigStudio环境下的一个可视化量化策略工作流,最后介绍了一些AI技术在量化领域的应用现状。这些AI技术的实现流程与上述模型训练流程大同小异,只是具体的模型算法和针对的特征数据结构各有特点,因此只要理解掌握AI量化策略流程后就可以针对所需的训练目标快速构建不同的特征数据和算法模型在BigQuant Studio环境下开展量化策略研究。
\