[量化学院-新手专区]AI量化策略快速理解

由undefined创建，最终由undefined更新于2021-02-25 09:35 被浏览 19 用户

导语：在上一篇文章中，大家对新建一个AI可视化模板策略有了初步的认识，但看到策略中众多的模块与看似复杂的连线心中不免存在疑惑，没关系，本篇文章中，我们就来为大家完整介绍一个AI量化策略的组成结构以及涉及的基本概念，希望可以帮助大家对AI量化策略建立一个全面初步的认识。

在认识一个人工智能量化投资策略之前，我们首先来了解几个基本概念：人工智能 ， 量化投资和机器学习，大家可以通过快速浏览下面这两篇文章，对前两个概念进行初步了解。

什么是人工智能？ 981
什么是量化投资？ 929

机器学习被称为人工智能中最能体现人类智慧的技术，开发AI模拟策略我们可以理解为将机器学习应用在转化投资领域。我们通过一张图来直观了解一下什么是机器学习：人类对新问题采取有效的决策应对措施是过去积累的很多经验，经常对经验进行利用，而对机器而言，“经验”以“数据”方式存在，机器从过去大量“数据”中总结规律，生产出模型，并用模型对新数据进行预测，这个过程就可理解为“机器学习”。

51abca3be25acad58fef7019468e67f5.jpg1240x597 61.7 KB

简单了解基本概念后，下面我们正式来学习如何整合一个完整的人工智能量化策略，避免避免大家一上来就被一个专业术语搞蒙，我们先通过一个生活中的样例，来类比AI量化策略的工作流程，帮助大家快速理解AI量化策略：

帮隔壁老王挑瓜

一天，我们接到了隔壁老王求助：要我们帮他去瓜田从一堆西瓜中挑出其中的好瓜，并且需要在保证正确率的情况下独自完成。应该如何应对呢？大家可以先思考一下再与以下步骤进行比较。

初步：获取资源，资源划分。
- 为了可以独自完成这个任务，我们首先应想办法去学习寻找挑选好瓜的方法，先去找来一堆西瓜用来学习实验，积累挑瓜的经验；
- 考虑到后面也需要对学习成果进行一个检验，我们应该将这些瓜进行合理分配，我们将其分为两堆，其中第一堆瓜使用练习手进行归纳纳常规，第二堆瓜来验证我们总结的规则，确保其是真实可靠，可用于实际生活中的。
第二步：明确目标，标记每只西瓜好坏
- 这项任务，我们的目标就是分辨西瓜好坏，在学习之前我们首先要清楚使用学习的第一堆瓜中每个西瓜的好坏情况，我们进行切瓜检验，将第一堆瓜全部切开，标记下每只瓜的好坏；
第三步：观察记录西瓜系列特征
- 我们的任务是在不切瓜的情况下判断出瓜的好坏，那么此时我们应对每个瓜进行一个细致的观察和思考，挑选出一些可能会影响瓜好坏的特征也可以称为属性，例如颜色，大小，产地，纹理，瓜蒂形态等；
第四步：将每个西瓜特征与好坏一一对应
- 了解每个西瓜的特征的特征及其好坏过后，我们需要将其一一对应，刹车我们进一步发掘其中的规律；
第五步：总结规律，进行预测
- 现在我们获取了每个瓜的特征对应的好坏结果，现在我们需要通过归纳总结找到瓜的好坏与瓜的属性之间的关联，最后制定一套标准的判断模型，例如一个瓜可能青绿色，纹理整齐，瓜蒂胫骨等特征，那么这是一个好瓜的概率突破。就是我们的经验。
- 接下来我们需要对上述总结的“判断模型”进行进一步检验，然后对第二堆瓜进行预测，我们将将第二堆瓜每个瓜的特征值套入“判断模型”中，来预测第二堆瓜的好坏。
第六步：检验
- 最后，在预测过渡中我们得到了每个西瓜的预测结果，刹车检验我们预测结果是否正确，我们需要切瓜来验证我们的预测值是否与真实情况相符。

这一过程我们可以表示为流程图：

image.jpg1541x1189 225 KB

AI量化策略编制流程

类比上述挑瓜过程，我们可以对AI量化策略流程进行分解：

初步：确定数据（如股票池），划分训练集，测试集
- 首先我们应明确我们逐步改进AI改进策略，如A股，港股还是期货等，确定数据后，然后我们把历史数据按时间顺序切成两部分，类比于分瓜任务中的两堆瓜。

**训练集：**第一部分的数据使用训练模型，类比第一堆瓜； \n 验证集： 第二部分的数据使用验证模型效果，类比第二堆瓜；

第二步：定目标：数据标注
- 实际上我们要明确我们模型的训练目标，是预测股票收益率高低还是变化率高低，就好比是预测西瓜好坏还是年份；
- 在样例模板中，我们用5日收益率高低来定义股票的走势好坏等级，进入每只对应等级标记在每只股票上，类比于上述切瓜后记录每个瓜的好坏。

AI量化策略的目标（Label）：人为定义的模型预测目标，例如未来N日收益率，未来N日变化率，未来N日的收益率排序等统计量，平台AI量化策略替代使用股票收益率作为目标。

AI量化策略的标注： 我们计算训练集数据所在的时间阶段的每日目标值，按按每日的未来N日收益率高低来定义股票的走势好坏等级，计算出每只股票未来N日收益率的好坏等级并标记在每只股票上。

第三步：找因子
- 选择制定可能的目标指标的特征（量化策略中可称为因子），如模板策略中的return_5（5日收益），return_10（10日收益）等，类比于瓜的产地，大小等特征。

AI量化策略的特征（特征）： 反映事物在某方面的表现或性质的事项，在AI量化策略中，特征可以是换手率，市盈率，KDJ技术指标等等

第四步：数据连接+缺失数据处理
- 将上述每只股票的标注数据与特征数据注意链接，分解模型的学习与使用，类比于上述将每个西瓜特征与好坏一一对应；
第五步：模型训练+股票预测
- 我们通过“好坏等级”对股票进行标注，粘贴上标签，并与此相关的对应的特征值一起来构建训练模型，类比于上述我们获取每个瓜的特征对应对应的好坏结果，通过归纳总结找到瓜的好坏与瓜的属性之间的关联，总结出瓜的分类经验；
- 用验证集数据来检验训练前面建立好的模型，即检验模型根据验证集的特征数据预测出的目标值（股票走势好坏等级）是否正确。这步类比于鉴瓜任务中根据第一堆瓜总结的鉴瓜经验用第二堆西瓜的大小，颜色等特征数据来判断预测瓜的好坏。
第六步：回测
- 将验证集的预测结果放入历史真实数据中检测，类比于鉴瓜过程中根据第二堆瓜预测出瓜的好坏最后进行切瓜验证。

因此，AI量化策略的重建过程也可以用流程图的方式表达如下：

image.jpg1541x1189 167 KB

认识了机器学习流程和AI量化策略流程，就能够理解BigQuant平台的BigStudio实验工作流。BigStudio实验工作流是AI量化策略在BigStudio上的可视化展示。一个典型的AI可视化量化策略流程图如下：

可视化.png1106x761 52.7 KB

简单划分：

具体而言：

策略流程图的左支是训练集特征数据（特征）的移除和训练集目标（标签）的标注，标注结果和训练集特征数据通过合并和数据缺失值清洗处理，然后传给机器学习模型进行模型训练。
策略流程图的右支是测试集特征数据的可删除，通过缺失值清洗处理，然后传给机器学习模型进行预测，这里机器学习模型采用StockRanker模型，是一个排序模型，预测的结果是每日的股票排名。
这个排名列表即预测结果最后传给回测模块按一定的规则进行买卖模拟交易，进行检测。

以上就是一个AI量化策略重建大体流程，初学者可先尝试修改特征值来寻找有效因子，往往好的因子组合是策略成功的关键。

快来新建一个人工智能量化策略检测一下你的学习成果吧，在新建策略过程中，回想一下每一步操作对应我们上述的第几步，掌握后，你已经可以超越60％的传统交易员啦，快快行动起来！

小结：本文介绍了AI量化策略的整合流程，并展示了在BigStudio环境下的一个可视化量化策略工作流，最后介绍了一些AI技术在转换领域的应用现状。这些AI技术的实现流程与上述模型训练流程大同小异，只是具体的模型算法和针对的特征数据结构各有特色，因此只要了解掌握AI模拟策略流程后就可以针对所需的训练目标快速构建不同的特征数据和算法模型在BigQuant Studio环境下进行量化策略研究。

   本文由BigQuant宽客学院推出，版权归BigQuant所有，转载请注明出处。

文档

量化交易入门书籍-Trading and Exchanges : market microstructure for practitioners 03