当ai叩击交易大门

人工智能
深度学习
标签: #<Tag:0x00007f61f3ca4d18> #<Tag:0x00007f61f3ca4a98>

(小马哥) #1

“从纯粹的主观交易到AI交易之间的路比想象中崎岖很多,如果把主观交易比作冷兵器时代,那么包含学习、决策、执行、风控的全过程的AI交易差不多已经进入了核武器时代。”

从灯下黑到无极限

前不久瑞士达沃斯年会上,谷歌的创始人谢尔盖布林说:他和其他的90年代计算科学家一样,曾不相信AI能真的实现。所以当初Google在人工智能方面的工作几乎完全被他忽略了,完全没有想到若干年后的现在,这个被称作Google Brain的AI项目渗透到了搜索、图片、广告投放等几乎全部的Google核心业务的基础设施中。以至于他现在都很难想象AI应用范围的边界和极限在哪里,觉得若干年前的自己就像是一个勒德分子(Luddite)。

真正震撼世界的是Alpha Go,这个人工智能控制的围棋大脑在击败李世石之后又在2017年年初的野狐网络快棋赛中化名Master连续60场横扫当今人类围棋领域的顶尖高手,其中包括聂卫平、古力和柯洁。

很短的时间内,AI激发了很多非计算机专业领域的热情,这里面包括狂热逐利的资本,大家投入了前所未有的激情和兴趣探讨智能交易的可行性,并纷纷投入其中想要拔得头筹。

从事量化交易基础设施开发的Fintech公司们想必突然有种和谢尔盖布林说的那位叫Jeff Dean的人工智能专家一样的感觉,早年跟老板说AI画了一幅猫的图画,老板无动于衷,而今忽如一夜春风来,从无人关注到成为大红大紫的网红竟然在如此短暂的时间里发生了。

从记录到挖掘,一眼万年

同样是人类编写的计算机程序,在做数码相片除红眼和做录音背景噪声消除的时候,程序的实现方法和思路是完全不一样的。但你可能很难相信,不论是下围棋还是下象棋、甚至是做期货,深度学习用到的程序核心算法是类似的标准算法,差异体现在数据整理能力、知识来源、知识挖掘的效率上。

深度学习AI的本质是用计算机对人类大脑的模拟,人类大脑的思考力是日积月累经过很多事件的冲刷洗礼之后沉淀下来的,涉及到对原始信息的记录,以及针对原始信息的规律发现和推演,记录->推理->再记录,这就是一个学习的简单过程。

从计算机问世到现在几十年的绝大多数时间里,计算机只是做好了对原始信息的记录(文字、图片、声音)和查找(搜索引擎就是干这个的)。至于其中的知识如何被表达、提取,那是近几年的事情,也就是人类能掌握的计算能力、存储能力突破某个阈值之后计算机才有条件记录足够多的原始信息并在可以接受的时间内完成学习。

知识挖掘过程在深度学习中被称作“训练”。AI跟人类比起来,并不具备适应性极强的输入输出设备(或者说这种输入输出的AI还没有达到可以广泛应用的程度),例如AI现在还没法顺畅地理解自然语言,所以没有办法通过读书来完成对人类过往文明中蕴含的知识的挖掘。

因此,训练过程中用到的数据一般都是被整理过的、高度结构化数据。例如,我们通过一篇关于地缘政治的新闻判断这篇新闻作者想要表达对油价多空的情绪就是这篇新闻中蕴含的知识,这篇新闻就是一种非结构化的数据,计算机想要挖掘出新闻中的知识,就需要对新闻进行预处理(例如分词、词频统计、语法标注),把预处理的结果作为计算机能消化得了的原始数据进行喂食,然后使用通用的算法对这些数据进行记录和推理。

这一点决定了当下的AI仅类似于计算机问世初期的专用大型机,只能学一种技能,是一种初级人工生命,很难具备人类大脑知识的广泛性。更甚,这个阶段的AI只是一种软件而不是带有耳朵、眼睛、四肢、躯干的完整个体,仅仅相当于是一个大脑,大脑能针对外部条件变化发出一些决策指令,随着学习的展开,这些指令的准确性和实用价值会越来越高。

深度学习之于人脑的革命性在于训练时能挖掘到的知识量以及学习速度将会有质的飞越,Alpha Go毫无疑问地学习过人类有史以来的绝大多数棋局和棋谱,在此基础上,它还在人类大脑所难以企及的深度进行了推演和扩展。

AI交易的渐进之路

从纯粹的主观交易到AI交易之间的路比想象中崎岖很多,如果把主观交易比作冷兵器时代,那么包含学习、决策、执行、风控的全过程的AI交易差不多已经进入了核武器时代。在主观交易和AI交易之间,隔着一个叫做量化交易的时代,有点像热兵器时代,目前金融世界还停留在这里。

市场有一种神奇的自我修复能力,任何规律只要被发现,并用以牟利,那么这种机会就会变得越来越难赚到钱,直到规律失效,此间市场给规律发现者的利润就是市场支付的漏洞修复成本。时间足够长,市场一定会消化掉某种可以牟利的规律,这一点叫市场消化效应。

另一方面,当模型的决策指令发出来的时候,你并没有办法保证这个指令能按照理想的价格和成本完成执行,所以你不能保证实盘中某种策略的利润和理论测试中的一致(通常都会比理论测试的利润要低很多),这一点叫执行成本效应。

上述两方面,是量化交易和AI交易同时需要面对的问题。当下的量化交易基金、投行解决这个问题的方法是:建设强大的执行和风控信息化基础设施,选择多种策略,分散资金的风险,依赖人类定期剔除无效的策略。

AI交易是量化交易的升级版,优秀的量化交易系统加上模型发现引擎就能构成AI交易的系统。

主观交易的方法论是:找到能赚钱的人,管好他们带来的风险。

量化交易的方法论是:人来发现知识、生成模型,软件系统负责根据模型完成计算,发出指令、执行指令、按照人类编写的条件和算法对盘位进行风控。

AI交易的方法论是:持续不断地找到足够多的原始数据,用足够有效的数据清洗和结构化的方法,让存储能力足够强大、运算能力足够强大的专业软件系统学习其中的知识,不断重复这个过程。基于这些知识,有数以万计的交易模型被持续迭代地生成。基于类似的知识,独立于交易模型的生成,有数以万计的风控模型被持续迭代地生成。交易模型和风控模型的发现引擎对接量化交易系统,就能构成AI交易系统。AI交易完全依赖这套系统完成发现模型、产生指令、执行指令、用风控模型进行风控,自动淘汰被市场消化的模型。

主观交易时代,人的能力将会决定交易成败;量化交易时代,人的能力和系统的功能对交易成败的影响各占一半;而AI交易时代,几乎全部依赖系统的软实力决定交易成败。

云计算是土,大数据是种子,AI是花朵

这张图带给我们的信息是:随着训练数据集的扩大,深度学习AI的进步几乎是没有天花板的,传统的机器学习算法在数据量较小的时候训练出来的AI决策力高于深度学习AI。

其实在数据量比较小的时候,不论是传统机器学习算法还是深度学习算法,都是打不过人类的。所以搜索空间较小的五子棋、象棋程序很早之前就能达到战胜人类的水平,可偏偏围棋不行。这其中的奥妙在于,围棋的搜索空间太大了,计算机没有能力在有限的时间里枚举围棋棋局后面所有的情况(五子棋和象棋可以),进而做出最有利于自己的决策。Alpha Go也没有能力枚举所有的情况,但他另辟蹊径,从大量的对弈和棋谱数据中学到了很多可能很难用人类语言描述的复杂规律,并用这些规律战胜了人类。

围棋尚且如此,更何况杂乱无章乃至于混沌的金融交易领域?

换句话说,玩深度学习,数据量小了、学习的浅了没有意义,这样是战胜不了人类的。所以,数据量的大小、计算能力的强弱决定了AI交易是否有意义。为什么Alpha Go能被Google发明而不是被微软或者亚马逊发明,核心的原因在于Google拥有这个星球最强大的云计算和大数据软件平台。云计算+大数据构成的软件平台是策略发现的核心,持续不断的扩充训练数据集、改善计算和学习的软环境是保持AI交易盈利能力的核心、核心、核心(重要的事说三遍)。

好有一比:云计算是土壤、大数据是种子、AI是盛放的花朵。

道理好说,但这星球这么多年来,也就出了一家谷歌。同样是干搜索,百度搜出来的结果就没法和谷歌比,这很难说是百度工程师智商不如谷歌工程师造成的,这种差异折射出来的是一种长期的优势:系统的先进性带来的差异。

交易持续盈利,依赖的一定是长期优势。举个最简单的例子,所谓长期优势中最好理解的就是规模优势,简单粗暴但非常有效:你的对手扛不住深幅波动,爆仓了,你钱多扛下来了,就成了最大的赢家。

谷歌和百度的对比已经很明白了,信息时代的长期优势不是意识形态、不是行政壁垒、而是系统的先进性。规模优势、人才优势都建立在一开始的系统先进性基础之上。这大概是先发优势转化为长期优势的典型例子吧。

AI交易时代更是如此,针对软件系统持续不断的、持续不断的、持续不断的(重要的事情说三遍)投入换来的系统先进性将构成长期优势中90%或者更多的内容。


[量化学堂-新手专区]什么是人工智能?