梁举:《量化投资白皮书》关键数据及结论解读
由iquant创建,最终由qxiao 被浏览 109 用户
01前言”量化从看不见、看不起到看不懂”
大家下午好,我是梁举,来自宽邦科技。今天非常高兴在深圳与大家一起我们来共话量化。其实会议本来最开始定的是福田香格里拉40层,但报名太过踊跃,我们临时又把会议转到了三层,最多容纳300人的厅,场地扩大了一倍有多。
这也与市场高度相关,私募量化投资规模从百亿、千亿到上万亿的规模,也就短短几年的时间。量化行业发展也经历了从大家最开始看不见、看不起到看不懂。市场里面从个人到机构到监管可能大家对量化都有不同的理解:对于个人来说,量化是不是稳定的收益;对机构来说量化可能是提升研究的效率和能力的方法论;对监管来说,到底中国市场需不需要量化投资?对市场良性发展是否有所贡献?
市场也有一些共识:第一就是复杂性。相对其他一些投资方法,量化有很多的复杂性,包括技术、数据等等。其次是保密性,行业透明度没有那么高。
在这样的情况下,我们与华泰证券、朝阳永续、亚马逊云科技、金融阶一起联合发起了《2021年中国量化投资白皮书》,以期解构中间的复杂,提升行业透明度、可见性,同时我们也希望通过这样的方式,能提供交流平台,与业界更好地交流。
我们从去年12月8日到31日,发起问卷调查总回收数据235份,去除非机构数据48份,保留有效问卷187份。地理、薪酬、机构类型、资管规模、策略类型分类如PPT所示,较为充分反映了当前的量化行业现实,也让我们发现了一些新东西。
02关键结论:“行业逐步成熟 多维度提升”
1、经历萌芽、成长、动荡与成熟,中美量化之间存在35年量化发展时间差,但时至2020-2021年,国内海外机构已面临同场竞技。国内量化已经从发展初期到逐步成熟,具体表现在:1、市场总体规模增大,交易量占比提升;2、市场主体增多,行业集中度提升;3、关键能力提升,量化多种策略开花。4、管理精细化提升,从粗放到精益发展.
2、随着市场成熟度提升,行业竞争加剧,个体机构从粗犷型发展向精益型发展,在股权架构、投研方式、组织架构、投资策略上进行多方面探索,以期在资产管理规模、收益、稳定性之间获得动态平衡。尤其是在人事管理方面,除了通过大量人才抢夺,机构还通过组织结构优化进行更好的人才管理,以提升策略研发效率、深度,以及组别、策略间信息流动,更好激发创新。
3、机构间受类型、管理规模因素影响,掌握资源程度不同,面临不同的监管政策、不同的投资人诉求,量化市场认知、投资策略、人才发展差异巨大。市场共识认为当前量化技术排名为:外资机构、私募基金、券商自营资管、公募基金、银行保险。
4、调研显示:15.88%量化投研人员年薪百万以上,市场采用固定薪酬与PnL两种薪酬结构,PnL一般为15%-35%,顶级合伙人级别能达到50%。机构在投研组织方式上也尽力吸引、留住人才,近三成机构采用PM+平台混合式投研,即在规模化、集约化开发基础上,同时开展专户基金经理制。
5、许多投资机构策略发展路径为:高频起家逐渐降频,形成全频段覆盖,当前机构普遍采用多策略进行交易,但机构间布局重点略有差异,总体而言,量化套利、指数增强、市场中性、量化多头、高频策略是当前排名前五的主流策略。私募机构更为追求绝对收益,包括量化多头策略、量化套利策略、高频策略。
6、私募机构不可能三角:规模、收益、风险初见端倪。包括市场上显示的头部机构收益率同质化下跌,市场在规模可能到了瓶颈期,全年大量中性产品封盘,机构投资方式多元化发展的同时,追逐收益方式从绝对走向相对。在投研策略层面:人工智能、高频因子、另类数据在当前私募机构中渐成主流,通过多种方式获取Alpha。公募基金、保险资管、银行理财子公司则紧密拥抱市场Beta,基本面量化、fof或将成为趋势。
7、八成的量化人才认为自身专业知识、技能还需提升。“市场行业/风格轮动过快,难以随之快速调整”“难以生成具有Alpha的想法,资金容量有限”“因子:传统因子失效,难以形成有效策略”是当前投研实践遇到最难的三大问题,但与外资机构差异较大。
8、当前量化人才要求较高,国内985/211、海外QS100硕士是基本门槛,主要通过自学+实践的方式发展技能,仅三成人才能获得就业后的培训。知识、技能学习迫切程度与量化人才薪酬紧密相关,薪酬越高越迫切。高薪人才更关注形成领导力素质,如全球视野,普通薪酬人才更关注硬性技能,如人工智能。
9、当前八成机构已经涉及人工智能量化,内资主要应用于因子挖掘、生成及模型构建,外资应用则更为全面。机构集中于单点实验与局部落地阶段,17.99%的机构正在进行扩展复制,有能力完成AI应用的开发和上线,覆盖全流程,占总投资占比达到5%。树模型、集成学习是目前被市场普遍掌握的模型,一成左右的人才在神经网络、强化学习方面已经“非常擅长”。
10、海外另类数据日渐成熟,国内当前还处蓝海阶段,分析师情绪、网络舆情数据是被最广泛应用的数据,上市公司ESG数据异军突起,已经有三成以上机构应用于量化研究。三成以上机构已经使用高频因子,私募机构超过四成,25.33%的机构保持观望,其他机构在陆续开展研究。
\
03人才发展:“2.5万从业 当前最关注AI"
量化竞争说到底,人是核心,所以我们做的行业调研第一聚焦就在于人才的能力结构,数据调研发现,从公开数据可以推算目前量化人才约为25000多人,公募基金经理463人,私募基金经理大多数机构部愿意做披露,目前已披露的人数为684人,市场76%的人才都是硕士博士。
量化机构采用社招和校招两种方式进行人才吸纳。社招方面:数据显示全市场仅有34.76%通过公开招聘网站获得当前的工作岗位,许多量化从业人员通过校友背景、奥赛竞赛、策略研讨、沙龙培训、市场商务等系列活动形成了一定固定“圈子”,流动方式为同学/同行/朋友介绍以及外部行业猎头推荐成为了公开招聘的有益补充。
大家可能最为关注的还是年薪,薪酬福利是量化从业人员寻找新工作机会的首要诱因,远远高于寻找晋升机会或寻找技术大牛团队,而人才又是量化机构生产力,一个合理的薪酬机制是留住人才、发展人才的充分条件。
当前量化机构采取的薪酬结构有固定薪酬和PnL两种机制。量化从业者薪酬主要集中在30-100万区间,15.88%的从业者在年薪百万以上,200万以上年薪占比为2.65%。当然这也与机构类型、公司管理规模、城市区域紧密相关,普遍来看外资机构薪酬高于内资,上海地区薪酬高于其他地区,私募机构内部差异巨大。
在个人能力模型中,人工智能是量化从业者最为关注的方向之一,其次为全球视野、计算机基础、创新能力与洞察分析。数据表现出,相对硬性技能,一些软性技能、综合素质渐渐受较多关注,尤其是在卖方研究机构体现得更为明显。
创新能力与耐受力是市场招聘当中比较关注的两个素质。在量化行业,创新能力主要体现在策略更新、迭代,而耐受力主要体现在能长时间保持专注、研精究微,持续研发,以及策略出现较大回撤时,能顶住领导或客户的压力。
金融市场日新月异,交易工具推陈出新,量化从业者会遇到形形色色的诱惑与挑战。绝大部分从业者把专注量化放在职业发展方向首位,其次为晋升管理岗,但也会有很多因素驱使从业者离开原有机构,主要原因为:薪酬待遇、晋升机会以及文化包容性。
从人力资源层面看,数据显示:专业知识、技能还需提升,是当前量化从业者遇到的最普遍的问题,占比超过八成。因为量化总的来说是非常综合性的能力的要求,既要会写代码,同时要懂金融,还要会服务器运维等等。
其次人员配置不够、工作内容比较分散、没有专职化(占比43.32%),从数据到因子的挖掘到建模之类,很多都需要从业者自己一个人做,所以有很多零碎的时间上的工作。也有许多机构往平台化方向发展,让人才专注在自己专业化的一些方面。
在具体投研层面,市场风格轮动过快、因子失效、策略难以生成是量化从业人员遇到的最难的三个问题。而外资也许能代表下一阶段量化从业者将会面临的难题,当前外资排序为:日常大量工作在于重复代码,较少想法生成;市场行业风格轮动过快。
刚才我还听到旁边两位同行还在聊说:“因子其实已经比较拥挤了,常规因子大家可能挖得差不多了,那是不是有其他的方式可以去找一些新的因子,究竟来自于人脑还是来自于机器,其实大家都在想各种不同的方法。”有人把量化形容为挖矿,需要大量算力去计算解决很复杂的问题,求解的效率本身也是很关键,所以很多机构开始也在算力上做大量的投入,甚至花上千万上亿去构建自己的算力中心。除了有算力之外还需要环境,高效的环境搭建帮助内部团队,实现从策略研究整个过程更加平滑的处理。总的说来,机构面临很多挑战,当然同时也在催生新的解决方法来应对挑战。
04机构实践:百花齐放 初遇不可能三角
以史为鉴,可知兴替,回顾中美行业量化发展,1969年美国、2004年中国分别出现第一支量化基金,中间存在35年行业发展时间差,时至2020-2021年,国内海外机构已面临同场竞技。刚才我们谈到在这个过程中机构也在发生变化。第一个就是市场总体规模增大,交易量占比提升;第二个就是市场主体增多,行业集中度提升;第三个就是关键能力提升,量化多种策略开花。第四个就是管理精细化提升,从粗放到精益发展.
在此其间,我们发现市场对于量化的定义其实并不清晰,有一家机构就给我们聊到他们虽然以量化起家,但是现在主要做大宗套利,并不算量化,同时我们也可以看到各个数据机构对各类型的策略定义模糊,以至于数据差异巨大。
我们此次主要根据中国证券基金业协会2021年要求私募基金报送的《量化私募基金运行报表》分类,调研数据显示:当前机构都是以多策略为主,总体而言,量化套利、市场中性、指数增强、量化多头、高频策略是当前排名前五的主流策略。
在这里面,私募追求绝对alpha,就会以量化多头策略、量化套利策略、高频策略居多。公募基金择时以量化多头策略、指数增强策略、市场中性策略居多。
从收益来看,国泰君安资产托管部数据显示,2021年头部机构在各类量化策略上表现均不及肩部机构,如在量化选股方面,100亿+市场均值年化收益为7.76%,而肩部机构能达到19.61%。
这主要在于头部机构正在初遇不可能三角,在规模、收益与波动之间难以取得平衡。
因子是量化机构的核心机密之一,有近四分之一的受调研人拒绝透露当前机构储存因子数量,选择略过此题。在回答了此题的受调研者中,超过一半的机构因子数量控制在500 以内,也有6.52%的机构存储了1万以上的海量因子,三成常用因子在10个以内,37.97%的常用因子在50个以内。从左图可以看出来,整体呈现两头高、中间低的特征,体现出市场两种风格,一些机构精选深挖因子,而也有的机构采用机器学习进行海量因子挖掘,但实际落地的时候,目前看到这两种方式最后常用因子还是50个以内,海量因子挖掘出来之后也会也会再做优选。
人才组织方式影响着人才协作方式、质量与效率。当前机构普遍采用Silo System筒仓式也就是PM模式与Centralized Book平台式、混合式三种方式进行合作。
”筒仓式“也可称之为PM模式,由基金经理带领团队全程负责搭建环境、数据清洗、因子研究、开发策略、回测、模型修改,同时担任分析师、开发师和交易员。其特征是以PM为核心,在组织内部形成不同的小圈子。
”平台式“也可称之为流水线式,其特征是以流程为驱动,数据工程师做大量数据研究在平台构建新型数据,研究员在数据之上挖掘新的因子、构建策略,投资经理构建产品服务用户,最终形成公司的产品。
“混合式”混合了筒仓式与平台式,但并非两者的过渡阶段。许多公司已经形成稳定平台之后,为吸纳更多具备独立策略开发能力优秀人才,而自然形成的投研组织形式。在原有公司投研体系完善、员工成长、对外募资、员工收益进行有益补充。
当前调研数据显示:四成以上的机构采用筒仓式,两成机构采用平台式,近三成机构采用混合式开展投研组织。在分类别上,中小机构青睐筒仓式组织结构,大型机构团队当中采用平台式比例更高以达到集约开发的目的。
05趋势前沿:从人的总结到机器变助手
大家也会关注未来。刚才说1万亿规模市场已经初现瓶颈,更进一步我们未来怎么去做?我们调研发现:人工智能的应用、基本面量化、高频数据及高频因子是市场最关注的三个方向。我们研究前30私募机构的官网以及人才招聘结构发现,至2021年,前30家百亿私募量化机构中29家已经在布局人工智能。
这也与我们的调研数据吻合,传统量化机构,人依赖于规则、理论做模型,AI而基于大量的数据,机器可以挖掘更大规模的数据,形成非线性的结构,调研数据显示:当前8成以上已经开始尝试人工智能量化,主要应用于因子及模型阶段,其中62.57%的机构应用于因子生成,56.15%应用于模型构建,这或许源于模型具有上限天花板,而因子挖掘效果立竿见影。因子挖掘从以前靠人去总结方式,变成人去找机器作为助手,找一些有效果、有启发性的东西,找到新的idea,然后人在机器之上再进一步去构建,增强透明度和解释性。模型构建方面,以前是做的是偏线性的,现在借用深度学习或者是更复杂的结构,挖掘一些更深度的端到端的模型。
交易执行及风险管理应用面则相对较小。在机构分类上,外资机构的使用更为全面,除了交易执行之外,各环节的使用率在50%以上。尤其在资产组合管理、交易执行及风险管理上,大大超过内资机构。
人工智能不仅体现在算法层面,技术本身是一个系统工程,问卷对机构AI成熟度进行了调研,机构从战略、技术积累、算法、算力、人力方面都在做多种投入,数据显示,机构集中与单点实验与局部落地阶段,已有11.11%的机构在进行规模落地,规模化落地AI场景>10个、在整个投资占比中达到30%,但也有部分机构尚未实现端到端一次性覆盖。白皮书里面有具体的一些数据,我们这边暂时不展开讲。
在具体算法层面,同样以1-7进行打分,1为无研究,7为非常擅长,量化从业人员由浅入深,使用最熟悉的机器学习/人工智能量化模型为树模型、集成学习,三成左右已经完全熟练应用。神经网络与强化学习虽然应用程度还不够高,这或许源于起步较高、上手慢,细节过多,同时高度依赖于数据量。
宽邦也在过去一年做过许多基础的模型,像stockranker、deep alpha等,但实际上来说,机构里面其实应用的要比更丰富更复杂。
2019年JPMorgan研报专门梳理了海外另类数据的实战以及各信源,把所有另类数据分为个人活动、公司业务以及传感器数据三大类别9大子项,近1000家厂商,传感器数据包括农业卫星、海上卫星、金融采矿卫星、停车场卫星、能源卫星图像等等,形成了非常庞杂的系统。
国内另类数据作为投资应用发轫更晚,相距海外业已成熟的市场应用,当前属于蓝海期,市场尚未形成统一认知。有的参与者认为另类数据由于使用面不广,有其限制性因素才被称之为另类数据:一方面当前另类数据厂商体量较小,相对分散,机构采购验证麻烦。另外一方面非结构化数据清洗难度大,机构使用、验证困难。
本次问卷调研数据显示,当前两成机构已经使用另类数据,四成机构正开展积极研究。在细分类别上,分析师情绪指标与网络舆情指标被使用/研究最多,而ESG数据虽然才刚刚兴起,但是也饱受关注。
2015年中股灾之后,股指期货贴水严重,中性策略遭遇寒冬。部分量化机构转向指数增强,一部分机构转向基于量价为主的高频策略,2019年后大量的高频策略产品进入市场。
高频研究以前是偏速度,希望尽量降低延迟,一般而言,机构不对外披露高频交易速度,一方面交易速度直接影响策略表现,另外一方面交易环节、速度计算较为复杂。影响速度的因素主要包括有:软件/硬件、部署方式、有机器学习/无机器学习、交易标的等,交易速度峰值能达800纳秒左右。
现在除了套利之外,市场谈到“高频”场景中,还有一种场景是市场加工Level2\3高频行情数据为高频因子,包括分钟K线、委托队列、盘口快照、逐笔委托、逐笔成交等,以期能更为深度刻画投资者意愿,产生比普通因子好的Alpha,同时增加数据量对抗人工智能的过拟合。
问卷调研显示:当前三成机构已使用高频因子,接近35%的机构保持积极研究。83%的卖方机构保持研究,私募基金的使用程度最高,达到36.87%,1亿以下机构使用较少。仅为14.29%。与量化从业人员的薪酬也相关度极高,薪酬越高的人越容易使用/研究高频因子。
06关于我们:聚焦AI在金融场景落地
以上是我为大家分享的关键结论及数据,未来希望我们也可以继续与大家一起共同探索研究,包括2022年、2023年的量化白皮书,能与更多的合作伙伴参与,让这个行业变得更好。
最后简单介绍一下宽邦科技,我们其实是一家AI平台和技术的提供商,聚焦服务金融行业,在产品和服务方面,我们专注于技术实现AI在金融和投资场景的落地,包括平台、算法、数据等。产品主要有BigAI与BigQuant两类,BigAI是企业级的全栈人工智能平台,服务银行券商之类的大型机构,构建其AI的基础站。BigQuant是低门槛端到端的 AI的平台,这个平台更多是覆盖量化投研场景,从数据到交易整个全流程,目前也是主要在服务银行、券商、基金、保险资管等场景。同时宽邦(bigquant.com)我们也是致力于去构建量化投资者的社区,目前平台有超10万的社区开发者,大家深度参与平台开发,包括算法、数据的优化等。我们核心团队主要是来自微软亚洲研究院,是AI+金融的跨界融合团队。目前我们在北京、上海、深圳、成都都有设岗,我们希望通过构建开放的生态,在云计算、金融数据等各个方面,达成多类型合作。
最后再次感谢大家来参加今天这个活动,希望大家有所得。
\