近期热点

2021上半年金融工程研报暗含量化5大趋势

由small_q创建,最终由small_q 被浏览 277 用户

分析师研报也是行业发展风向标,小Q援引惠博平台及“量化投资与机器学习”回顾2021年1月1日~2021年7月29日热门金融研报,总结量化行业发展趋势,做出如下5个方向猜想:

由于基础因子广为人知,在此基础上进行因子挖掘的收益提升空间相对有限。而且日频数据由于本身的数据量和信息量有限,过度挖掘会增大过拟合的风险。以高频价量数据为基础的因子开发在当下具有更大的收益提升空间。与低频因子相比,高频数据在用于量化投资中存在一定优势。 正如梁举《AI如何赋能投资?这是宽邦科技的答案》中所说:“做 AI在投资领域应用,第一要有数据,投资早期基于消息和少量数据就可以做投资决策。之后量化投资,用日级别量价数据也可以取得不错的效果,获得阿尔法。现在这类因子已经比较拥挤,部分领先机构开始采用low level的高频数据,这些高频数据不止应用于高频交易,同时还可以加工成新的因子,挖掘出在低频数据上挖掘不到的新因子。未来2~3年,这种方式可能仍然有不错的效果,但也会逐步回归到平均收益。” 招商证券《轻装上阵,高频因子的应用》使用样本个股在观测窗口期内分钟级别的数据,计算样本个股的VPIN值做“高频数据,低频信号”。月末交易日取月度均值,作为月频因子暴露度。

广发证券《深度学习框架下高频数据因子挖掘》同样在预先将高频信息处理成日频因子之后,在日频因子基础上,用深层全连接神经网络模型提取股票特征。对特征进行分析,筛选合适的选股因子。为了验证特征的选股能力,本报告提出了一种基于回归的特征组合方法,进行选股测试。特征组合算法通过截面回归产生回归系数,实时性高,保持对市场特点的紧密跟随。

与低频因子相比,高频数据在用于量化投资中存在一定优势,而高频数据挖掘因子的难点在于数据维度大、噪声高。

机器学习方法擅长从数据中寻找规律和特征,是高频数据因子挖掘的有力工具。在使用神经网络、深度学习、提升树等复杂预测模型时,预测效果有一定提升,体现在策略信息比率和最大回撤的改善。但挑战也同时存在,2020年2季度,AQR发表了论文《CanMachines“Learn”Finance?》,文中列举了机器学习在金融投资领域面临的挑战:(1)模型的可解释性;(2)金融市场的低信噪比;(3)市场始终在演化。

随着AI量化正被逐渐广泛地应用于市场,广发证券、国泰君安、华泰证券都在大量系列性地研究人工智能在量化投资中的应用,共有6篇研报上榜。从内容上看,除了介绍具体算法介绍之外,分析师也在挑战机器学习的灵活性及风格轮动时的预测性。

华泰证券《因子观点融入机器学习》认为,机器学习模型的复杂程度大幅提升,模型对于历史数据的拟合能力变强,但灵活性下降。为了提升模型的灵活性,研报改进了sklearn的随机森林模型,可指定优先分裂的因子来分裂决策树,从而人为增大优先因子的重要性。

广发证券《风险中性的深度学习选股策略》则是尝试对股票样本进行风险中性化,减小风险因子轮动和行业轮动对模型训练和预测的影响。

从热门研报数量来看,CTA与市场脉动一脉相承,正在退温,仅仅国信证券与天风证券2篇研报上榜。 今年以来CTA表现整体不如去年,且与去年CTA的百花齐放相比,今年CTA产品业绩的分化特征也是很明显的,比较考验管理人的alpha能力。造成这一现象的根本原因在于市场环境发生了变化。去年收益表现突出的,更多是中长周期趋势策略的产品,因为它们在承受更大的波动时,面对明显的趋势性行情,会有更大的弹性。而今年以来,虽然1-4月商品依旧走出单边上行的趋势性行情,但5月以来出现了大幅度的回调,中长周期趋势策略就基本都面临了阶段性的回调。 天风证券《趋势策略在时间序列和横截面上的应用》研究了本文以动量策略、双均线策略和通道突破策略三大经典的趋势策略为例,从时间序列和横截面两个维度重点讨论策略构建及实际应用过程中的细节问题。 国信证券《基于开盘动量效应的股指期货交易策略》通过对股指期货开盘动量效应的研究发现,股指期货长期存在显著的开盘动量效应。如果开盘价,最低价以及收盘价随K 线依次上升,那么可以判定为上涨(多头)趋势。如果开盘价,最高价以及收盘价随K 线依次下降,那么可以判定为下跌(空头)趋势。

主流行业轮动研究分三个维度:宏观周期、中观景气和微观统计。华泰证券《工业社会的秩序》《A股择时之情绪面指标》中金公司《如何从微观结构探析行业轮动信息》分别都对此进行了研究,另外机构抱团仍然是今年的主题。 开源证券《兼广顾深,公募基金抱团现象研究》招商证券《写在酒宴正酣时:若机构抱团瓦解,该何去何从?》则是对机构抱团分别进行了探讨。 《工业社会的秩序》探讨认为从肉眼观测到结构化解析的跨越:利用频谱分析、统计检验、阵列信号处理等工具,实现了周期测度从肉眼观测到结构化解析的跨越。金融经济系统存在42个月、100个月和200个月三个较为明显且稳定存在的周期,这一结论与经典周期研究中的基钦周期、朱格拉周期和库兹涅茨周期相互印证。 中金公司《如何从微观结构探析行业轮动信息》采用大类内部细分指标等权的方式分别构建财务基本面、分析师行为、动量三大类指标;并按一定权重将三大类指标加总成最终综合轮动指标。

2018年底,国际指数巨头MSCI公布了一个很多人没有太在意的决定:下调A股上市的医药“巨头”康美药业的“ESG评级”,从B调降至CCC。彼时,距离康美爆出300亿元天价造假并被“戴帽”仅有大概半年时间。 据小Q从上市公司ESG报告编制的业内朋友处获悉,MSCI的ESG指数含1000+细则,其中引起此次大调的在于,MSCI从舆情数据中当中的供应商数据获知康美药业财务造假。 越来越多的投资者开始考虑将另类数据融入现有的投资方法,以此来发现更具吸引力的投资机会。ESG(上市公司环境、社会和公司治理ESG)对于主观投资来说,比如富达国际、荷兰很多时候表现为负面清单,目前来看,已经有投资人列入到量化投资。 ESG某些因子和传统量价、基本面数据不尽相同,招商证券《以整合法量化ESG投资》展示的ESG投资组合是基于客观衡量指标最大化绩效的方式将传统因子和ESG因子进行整合。 其他更多元的另类数据,包括物流、电商、供应链数据等,已被大型机构采用。

——九坤投资王琛《量化+AI,未来可期!》

\

标签

量化投资机器学习金融工程