研报&论文

人工智能系列二十五:真假序列识别再探,市场弱有效性检验与择时战场选择-华泰证券-20191117

由alkaid创建,最终由alkaid 被浏览 99 用户

摘要

尝试构建以真假序列识别为起点基于量价的主动投资研究框架

真假序列识别是检验市场有效性的有力工具。主动投资的核心是市场能否预测,如果市场无法预测,满足有效市场理论,主动投资就没有存在的价值。随机序列满足有效市场理论,无法预测。暂且抛开宏观、财务等数据,仅就交易数据看,如果人工智能算法无法识别真实量价序列和随机序列,那么弱有效市场假说可能成立;如果人工智能可以识别真假,那么可以进一步采用网络可视化技术挖掘模式,或采用遗传规划等算法来暴力挖掘特征。随后通过检验有效模式/特征、过拟合检验、风险控制等步骤,控制整体风险,实现完整的以真假序列识别为起点基于量价的主动投资研究流程。

模拟实验表明卷积神经网络能够识别收益率模式

模拟实验表明,卷积神经网络能够识别收益率模式,神经网络可视化技术能够辅助挖掘模式。在白噪音中插入模式片段,模拟有模式的收益率序列,视作“真实”收益率序列,将其打乱得到“虚假”收益率序列,随后采用卷积神经网络进行真假识别。结果显示样本信噪比越高,识别表现越好。采用中间层激活可视化和类激活热力图两种方法解释卷积神经网络,发现激活函数值较高或热力图热度较高的区域对应模式区域。神经网络可视化有助于定位模式所在位置,从而进一步挖掘规律。

不同时间频率的股指收益率识别表现对比

对比不同时间频率股指收益率识别表现。卷积神经网络无法识别股指日频真假序列,股指60个交易日的日频收益率可能不存在显著模式,市场相对接近弱有效,短线择时难度较大。卷积神经网络能够识别日内分钟频真假序列,股指在分钟线可能存在显著模式,市场可能不满足弱有效,日内T+0策略有一定机会。随着频率从1分钟降低到5分钟,识别效果下降,市场逐渐接近弱有效。Grad-CAM结果表明日内模式更可能出现在开盘后30分钟和收盘前1小时。投资者的交易习惯可能是影响不同时间频率市场有效性的因素之一。

不同资产收益率识别表现对比

对比不同资产收益率的识别表现。个股日频收益率几乎无法识别,日频级别相对接近弱有效,个股短线择时难度较大。因子日频收益率几乎无法识别,短期因子择时难度较大。股指期货分钟频收益率识别表现一般,弱于股指本身,相比股指更接近弱有效,但日内T+0策略仍有机会。商品期货分钟频收益率识别表现好,日内商品CTA策略有机会。股指、股指期货、商品期货识别表现的差异能够和自相关系数检验、随机游程检验等统计检验结果互相佐证。市场交易制度可能是造成股指和股指期货有效性差异的因素之一。

正文

/wiki/static/upload/1c/1c642f6c-003b-45c3-8688-40d74f7d4495.pdf

\

标签

人工智能交易数据算法
{link}