Deep Alpha 研讨会-互动问答环节
由qxiao创建,最终由qxiao 被浏览 318 用户
Q1:现在海内外量化实践有什么代际差吗?海外接下来量化方向除了另类数据应用,还有什么发展潮流?他们对于国内量化市场是怎么判断的?
**关子敬:**在我看来海内外最主要的差别是:国内投资人是偏向喜欢直接对股价做预测,而海外直接预估股价比较少,主要做填充模型(imputation model),针对遗失数据做估算,特别是在ESG上可以看到更多实践,或者也会去做预估因子的价值、预估公司营收,或是margin。 造成这种差异得原因可能源于国内的资讯、数据比较标准化,如财报都是用统一的格式,然后也有比较小的国际市场之间的相互影响。海外数据则更为复杂,也没有如此标准化,衍生产品比较多样化,预估受市场影响比较多,所以海外会偏向可能去研究一下causality (因果)的分析,比如说去看一看有没有隐藏的参数是没有包含在模型之内,他们会尝试看看有没有办法去把没有观察数据包含进去。 在海外的模型里面,GAN就继续去产出另类数据的历史,其实他们也会在研究,因为的确的反正说数据只是是不足够去做很精准的 AI的模型,所以用GAN去产出historic alternative history,其实其中做法也是因为金融数据也有他们特性就是不稳定的,过往历史数据对现在影响力没有这么强,所以用到另类历史数据其实与现在市场状况更贴近,比起利用10年前20年前的数据更好一点,这一块他们也是在研究的。
Q2:Gat因子值为什么是取过去20天,而不是比如30天?Gat网络输入的因子是等权重的,还是不同权重?如果是不同权重,是如何确定的?
**何康:**历史时间段的长度是可以任意设置的,甚至从5遍历到60都没有问题。但是这里会遇到两个挑战,第一个挑战是参数越多过拟合的可能性越高,第二个挑战与算力有关,图注意力网络模型相对比较复杂,假设是GTX1060的显卡,200个因子300只股票,训练一期大概20分钟,所以历史上每年做1次滚动的话,大概要4个小时左右,参数从5遍历到60就要花好几天时间。当然如果能借助BigQuant平台的算力,我相信就可以做更丰富的参数测试了。