问答交流

讨论下筛选和排序的关系,事件策略的筛选到底是个啥

由anthony_wan创建,最终由small_q 被浏览 61 用户

\n.\n.\n首先说一下因子分析,因子分析其实就是因子看板那一套,把因子从大到小排序,然后qcut分组。(一般都用qcut等频分箱),然后看一看每一组的收益。简单来说,就是用因子去做排序,把全部股票放到不同的篮子里,然后看看每个篮子的净值变化。也就是所谓的分层回测,这个很好理解。\n.\n.\n在分层回测中,就引入了下一个概念--样本空间。\n不同的因子在不同的样本空间下表现是不同的,举个最简单的例子,财务因子。财务因子通常更新频率非常低,所以时效性非常差。同时财务因子又和公司的前景息息相关,毕竟你一个公司财报炸了总归算是利空。所以我们会发现一个有意思的事情,一些财务指标在沪深300作为因子排序是有一定分层效果的,但是财务因子放在小市值股池内确无法进行分层。简单的归因就是样本空间的区别。投资大市值票的投资者更加倾向于买财务前景明朗的公司,而买小市值票的投资者往往不太注重财报。(毕竟财报起飞的公司市值肯定早就起飞了,沦落不到成为小市值)\n\n在理解分层回测和样本空间后,我们就可以探讨一下筛选和因子排序的关系了。\n\n先说结论:\n筛选是对于样本空间的选择,因子排序以及分层净值分析是去分析在样本空间内是否有对股票未来收益的选择能力的考察。\n\n在筛选过程中是非常容易过拟合的,所以一些自然的筛选方式比如使用指数股池做过滤,或者一些无参数的财务指标做过滤(大于或小于0这种普遍不被认为是一种参数)是在过滤这件事情最容易减少过拟合的方式。,然后再通过一些高频因子或者日频量价因子可以考察该因子是否在这个过滤后的样本空间内有分层选股的效果。当然多因子组合方式有很多,可以是等权截面标准化后相加也可以是机器学习滚动拟合,这个就不在这里讨论了。\n\n那我们回到各大论坛最火热的小市值策略,看看我们的理论是如何看待小市值策略。\n

首先大多数小市值策略会有很多过滤条件,其实这些过滤条件就是一个样本空间的选择。你站在2023时间点选择过去时间的样本空间,这个过程是非常容易过拟合的,因为可能你筛选出来的样本空间本身整体未来收益期望就很高(未来n周期收益均值)。那么这个本身就是一个用参数过拟合历史的一个过程。\n\n第二,筛选过后往往会通过小市值进行排序然后买入,这个其实就是过拟合一个样本空间后用市值因子排序买入,其实市值因子本身是一个非常强的风格因子,这个因子同时也是一个在全市场有效(历史中有效)的因子。所以筛选+市值排序这一条做策略的路的基础收益来源是市值因子这一单一风格因子,那不同策略之间的策略收益来源是样本空间的选择。\n所以这类策略收益会有2种,1是市值因子提供的,2是样本空间选择提供的,那么结合这个结论自然不难回答为什么很多人实盘不如回测的这个问题。因为市值因子只要有效他依然可以在实盘中持续为你带来收益,但是因为回测中的样本空间选择是拟合历史所造成的,同时实盘中这部分收益你是无法获得,所以你实盘中样本空间选择所带来的收益部分会大打折扣~~\n\n最后还是那句话,小市值策略其实差不多的了。\n个人量化其实有很多研究的方向,很多不同的样本空间有独自的特性。个人量化可以去在特定具有底层逻辑的样本空间中去做特定的因子研究。主要原因就是做全市场的因子研究很容易做着做着就往机构发指增那条路去靠了,最后个人的算力,资源,时间是无法和机构比的。而机构主要也是去做这些方向,最终选股后风格优化后拿去发产品。而一些特定样本空间其实机构是很少去研究的,例如我知道一些人去做不同形态空间下的因子研究,也是很有意思的~~~ 这个过滤方式不一定是财务因子,也可以是一些量价指标。这个样本空间内的因子研究最好也是用一些高频数据,可操作性也会更强一些~~\n

最后祝愿大家发大财~ 起飞起飞~

标签

因子分析股票筛选
{link}