研报&论文

金融科技(Fintech)和数据挖掘研究(六):利用数据挖掘构建热点主题组合-海通证券-20191205

由qxiao创建,最终由qxiao 被浏览 73 用户

摘要

近年来,对于主题型投资机会的研究逐渐成为市场的热点。一方面,随着被动化投资的兴起,各类主题指数基金受到越来越多投资者的关注。另一方面,同一主题下股票收益的共性及领先-滞后关系的研究,也是当前量化选股模型的一个重要补充。因此,本文借用FactSet的供应链与深度行业分类数据,提出一种自动化程度可调节的主题组合构建框架,以满足各类型投资者的不同需求。

主题组合构建步骤

  1. 找到与主题相关的若干龙头公司;
  2. 获取龙头公司的共同业务;
  3. 获取龙头公司的共同供应商及其共同业务;
  4. 将龙头公司业务交集与共同供应商业务交集合并为一个集合,遍历所有上市公司,获取至少从事集合中一项业务的公司;
  5. 将上一步得到的公司做进一步过滤,得到最终的主题组合。


5G业务集合

首先,从龙头公司及其供应商的深度行业分类中,分别获取和5G基站建设相关的业务集合。将它们合并,得到5G基站建设业务集合。其次,用类似的方法获取5G手机业务集合与5G芯片业务集合,并与基站建设业务一同构成完整的5G业务集合。

5G主题组合

将所有A股公司的业务(FactSet RBICS中的第六层行业分类)与5G业务集合逐一匹配,筛选出至少包含集合中一项业务的公司,形成初始的5G主题组合。进一步剔除ST及5G业务营收占比不高的公司,修正组合。在5G概念大热的2019年,截止10月31日,5G等权组合累计涨幅63.1%,营收占比加权组合累计涨幅67.3%,显著优于中信通信行业指数(23.7%)与Wind 5G概念指数(35.1%)。

评价主题组合优劣的方法

一是,股价走势的一致程度。受同一热点推动的股票理应有相似的涨跌趋势。组合内股票走势的相关性越强,组合越能代表当前的主题热点。二是,股票之间的动量溢出。即使从属于同一个主题组合,也有可能因为投资者的关注度有限或分属于产业链的上下游,发生部分股票反应不足的情况。前期涨幅较低的股票很有可能在后期出现补涨,而前期涨幅较高的股票则很难长时间保持相同的上涨幅度。

框架的局限性

由于是建立在供应链与深度行业分类之上,对于像云计算这类以某种跨行业使用的技术为核心的主题,从龙头公司或共同供应商的业务交集出发的筛选方法,很难取得良好的效果。想要构建此类主题组合,需要更多地依赖分析师的经验,以及对公司主营业务的深入分析。

正文

/wiki/static/upload/31/31a1869e-f955-43a2-b9d5-e8ab3c19d651.pdf

\

标签

数据挖掘量化选股模型
{link}