对多因子模型体系的初探及复现
由ypyu创建,最终由ypyu 被浏览 127 用户
导语
本文对华泰证券2016年九月发表的研报《 华泰多因子模型初探》进行了整理与简单的复现,使用的是BigQuant平台上的可视化模板,可供初学者借鉴、熟悉平台的使用以及对因子的理解。 华泰证券-多因子系列之一:华泰多因子模型体系初探.pdf
文章主要有以下内容:
- 多因子模型、定量管理、风险、投资组合等偏经济学方面的定义
- 多因子模型的构建流程:准备工作,收益模型,风险模型,优化模型
- 介绍各种因子,并介绍如何识别因子有效性
- 介绍如何回测,检验收益
本文将使用平台的可视化模块复现研报中几类典型因子的截面分布、行业市值中性化后的截面分布以及rank分布
复现的基本方法
策略案例1
首先附上策略的链接: 规模因子(市值对数)的介绍在研报的第16页
https://bigquant.com/experimentshare/45834259d9dd482cac5aad4050a69b9e
提取数据
首先从数据库 估值分析(market_value_CN_STOCK_A)与 财报数据(financial_statement_CN_STOCK_A)分别提取出股票的总市值(market_cap)与净利润(fs_net_income)、营业收入 (TTM)(fs_operating_revenue_ttm)
计算因子数据
使用链接数据模块将两组数据链接在一起,在通过输入特征列表和衍生特征抽取模块,计算出因子数据
提取数据,清理并绘图
对市值因子的分析
现附上对行业市值进行了中性化处理与数据清洗的策略连接:
策略案例2
https://bigquant.com/experimentshare/3270661b80b74511b63bdafa10198369
本节与上个策略不同点在于:1.引入了行业的概念。下图为引入行业的过程 下图为中性化处理的代码:通过groupby函数将行业分组,减去其市值均值,然后在后续作图过程中进行规范化、去极值等操作。 结果如下图:
几类典型因子的截面分布
- SP因子(营业收入/总市值) (数据清洗前)
(数据清洗后)
2.EPcut(扣除非经常性损益后净利润/总市值,数据清洗前) (数据清洗后) 3.ROE_TTM (数据清洗前) (数据清洗后)
4.流动比例 (数据清洗前) (数据清洗后) 5.市值对数 (数据清洗前)
(数据清洗后)