PLUS会员

因子构建

由hxgre创建,最终由hxgre 被浏览 130 用户

因子构建步骤:

  1. 理论推导:根据投资哲学和市场观察来定义因子。例如,价值、动量、质量等。
  2. 数据获取:获取原始数据
  3. 数据处理:对因子数据进行清洗、填充缺失值、处理极值等。
  4. 因子计算:根据公式计算因子值
  5. 单因子分析:进行分层回测、IC分析、回归分析
  6. 加权合成:使用多个因子,需要决定每个因子的权重,将多个因子按照权重合成一个综合因子。
  7. 因子回测:使用历史数据测试因子的有效性。
  8. 因子优化:根据回测结果对因子进行优化,比如:组合优化。

\

因子定义

金融学理论:

  • 投资理论
  • 行为金融学

基本面因子 —— QMJ因子

QMJ因子是AQR在2018年发布的论文《Quality minus junk》一文中提到的通过财务指标构建可以筛选公司质量尚佳的因子

理论依据:用golden model 重写 市净率 指标:

通过上述公式,可以从三个方向找推动公司估值上升的依据:

盈利能力(profit/B):

增长能力(growth):

安全能力(required return):

回报能力(profit):

Quality因子:

QMJ因子:学术界喜欢用Fama-French三因子的方法进行构建

实证分析:

高频因子 —— 已实现峰度

实证研究:

从上述实证分析中,可以看出:高频已实现峰度指标是一个负向因子,即历史偏度为负的股票未来收益可能较高。偏度是描述一组数据分布形态的统计量,衡量数据分布的不对称性。正偏度表示数据的右尾部分较长,左侧数据较集中,表示高于平均值的极端结果出现的频率高于低于平均值的;负偏度则相反。投资者可以根据股票的已实现偏度来调整投资组合。例如,如果一个股票的已实现偏度为负,即历史上股票价格波动时下跌的幅度大于上涨的幅度,投资者可能会选择增加对该股票的投资,以期待未来能获得较高收益。反之,如果一个股票的已实现偏度为正,投资者可能会选择减少对该股票的投资,以降低潜在的风险。

从行为经济学的角度,已实现偏度因子的投资逻辑可以通过投资者的过度反应和风险厌恶理论来解释。

  1. 过度反应理论:行为经济学认为,投资者往往会对最近的信息或经验给予过高的权重,从而过度反应。例如,如果一个股票历史上的偏度为正,即过去上涨的频率和幅度都较大,投资者可能会预期其未来也会持续上涨,从而过度购买这种股票,导致其价格上涨过快,形成泡沫,最终可能导致价格的回落。相反,如果一个股票历史上的偏度为负,投资者可能会预期其未来会继续下跌,过度出售这种股票,使得其价格可能低于其真实价值,从而为投资者提供了投资机会。
  2. 风险厌恶理论:行为经济学认为,投资者通常厌恶风险,并试图尽可能降低潜在的损失。在已实现偏度为正的情况下,由于投资者过度购买,可能导致股票价格的波动性增大,风险增高。风险厌恶的投资者可能会因此而减少对这种股票的投资。相反,在已实现偏度为负的情况下,由于投资者过度出售,可能使得股票价格的波动性减小,风险降低。风险厌恶的投资者可能会因此而增加对这种股票的投资。

数据获取 & 数据处理 & 因子计算

财务数据

相较于量价数据的规则性,财务数据需要进行一系列的预处理:

  • Point in time 处理

  • 截面期可比性

高频数据

难点:数据处理的能力

单因子分析

标签

数据处理
{link}