`

多因子和人工智能谁是 “正规军” ? —— 兼谈金融预测框架

创建于 更新于

摘要

本报告基于资产定价中心理论,阐述随机折现因子(SDF)存在性和多因子模型的起源,进一步探讨人工智能方法对SDF的估计优势及其在金融预测中的应用,强调多因子和AI方法本质上是对同一核心定价因子的不同估计手段,且AI在实战中常展现更优性能。报告配合神经网络模型示意图,辅助说明AI方法的技术优势与实现路径。[page::0][page::13][page::17]

速读内容


资产定价中心公式与随机折现因子理论 [page::3][page::4][page::5][page::6]

  • 资产价格与未来收益通过随机折现因子 m 联系,构建了普适的资产定价核心方程 \(p(x)=\mathbb{E}(m x)\)。

- Hilbert空间中的Riesz表示定理保证存在唯一的随机折现因子,使无套利条件成立。
  • 资产定价的微观经济学推导确认了随机折现因子的存在性及其对资产价格的折现作用。



多因子模型来源及定价机制 [page::9][page::10][page::11]

  • 多因子模型即为随机折现因子假设为因子组合形式:\(m = a + b'f\)。

- 资产预期收益等于无风险收益加上因子风险暴露的线性组合风险溢价:\(\mathbb{E}Ri = Rf + \lambda' \betai\),即因子贝塔定价模型。
  • CAPM与APT为该模型特例,非系统性风险不被定价。


人工智能方法在金融预测中的独特价值 [page::11][page::12]

  • AI与机器学习适合解决复杂、非线性、多维度的收益率预测问题,能灵活建模条件期望函数。

- 机器学习可有效进行变量筛选和降维,避免预测变量之间的共线性和过拟合风险。
  • 简单线性模型与神经网络模型通过最小化样本外预测误差实现资产收益预测。


神经网络预测模型示意图与技术框架 [page::13]


  • 神经网络以多层结构抽象复杂非线性关系,输出为各神经元加权和,优化目标为误差平方和最小化。


AI与多因子模型融合的技术路径 [page::14][page::15]

  • 线性多因子模型通过对因子未来值的估计实现回报预测,AI可用于预测因子未来表现以辅佐传统多因子模型。

- 非线性多因子模型通过非线性函数刻画因子暴露与收益的复杂关系,多层前馈神经网络展现出优越预测能力和风险调整后的收益表现。
  • AI模型采用验证集和正则化减少噪声拟合,提高稳健性和泛化能力。


人工智能在指数增强策略中的应用探讨 [page::16][page::17]

  • 在完全信息市场,投资组合回报等于特定函数\(ft^(mt)\)的组合权重对应值。

- 在非完全信息市场,通过寻找函数\(f
t^{
*}\)实现超额收益,构成指数增强策略的理论基础。
  • 作者多年从业经验验证该“一步到位”寻找组合的算法与传统因子预测方法兼容,且具备更优的投资实战效果。

深度阅读

多因子和人工智能谁是 “正规军”?——兼谈金融预测框架 详细分析报告



---

1. 元数据与概览



报告标题: 多因子和人工智能谁是 “正规军”?——兼谈金融预测框架
分析师: 包赞
联系方式: baozan@stocke.com.cn,电话:021-80108127
发布机构: 浙商证券研究所
发布日期: 报告总体页码显示为近年,具体日期未见明确,但文中引用的最新文献为2016年,结合内容推断较为新近。
研究主题: 资产定价理论视角下的多因子模型与人工智能(AI)方法的对比与融合,特别聚焦于金融预测框架中随机折现因子(SDF)的估计方法。

核心论点:
报告强调资产定价的核心工具——随机折现因子(SDF)的统一地位,认为多因子模型与人工智能方法本质上都是对SDF的估计方式,二者无优劣之分,而是技术路径的不同。多因子模型因其结构清晰、易解释被视为“正规军”,人工智能尽管抽象,但在投资实战中可能带来更优效果。最终,报告倡导两者融合以推动金融投资预测的发展,并指出人工智能和多因子起源相同,均为正规投资方法体系的组成部分。[page::0,1,2]

---

2. 逐节深度解读



2.1 引言(第2页)



资产定价是金融投资的核心问题,且最关键是理解风险和收益的定价关系。随机折现因子(SDF)模型因其普遍性和无严格假设而被广泛视为资产定价理论的统一框架。报告指出,多因子模型多年来一直属于金融学术界和实践中主要的定价工具,如Fama-French三因子模型和Barra模型,因其强解释性而被广泛接纳。

然而,作者指出多因子模型存在实际缺陷(具体缺陷不在本文讨论)。人工智能方法虽然备受质疑,但因其良好的预测性能和实际收益驱动,理应获得更多认可。

本节最后强调,本文将从数学和金融理论根基入手,证明多因子和AI方法均出自对SDF的估计,强调两者的“正规军”地位。[page::2]

---

2.2 资产定价基础理论(第3-8页)



2.2.1 发展回顾(第3页)

报告回顾了现代资产定价理论发展,涵盖Markovitz的投资组合理论、CAPM(资本资产定价模型)、ICAPM、CCAPM、APT(套利定价理论)等,指出均衡定价模型假设较严格且难以理解,而套利定价理论更实用。Duffie和Campbell的观点强调了1970s后资产定价理论发展的停滞,随机折现因子模型的出现带来新的突破。当前难题是理解SDF背后的经济因素。

2.2.2 资产定价中心公式与证明(第4-6页)

资产定价中心公式:

\[
p(x) = \mathbb{E}(m x)
\]

这里 \(m\) 是随机折现因子(SDF),此模型建立在Hilbert空间的完备内积空间中,对于任意资产定价,均可表示为收益与SDF的期望内积,满足无套利条件。其证明借助Hilbert空间中的Riesz表示定理,证明存在唯一的随机折现因子 \(m\),且 \(m > 0\) 确保无套利。

作者用较简单明晰的语言阐述了资产收益的定义,价格折现的线性性质及其所在的希尔伯特空间结构,并展示Riesz表示定理如何保证存在形式明确的SDF。

2.2.3 微观经济学视角证明(第6-7页)

另一种证明基于生命周期效用最大化模型,拉格朗日乘数法导出最优条件,得出SDF的消费边际效用形式,即:

\[
m{t+1} = \beta \frac{u'(C{t+1})}{u'(Ct)}
\]

该方法揭示资产价格是未来现金流的折现,且SDF具有经济学基础。此方法与前述Hilbert空间方法都体现了资产定价中心公式的通用性和重要性。

2.2.4 公式的应用:收益预测等式(第7-8页)

从中心公式推导出和收益率预测密切相关的表达式:

\[
r
{i,t+1} = f(m{t+1}) + \varepsilon{t+1}
\]

其中,预测收益与SDF相关函数 \(f(m{t+1})\) 相关,但具体函数形式未知。报告指出:
  • SDF是希尔伯特空间中的函数,但无法精准定义;

- 经济状态和市场信息决定期望收益,残差为不可预测误差;
  • 常见的资产定价模型(CAPM、三因子、Carhart四因子、Fama-French五因子)其实都是对SDF的线性函数映射。


总结:这表明多因子模型本质是对SDF的线性函数假设,是对随机折现因子复杂未知形式的逼近。[page::3,4,5,6,7,8]

---

2.3 随机折现因子与多因子模型(第9-11页)



本节直接论证多因子模型起源于对SDF因子形式的假设。
  • 非系统性风险不被定价:通过协方差分解,非系统性风险 \(\varepsilon\) 不影响资产定价,只有系统性部分被计价。

- Beta定价关系

\[
\mathbb{E}R
i = Rf + \beta{i,m} \lambdam
\]

其中 \(\beta
{i,m}\) 是资产对SDF因子的敏感系数,\(\lambdam\) 是风险溢价。
  • 因子模型表达


假设SDF为因子线性组合:

\[
m = a + b' f
\]

且因子均值为零,推导出标准多因子资产定价公式:

\[
\mathbb{E}R
i = Rf + \lambda' \betai
\]

其中因子风险溢价 \(\lambda = -Rf E(m f)\),\(\betai\) 是资产对因子的暴露。CAPM和APT为特例。

本段清晰揭示多因子模型本质是对SDF因子形式的线性假设,是资产定价理论的直接推论。[page::9,10,11]

---

2.4 随机折现因子与人工智能(第11-13页)



在多因子模型线性假设之外,作者强调因随机折现因子函数形式未知且可能复杂,AI/机器学习(ML)是估计非线性、动态和高维SDF的强大技术工具。
  • 资产风险溢价本质上是一个条件期望预测问题,适合机器学习处理。

- 预测变量丰富且高度相关,传统方法受限,机器学习中的变量选择和降维优势明显。
  • ML可通过构建宽泛的非线性函数搜索空间,识别变量间的复杂关系,避免过拟合,提升预测性能。

- 简单线性预测模型可视为固定参数的函数,ML神经网络模型则通过多层结构灵活逼近未知函数 \(g^\star(z{i,t})\)。

图1显示了神经网络的基本结构,包括输入层、隐藏层和输出层,反映网络通过多层非线性变换拟合复杂函数关系。

目标函数均为最小化均方误差,样本外预测性能指标为关键。

总结:AI和机器学习是在不预设固定因子形式前提下,更自由灵活地拟合SDF函数的工具,可能带来更优的投资预测表现。[page::11,12,13]

---

2.5 人工智能技术配合多因子(第14-15页)



本节介绍了AI如何辅助和扩展传统多因子模型:
  • 线性多因子模型


\[
R
i = ai + \sum{l=1}^L u{il} \hat{F}l + ei
\]

其中,因子未来值 \(\hat{F}
l\) 可由人工智能方法预测,而非简单历史均值。这扩展了多因子模型的预测能力。
  • 非线性多因子模型


改进假设因子与资产收益的关系非线性且存在因素间交互作用,模型形式为:

\[
Ri = \tilde{f}(u{i1}, ..., u{iL}, \hat{F}1, ..., \hat{F}L) + ei
\]
  • 作者援引巴克莱使用的多层前馈神经网络作为非线性模型案例,训练时利用验证集和正则化减少噪声过拟合,采用滚动训练-测试窗口增强稳健性。

- 神经网络用月度因子暴露数据预测股票表现,尤其聚焦于筛选相对表现好的股票,实现风险调整后的持续超额收益。
  • 相关实证显示,非线性多因子模型的组合夏普比线性模型更优秀,尤其在极端市场中表现更稳健。


此段强调AI技术在多因子模型中的深化应用,不仅能改进因子预测,也能突破线性模型限制,实现更高阶的复杂模式捕捉。[page::14,15]

---

2.6 人工智能投资实战应用再探讨(第16-17页)



运用前文数学和模型基础,报告引出投资实践中的指数增强思路:
  • 在完全信息市场时:


\[
\sum w{it}^ r{it} = ft^(mt)
\]

组合加权的收益可完美对应某一函数形式的SDF(或其估计函数)。
  • 信息不完全时,通过超配残差为正的证券,实现组合收益超过传统函数 \(ft^(mt)\):


\[
\sum w{it}^{} r{it} \ge ft^(m
t)
\]

反映指数增强策略做法和目标。
  • 高级方法是“一步到位”寻找直接对应组合权重的函数 \(ft^{}(\cdot)\),无需先预测收益再构建组合,直接通过函数映射构建超额收益组合。


作者强调这种方法是其多年研究的根基思路,即解决“金融学中异象(anomaly)”问题的数学形式。虽然函数 \(f^{}\) 难以寻找,需要对算法和线性空间理论有深刻理解及大量工程实验,但人工智能方法正是寻找此类函数的有力工具。

总结,报告重申多因子与人工智能都是基于资产定价理论的正规工具,区别仅是对SDF估计形式的不同,前者强调理论的解释力,后者强调实战的收益表现。[page::16,17]

---

3. 图表深度解读



3.1 资产定价中心公式示意图(第0页)



资产定价中心公式

该图片直观体现资产定价中心公式 \(P = \mathbb{E}(m x)\) 关系,强化了SDF在资产定价中的核心地位。图形简单但寓意丰富,体现资产价格是未来收益与折现因子的期望乘积。其直观展示加强了报告引言对SDF重要性的阐释。[page::0]

---

3.2 神经网络结构图(第13页)



神经网络

该图展示了一个典型的多层前馈神经网络架构:
  • 输入层:接收因子暴露变量(如宏观指标、股票基本面等)。

- 隐藏层:通过多神经元节点实现非线性特征抽象、组合。
  • 输出层:生成最终的收益预测结果。


网络边连接权重对应参数\(\theta\),模型训练通过最小化预测误差实现参数优化。网络结构解释了AI方法为何适合捕捉复杂非线性关系,支持报告中核心论点,即机器学习能扩展和提升多因子模型的预测能力。[page::13]

---

4. 估值分析



报告并未涵盖具体公司的股票估值定价模型,也未给出具体目标价。报告核心在理论框架和方法论的探讨,着重解释资产定价中心公式及其应用,展示多因子模型和AI方法如何估计随机折现因子。

报告附录中提及GMM(广义矩估计法)用于SDF的估计:
  • SDF被描述为市场收益的线性组合 \( mt = 1 + b f_t \)

- 通过最小化估计误差的GMM方法获得系数 \(b\),实现对SDF的估算。
  • 但报告提示GMM估计在实际中存在稳定性问题,作为未来研究方向。


这部分说明虽然有传统估值工具,但实际估值过程复杂且充满挑战,AI机器学习提供了非参数或更灵活的替代方法。[page::19,20]

---

5. 风险因素评估



报告风险分析较少专门章节,但间接涉及:
  • 多因子模型的局限:报告承认多因子模型虽主流,但存在缺陷(未具体展开),暗示可能风险包括模型限制、过拟合、因子失效等。

- AI方法存在过拟合风险:报告提及对神经网络训练使用验证集和正则化防止过拟合,确保模型泛化能力,体现风险控制意识。
  • SDF函数形式未知且复杂:估计误差和函数形式不确定使得预测实现存在内在不确定性和潜在风险。


此外法律声明中已提示投资有风险,模型或方法的实际表现可能因市场变化、数据质量及算法限制而受影响。[page::15,16,21]

---

6. 批判性视角与细微差别


  • 报告明确表示本报告非多因子 vs 人工智能优劣讨论,需要警惕作者立场对AI方法的倾向解读,但实际论述较为中立。

- 报告多使用抽象的数学语言阐述资产定价,可能使非专业读者存在理解门槛,理论深度与实战应用的衔接略显跳跃。
  • GMM估计系数不稳定问题被提及,说明经典估计方法存在局限,对AI估计性能无详细实证对比,缺少量化收益验证,减少分析的实证力度。

- 报告虽强调二者“师出同门”,公平对待,但对AI方法的技术细节和潜在应用风险描述不足,比如模型透明度、计算成本、潜在的过拟合风险等未深入分析。
  • 文章对多因子模型的“缺陷”未展开,出现一定信息不对称,读者难以全面评估二者的优劣。


整体来看,报告为理论讲解为主,操作细节和风险提示不够全面,实证和案例数据支持有限。[page::17,19]

---

7. 结论性综合



本报告系统阐述了资产定价随机折现因子(SDF)作为金融资产收益预测和定价的统一核心理论基础,基于希尔伯特空间及Riesz表示定理,证明了SDF的存在性与唯一性。其核心资产定价中心公式表达了任意资产价格均可视为未来收益乘以SDF的条件期望。多因子模型则是基于SDF因子形式假设,是学术界和业界广泛使用的定价和投资工具,CAPM、Fama-French多因子模型等均是其特例。该模型具备较强的可解释性,但对SDF形式的假设限制了其估计精度。

报告指出,由于SDF的真实复杂函数形式未知且动态变化广泛,人工智能特别是机器学习技术提供了估计非线性、高维、动态SDF的强大工具。通过神经网络等模型灵活拟合因子暴露与收益的关系,能够突破线性模型限制,捕捉变量间复杂非线性互动,实证表现优于传统多因子模型,尤其在极端市场条件下健壮性更强。

报告进一步提出了多因子模型与人工智能方法的融合路径:利用AI方法预测未来因子值,再引入因子暴露的非线性建模,实现非线性多因子模型,兼顾理论可解释性与实战性能提升。最后提出指数增强“一步到位”组合构建思路,聚焦于直接寻找对应组合权重的SDF映射函数,代表人工智能在投资策略构建中的核心创新力。

报告整体观点是:多因子模型与人工智能均为基于资产定价理论的正规投资工具,二者优劣无绝对定论,融合发展是未来趋势。理论深度、解释能力归多因子,实战成效和灵活性归人工智能。

从两张关键图表来看:资产定价中心公式图示强化了报告理论核心的普适性;神经网络图形直观呈现了AI估计复杂函数的能力,两者结合体现了本报告的主旨——“正规军”统一战线。

总体而言,报告为金融投资者提供了理论与技术交叉视角,系统说明了多因子和人工智能两种主流方法在资产定价体系中的共同根基和发展前景,为金融资产预测及组合构建提供了富有启发性的理论基础和实践思路。其对国内投资者对AI缺乏认可现象的探讨,也具备一定的现实意义和针对性。

---

参考页码溯源


  • 报告背景与引言部分:[page::0,1,2]

- 定价理论基础及中心公式推导:[page::3,4,5,6,7,8]
  • 多因子模型的来由与结构:[page::9,10,11]

- AI方法及神经网络应用解析:[page::11,12,13,14,15]
  • AI与多因子融合、指数增强应用:[page::16,17]

- 图表解读(资产定价公式图与神经网络图):[page::0,13]
  • 风险及估计方法提及:[page::15,16,19,20]

- 法律及免责声明:[page::21]

---

总结



本报告精细解读了随机折现因子在资产定价中的基础地位,透彻探讨了多因子模型作为线性估计方法的合理性和局限性,并深入介绍了人工智能在复杂非线性估计中的优势和应用,展现了两者的内在联系与互补前景。通过理论推导、模型结构和实证设计的多维展示,系统阐明“多因子”和“人工智能”均属于金融预测方法的正规力量,应当被公平看待和融合使用,从而提升金融资产的风险调整后收益表现。

此报告对金融业界投资者、研究者、以及对人工智能应用于资产定价感兴趣的技术人员,均具有重要的启发价值和理论指引意义。[page::0-21]

报告