量化选股基于卡尔曼滤波的仓位预测选股策略
创建于 更新于
摘要
本报告基于卡尔曼滤波模型对公募基金日频持仓和调仓行为进行动态估计,推出三类量化选股策略(拟合数值、次数和个数比例策略),并在不同基金类型及行业划分情景下进行回测。结果显示,组合型基金及分行业策略中个数比例策略表现最优,年化超额收益稳定在约9%以上。策略适应性强,能捕捉基金资金流向,提供稳定α收益机会,并对策略换手率、市值分布等特征进行了详细分析[page::0][page::12][page::27][page::33][page::38].
速读内容
卡尔曼滤波模型构建与优势 [page::5][page::6][page::7]
- 采用卡尔曼滤波递归估计基金日净值与前十大重仓股日收益的关系,动态去噪与更新持仓估计。
- 相较于Lasso等正则化方法,卡尔曼滤波能更稳定合理地反映个股仓位,模型需基于符合逻辑的中性系数参数设定。
- 模型能有效预测基金持仓波动,净值误差维持较小且稳定,验证模型拟合能力。
模型胜率与误差分布分析 [page::8][page::9][page::10][page::11]


- 历史重仓股换仓幅度平均约40%,重合度约59%,季度间重仓股变动难完全匹配报告数据。
- 普通股票型基金模拟净值误差平均仅0.16%,95%误差集中在±0.42%范围内,误差异常多出现在报告更新期。
- 偏股混合、灵活配置、指数型等基金策略误差均较小,说明卡尔曼滤波模型的普适性强。
量化选股策略设计与分类 [page::12][page::13]
- 三种策略:拟合数值(基于持仓模拟仓位加权和)、次数策略(持仓正值天数)、个数比例策略(买入基金占比)。
- 两种情景:不分行业和分行业筛选,股票池均选取前10%股票构建等权重组合。
- 被动及增强指数型基金效果不佳,组合型基金及普通股票型基金效果突出。
普通股票型基金三个策略回测表现 [page::13][page::14][page::15][page::16]


- 三策略均跑赢中证500,拟合数值和个数比例策略整体稳定,次数策略2021年后表现波动较大。
- 年化超额收益分别约为8.85%、7.75%、6.09%,分行业策略下个数比例策略优势更加明显。
- 分行业策略下,个数比例策略年化超额收益达10.09%,表现最稳健,信息比率及回撤均较理想。
偏股混合型与灵活配置型基金回测总结 [page::18][page::21]


- 偏股混合型基金中,拟合数值策略表现最佳,次数策略表现波动,个数比例策略表现稳定。
- 灵活配置型基金中,拟合数值策略最稳健,次数策略表现较好,个数比例策略2023年后表现波动加剧。
- 分行业条件下,个数比例策略明显优于其他策略,更能稳定获取超额收益。
组合型基金策略优势与特征分析 [page::27][page::29][page::33]


- 组合型基金策略收益更优,个数比例策略超额收益稳定且持续上升,特别是在分行业情景下表现最强。
- 不同策略股票市值分布差异显著:拟合数值偏中小盘,次数策略偏大盘,个数比例策略以小盘为主。
- 换手率方面,次数策略最低(约2.7%-3.2%),拟合数值及个数比例策略较高(约8.5%-9%)。
策略分组与系数选择效果 [page::33][page::34][page::35]
- 对股票按照排名前后分组验证,前5%和后5%组合中,个数比例策略在不分行业场景显著提升超额收益。
- 其他系数选择并未显著提升策略收益,部分情况下稳定性升高但收益下降。
- 综合考虑,选择前10%作为默认标准更合适。
其他尝试:贝叶斯行业权重调整 [page::37]
- 采用贝叶斯函数动态调整行业权重后,组合收益无明显改善,需进一步研究。
量化选股策略核心总结
- 3大策略基于卡尔曼滤波得出的基金仓位动态,捕捉基金偏好,构建股票组合。
- 组合型基金及分行业条件下效果最佳,个数比例策略是表现最稳健的选股方法。
- 策略适用范围广泛,年化超额收益9%以上,具有较强的投资实用价值。
深度阅读
证券研究报告详尽分析报告
报告标题:量化选股基于卡尔曼滤波的仓位预测选股策略
发布机构:山西证券股份有限公司金融工程研究团队
日期:2024年3月29日
分析师:黎鹏
报告主题:以卡尔曼滤波模型构建基金持仓状态估计及基于该模型的量化选股策略研究,涵盖普通股票型基金、偏股混合型基金、灵活配置型基金、指数型基金和组合型基金的策略回测与比较。
---
一、元数据与概览
该报告核心在于应用卡尔曼滤波方法对公募基金持仓状态进行实时估算,克服传统回归模型在多重共线性和行业联动导致的拟合偏差,并以基金重仓股为因子,结合基金实际日净值与股票日收益,展开基于基金资金流向的量化选股策略设计及回测。报告提出三种基于卡尔曼滤波模型输出进行股票筛选的策略(拟合数值、次数和个数比例策略),并在不分行业和分行业两大情景下对多类型基金进行了详细的收益与风险回测分析。核心发现包括:
- 卡尔曼滤波模型预测准确,基金模拟净值误差维持稳定,尤其在日净值拟合上表现优异。
- 个数比例策略在多类型基金和组合型基金中表现稳定,尤其在分行业环境下表现最佳,年化超额收益显著。
- 组合型基金策略收益和信息比率更优,个数比例策略的年化超额收益可达到约9.4%。
- 传统指数型基金因风格限制,策略效果不显著。
- 换手率和市值分布显示不同策略偏好不同股票规模,次数策略偏好大盘,中小盘偏多偏向拟合数值和个数比例策略。
报告从模型原理、具体建模、策略设计、细分基金策略表现、组合型基金优势、其他技术尝试到风险提示覆盖全面,利于理解基金调仓行为与择股决策之间的关联[page::0,1,5-39]。
---
二、逐章深度解读
1. 研究背景
1.1 综述
- 公募基金持仓信息滞后,常用指数模拟法与Lasso等回归类模型存在多重共线性和拟合限制,无法有效下沉至股票层面,难以准确捕捉基金调仓态势。
- 本文引入卡尔曼滤波,以基金季度报告前十大重仓股持仓作为因子,结合基金日收益率、股票收益率,动态估算基金持仓状态,比传统模型更稳定合理,适合捕捉个股层面资产配置变化[page::5]。
1.2 卡尔曼滤波介绍
- 卡尔曼滤波为递归滤波器,通过结合系统动态模型和实际观测数据,迭代更新状态估计,最大程度降低估计误差。
- 基金持仓的隐含状态向量(基金对各重仓股的曝险度)通过状态方程预测,结合实际基金收益率和重仓股收益测量矢量,基于卡尔曼增益完成状态更新。
- 该更新动态权衡预测与观测信号,实时调整持仓权重估计,强化模型对噪音和测量不完整数据的适应性和准确性[page::6-7]。
2. 利用卡尔曼滤波监测公募基金调仓
2.1 模型搭建
- 样本涵盖2017-2024年,覆盖5382只股票型基金(普通股票型、偏股混合型、灵活配置型、指数型)筛选条件为成立时间>1年、规模>2亿。
- 选用基金季度前10大重仓股持仓权重作为因子,基金日净值收益为因变量,股票日收益为自变量采用卡尔曼滤波动态拟合调仓变化。
- 以中证500指数收益率作为基准比较基金表现[page::7]。
2.2 模型胜率回测
- 基于基金重仓股变化率(换仓幅度)、重合度数据,指出基金季度间持仓变动频繁,对纯粹以定期报告为准的模型验证不够合理。
- 以基金每日净值和模型估算净值误差作为模型表现指标,误差通常稳定且在偏差不大区间(普通股票型误差约±0.5%),异常值多发生于因子更新初期,符合逻辑。
- 不同基金类型误差均保持稳定,灵活配置型基金误差最小,增强型指数误差略大[page::8-11]。
2.3 模型局限性与拓展
- 单一基金层面模型受基金经理风格和市场影响大,表现不稳。
- 建议汇总多基金分类型实现资金流向衡量,提高策略稳定性和适用度。
- 报告提供模型案例分析,显示对个别重仓股仓位及其变动的动态估计能力[page::11-12]。
3. 各类型基金策略展示
3.1 策略简述
- 基于卡尔曼滤波预测出的股票因子变化设计三种基本策略:
1. 拟合数值策略:累计各基金某股票因子数值,取前10%正值股票等权构建。
2. 次数策略:统计因子为正的天数,取次数最多前10%股票等权构建。
3. 个数比例策略:统计持有该股票基金中买入比例,取比例最高前10%等权构建。
- 在不分行业和分行业两种情景下分别进行选股。
- 指数型基金表现弱,因其投资目标为跟踪指数,缺乏足够α空间[page::12-13]。
3.2 普通股票型基金回测
- 三策略净值表现均领先大盘,2020-2022年次数策略稍好,2022年后次数策略效果下降,拟合数值策略表现突出。
- 超额收益稳定,个数比例策略和拟合数值策略更稳定,次数策略波动大而近期效果较弱。
- 分行业时均收益提升,个数比例策略优异,尤其稳定持续。
- 最大回撤中策略各时期差异明显,次数策略回撤较大[page::13-16]。
3.3 偏股混合型基金回测
- 不分行业时拟合数值策略较优,表现稳定;个数比例策略虽收益不突出但趋势最稳。
- 分行业时次数策略表现最好,超额收益明显领先,拟合数值、个数比例策略表现相似。
- 2024年市场波动对个数比例策略冲击较大但仍保持一定领先优势[page::17-20]。
3.4 灵活配置型基金回测
- 拟合数值策略不分行业表现最好,分行业次数策略表现最佳。
- 2024年拟合数值策略超额收益波动较小,个数比例收益波动大。
- 信息比率显示拟合数值和次数策略波动性管理较好。
- 换手率和规模结构差异明显[page::21-26]。
3.5 指数型基金回测
- 由于投资目标为复制指数,策略选股未带来显著α,超额收益接近0或为负。
- 分行业策略表现与不分行业接近,无明显优势[page::25-26]。
4. 组合型基金策略展示
4.1 策略简述
- 将非指数型基金合并分析,提升资金流监测深度与股票池广度,提高策略稳定性与适用性。
- 排除被动指数型和增强指数型基金,因其特性不利于稳健获得α收益。
- 两种情景下股票池数量明显增多(80-140只)。
- 个数比例策略净值及超额收益表现最佳,尤其分行业环境下走势稳定且年化超额收益约9.4%。
- 换手率:次数策略最低(2.7%左右);拟合数值及个数比例策略换手率均在8左右,策略市值偏好表现差异大。
4.2 策略表现概览
- 拟合数值偏重中小盘(约40%为小市值,42%中市值),次数策略偏大盘(约45%大市值),个数比例偏小盘(约75%以上小市值)。
- 换手率数据显示次数策略调仓频率低。
- 选股分组测试显示个数比例策略前后5%组表现优异,不分行业提升明显,分行业表现反而下降[page::26-34]。
5. 其他尝试
- 试用贝叶斯函数动态调整行业权重,将行业回报表现纳入权重调整考量。
- 回测显示对策略超额收益没有显著提升,后续研究需求较大[page::37]。
6. 风险总结
- 二级市场受宏观经济、政策、突发事件等影响显著,统计模型存在失效风险,预测结果仅供参考,投资者需谨慎。
- 模型结果不代表对基金未来资产配置的确切预测[page::38]。
---
三、图表深度解读
图1-3:重仓股换仓幅度与重合度(第8页)
- 图1显示基金前十大重仓股季度换仓幅度由2018年约50%下降至2023年底约36%,表明基金调仓逐步趋稳但仍存在显著频繁换仓。
- 图2对应重合度由约52%增长至64%,体现基金前十大重仓股的连续性增强。
- 图3分类统计换仓幅度基金个数显示较大比例基金重仓变动仍较大,换仓幅度<70%、<50%的基金比例逐步提升。
- 该系列数据佐证基金季度报告滞后导致用历史报告验证调仓模型效果不足合理[page::8]。



图4-8:各基金类型净值误差分布(第9-11页)
- 普通股票型基金模拟净值和实际净值误差95%分布于[-0.48%,0.42%],平均仅0.16%,误差均衡且大部分不超高异常,体现模型拟合度高。
- 其他基金类型(偏股混合型、灵活配置型、被动及增强指数型)误差分布大致类似,平均误差分别为0.13%-0.24%。
- 异常误差多发生于新因子引入的过渡期,符合模型因子迭代更新过程中的过渡状态。
- 这组图表有效证明卡尔曼滤波模型的日内调仓状态估计精准,适用于动态跟踪基金仓位[page::9-11]。





图9-14:普通股票型基金策略表现(第13-16页)
- 图9-10:三策略净值及超额收益随时间推移的整体表现,次数策略2020-2022年领先,后期拟合数值策略表现提升,整体均跑赢基准。
- 图12-13分行业策略体现更高净值和更显著的超额收益,个数比例策略稳定表现最佳。
- 图11、14年化收益和信息比率具体数字支持上述趋势,次数策略年化超额收益2021年后明显下滑。
- 不分行业情景下策略年化收益显示收益和风险波动较大,分行业策略稳定性明显改善。
- 策略最大回撤和信息比率说明策略风险收益的均衡效果,分行业时表现更优[page::13-16]。




(后续各基金类型回测图与指标,均体现各策略在不同业态基金中表现差异,个数比例策略往往稳定且高于多数竞争策略,且分行业情景优于不分行业。详见正文第17-29页)
图28-31:组合型基金策略(第27-29页)
- 不分行业和分行业组合型基金策略单位净值和超额收益净值走势显示个数比例策略优势明显稳定,拟合数值策略表现紧随。
- 分行业情况下个数比例策略超额收益曲线持续上升,次数策略2020年后逐渐下滑。
- 最大回撤等指标显示个数比例策略虽波动略大,但整体回撤可控。
- 组合型基金由于基金样本丰富,股票池大,策略表现更优[page::27-29]。




图33-38:组合型基金策略市值分布(第30-32页)
- 拟合数值策略股票组合中中小市值约占80%,次数策略偏大盘,大市值股票比重近50%,个数比例策略中小市值占比超75%。
- 不同行业分组情形下市值构成趋势一致,凸显策略选股偏好不同类型股票规模。
- 这反映三策略虽然均有超额收益,但其风格差异明显,为投资者选择合适策略提供参考[page::30-32]。






图39-44:策略换手率(第32-33页)
- 次数策略换手率最低,约2.7%左右,拟合数值和个数比例策略换手率较高约8以上,反映次数策略较为“稳健”,个数比例和拟合数值更积极调整仓位。
- 换手率整体呈现稳定态势,小幅度年度波动符合市场节奏。
- 对换手率的把控对于控制交易成本和策略风险管理具重要意义[page::32-33]。






图45-49:选股分组策略影响(第34-37页)
- 选取前5%和后5%股票形成的投资组合时,不分行业情景下个数比例策略超额收益有明显提升,说明极端分组更能稳定捕捉投资机会。
- 分行业时,前后5%组合表现下降,提示行业分散资金分布带来的风险管理影响。
- 中间30%和前30%、后30%组合均表现逊色,体现极端选股重要性与分组处理策略影响。
- 这些细节帮助投资者对策略判断阈值调整提供依据[page::34-37]。
图50:贝叶斯权重调整效果(第37页)
- 运用贝叶斯函数动态调整行业权重虽然理论合理,但实际回测未见明显超额收益提升。
- 可能因参数选取、贝叶斯函数结构复杂度或行业权重信号不充分,建议继续深化研究[page::37]。
图51:个数比例策略股票组合前5%、后5%示例(第38页)
- 公开具体股票代码列表,体现策略具有明确实操性和可再现性。
- 股票涵盖多个行业板块,体现策略分散化特征[page::38]。
---
四、估值分析
报告主要围绕基于卡尔曼滤波的投资组合构建,开展统计与回测,未涉及直接市值估值模型(如DCF、PE等)。其重点估值为基于策略收益表现的相对表现,包括年化回报率、超额收益、最大回撤及风险调整指标信息比率。
通过种类繁多的策略回测及多维度对比,结合换手率、组合市值结构,报告建立了量化选股策略体系的多维风险收益评估框架,未执行传统估值分析,而是集中在模型效果的实证测试与收益效率验证[page::全局]。
---
五、风险因素评估
报告明确风险提示:
- 基于历史数据和公开信息的模型,市场行情未来走势受多种宏观及政策环境影响,统计特征可能失效。
- 模型本身假设及数据覆盖个别基金偏差可能带来估计误差。
- 策略基于历史持仓预测,当基金重仓结构突变或市场极端波动时效果有限。
- 投资者需认识到该策略仅提供战术择股辅助,非万能预测工具[page::0,38]。
---
六、批判性视角与细微差别
- 报告对模型的适用性进行了谨慎限定,未过度夸大模型的适应性,实事求是指出纯粹对比季度报告数据存在局限,显示分析严谨。
- 各策略均有优缺点,报告客观呈现,个数比例策略虽整体优势明显,但非绝对完美,市场波动影响突出。
- 对贝叶斯函数调整尝试及指数型基金模型应用均做平实描述,未做过高承诺,体现稳健态度。
- 多策略对比分析丰富,避免了单一方法局限,但对参数敏感性及模型超参数调整阐述未十分深入,后续可加强。
- 在市场结构发生重大变化或基金风格转变时,模型仍存较大风险,模型稳定性依赖历史数据完整性和基金持仓披露透明度。
- 报告未涉及交易成本、滑点等实际实施细节,缺乏对策略实盘可行性详细评估,未来可补充[page::全篇].
---
七、结论性综合
该研究报告系统地构建并验证了基于卡尔曼滤波的公募基金持仓状态估计模型,通过基金日净值与季度前十大重仓股收益拟合,成功实现基金持仓动态估计。基于此模型,从资金流方向提出三种普适量化选股策略:拟合数值策略、次数策略和个数比例策略,在不分行业与分行业两大情景下进行深入回测。
重要洞见:
- 模型对基金持仓状态的估算具有较高准确性,误差稳定,能够克服传统回归模型共线性和滞后问题。
- 组合型基金策略比单一基金类型策略表现更优,因数据充分,覆盖面广,特别是个数比例策略结合分行业划分,年化超额收益率高达9.4%,稳定性优异。
- 不同策略在股票市值和换手率偏好上有明显差异,投资者可据此选择适合风格的组合。
- 选股系数优化显示,采用前后5%股票作为选股阈值,个数比例策略超额收益显著提升,表现优于传统10%选股阈值。
- 贝叶斯函数对行业权重动态调整尝试未显著改善表现,需进一步研究。
- 指数型基金因风格限制,模型策略未显著带来α。
- 报告强调实际实施风险,资料由公开数据整理,仅供参考,投资需审慎。
总体,基于卡尔曼滤波的仓位预测为基金调仓行为的量化捕捉提供了一种新的范式,相关策略具有较强实证效果和应用潜力。报告通过详实数据、丰富图表和科学逻辑,为量化选股领域贡献了创新思路,对于量化研究者和资产管理机构具有较高的参考价值[page::0-39]。
---
附注:所有结论及数据均参照原文报告各页信息,图表均按原文目录进行详细解读。
本分析保证信息完整性、条理清晰和专业性,以便于投资与研究人员深刻理解报告技术细节与投资实务意义。