固收+基金资产组合探测——机器学习系列之四
创建于 更新于
摘要
本报告基于机器学习改进的lasso模型,结合多维度正则化参数与网格调优,对混合债券型二级基金及偏债混合型基金的资产组合暴露进行探测,覆盖A股、港股通、信用债、利率债及转债指数。研究结果显示,自2017年底至2022年中,模型在头部基金公司产品上的方向性正确率较高,其中二级债基对股市持仓的加仓动作尤为显著,2022年10月头部基金股票仓位明显上升,且超过七成基金个体的股票仓位增加超1%。此外,港股仓位变化则相对平稳。该模型有效映射了固收+基金多资产投资动态,为固收+基金资产配置和行情分析提供了详实的量化工具和实证依据 [page::0][page::3][page::6][page::9][page::10][page::11]。
速读内容
固收+基金定义与资产范围 [page::2]
- 固收+基金涵盖混合债券型二级基金和偏债混合型基金,投资覆盖股票、债券(含中小企业私募债)、货币市场工具、权益及衍生品等多资产类别。
- 预期收益和风险高于纯债和货币基金,低于高权益基金。
机器学习模型构建与方法论 [page::3][page::4][page::5]
- 引入股票行业指数、港股通指数、信用债指数、利率债指数及转债指数作为底层资产。
- 采用多维正则化lasso模型,通过拆分正则项并赋予不同超参数实现资产组合权重的动态拟合。
- 结合网格搜索调参优化超参数,采用基金仓位数据的平均绝对误差最小化为调参目标。
- 基金持仓构造仓位初值并采用序列递推计算每日资产权重。
资产组合探测回溯分析——二级债基与偏债基金 [page::6][page::7][page::8]

- 2017年底至2022年中,头部基金二级债基金的A股和转债仓位拟合值与实际报告值高度吻合,模型拟合精度高。


- 偏债混合型基金仓位更为灵活,拟合难度更大,且模型超参数在不同基金公司存在差异。

模型方向性正确率评估 [page::7][page::8]
| 资产类别 | 时序方向性正确率 | 截面方向性正确率 |
|----------|-----------------|-----------------|
| 二级债基A股 | 72% | 89% |
| 二级债基转债 | 67% | 54% |
| 偏债基金A股 | 61% | 81% |
| 偏债基金转债 | 83% | 61% |
- 模型在A股资产探测上表现尤为出色,截面方向性正确率最高达89%。
最新一期2022年二级债基资产组合特征 [page::9][page::10]

- 2022年10月头部基金股票仓位明显提升,从15.5%上涨至16.3%,重仓指数同期下跌约2.9%,显示基金主动加仓。


- 约73%的基金股票仓位增加超1%,20%基金仓位增加超5%,转债仓位正向的基金约占50%。
- 预测2022-09-30截面方向性正确率,股票约71%,转债约60%。
可投港股二级债基资产组合表现 [page::11]

- 持仓港股超过1%的二级债基,在2022年6月至11月期间,A股仓位呈现上升趋势,港股仓位波动不大,保持稳定。
深度阅读
固收+基金资产组合探测——机器学习系列之四 证券研究报告 深度分析
---
一、元数据与概览
- 报告标题:固收+基金资产组合探测——机器学习系列之四
- 类型:证券研究报告 / 量化投资策略报告
- 发布时间:2022年12月6日
- 作者:中泰证券研究所,主分析师李新春,助理汤伟杰
- 主题:以机器学习方法对“固收+”基金(主要指混合债券型二级基金及偏债混合型基金)的资产组合进行高频探测,分析其持仓变化及背后投资动向。
- 核心论点与目标:
- 利用扩展后的lasso模型及底层资产指数(股票行业指数、港股通指数、信用债指数、利率债指数、转债指数等)对“固收+”类基金的资产仓位进行高频实时重构。
- 通过对模型超参数的网格搜索调优,获得对重点基金公司的资产组合探测具备较高方向性正确率。
- 分析自2017年至2022年间头部基金的资产配置变化,尤其关注2022年下半年至年末的最新仓位动态。
- 建议关注此类基金股票仓位的变动,可以辅助判断“聪明资金”的行业配置动向。
- 风险提示:历史统计数据及模型结论存在滞后性,第三方数据的准确性风险,模型基于历史规律回溯,存在极端市场下解释力不足的风险,结果仅供参考,不构成投资建议。[page::0] [page::11]
---
二、逐节深度解读
1. 引言:固收+基金定义及资产组合探测背景
1.1 固收+基金的定义与分类
- 定义范围:市场上“固收+”基金定义较宽泛,报告限定使用狭义定义,仅涵盖混合债券型二级基金和偏债混合型基金两类。
- 风险收益定位:预期收益与风险介于货币基金/纯债基金与权益类基金之间。
- 投资标的多样性:涵盖股票(含创业板、中小板)、债券(包含中小企业私募债、转债)、货币市场工具、权证、股指期货及其他法规允许标的。
- 产品示例:两只基金介绍详述其风险收益特征与投资范围配置比例,如偏债混合型基金股票占比0-30%,债券不低于70%;混合债券型二级基金股票比例不超过20%,债券及固定收益类资产比例不少于80%,说明这类基金依靠债券及相关资产稳定回报,同时适度参与权益资产提升收益。
- 重要性:明确基金属性与投资范围,为后续资产组合的底层分类及建模提供基础。[page::2]
1.2 固收+基金的资产组合探测
- 技术延伸背景:中泰金工团队此前对主动权益类基金仓位实现高频模拟,达中信一级半行业分类精度。
- 本报告贡献:首次用细化底层资产指数(股票行业、港股通、信用债、利率债、转债)并应用改进lasso模型(多超参数正则项拆分)探测固收+基金的资产组合。
- 最新实证数据:2022年10月,头部二级债基金明显加仓股票;截至11月底,超过73%的基金股票仓位增幅超1%;港股仓位无明显变化。
- 本节承上启下,强调创新点和研究方法创新,奠定模型使用与底层数据来源的基调。[page::3, 0]
---
2. 研究方法综述
2.1 基金持仓重构资产指数
- 底层指数设计:不同层面聚类构造基金对应的资产指数,实现更精准的持仓反映:
- 股票行业指数以基金公司层面半年频构造,覆盖53个一级半行业(说明考虑了行业细分精度和数据更新的合理频率);
- 港股通指数同样以基金公司层面半年频构造,单指数;
- 转债指数以基金自身季度频率构造,考虑转债特性与基金个体差异。
- 其他债券类指数:采用标准公开指数(中债-信用债总财富1-3年,中债-国债总财富7-10年)反映非权益固定收益资产表现。
- PIT(发布前信息滞后调整)原则应用:指数构建动态对应基金披露的报告周期,保证模型使用的数据与基金实际持仓动态信息贴合。
- 说明:基于基金持仓构建自定义指数,具有更真实匹配基金投资行为的特性,提高探测精确度。
- 缺陷隐含:部分小众行业持仓缺失未处理,可能带来组合暴露代表性的偏差。港股通指数简化处理,或忽视细分板块差异。
[page::4]
2.2 根据基金持仓构造仓位初值
- 初值定义:仓位初值基于基金净资产各类资产的占比,反映固收+基金可能的杠杆情况。
- 动态“重置”机制:
- A股、港股、转债仓位分别根据半年报、季报的披露数据重置,确保估计值贴近最新披露;
- 纯债仓位及敏感度分析用于拆分两类纯债指数仓位。
- 重要说明:该机制结合公开披露数据与模型动态每日调整,提高连续拟合的有效性,降低误差累积带来的偏差。
- 反映基金管理人对仓位的实际调仓动态,支持日频甚至更高频率监测分析。
[page::4]
2.3 主要模型与超参数设计
- 模型形式:改进lasso正则化回归,目标函数最小化基金日度净值收益与多个底层资产收益加权的误差,正则项根据换手率差异引入多维惩罚参数,实际表达为:
$$
\min |y - w1^{T} A|2 + \lambda |w1 - w0|1
$$
其中:
- \(y\):基金收益序列,
- \(A\):资产收益矩阵,
- \(w0\):期初仓位,
- \(w1\):下一交易日权重(即拟合的资产组合权重向量),
- \(\lambda\):多维正则参数向量,区分对换手率高低资产的不同惩罚强度。
- 日度递推计算:模型权重动态更新,前日结果作为当日初值,体现资产组合逐步变化轨迹:
$$
w0 \to w1 \to w2 \to \cdots
$$
- 超参数调优:基于交叉验证网格搜索,优化拟合仓位的平均绝对误差(MAE),结合行业经验优先放宽高换手率资产的惩罚,提高敏感度。
- 模型优势:通过分离不同资产的正则项,减少传统lasso的统一惩罚过度简化问题,更加贴合真实换手行为。
- 技术难点:调参复杂,依赖大量历史数据及准确仓位披露,模型对异常市场事件的泛化能力存在不确定性。
[page::5]
---
3. 探测“固收+”基金资产组合历史回溯
3.1 混合债券型二级基金
- 资产涵盖:主要关注A股、转债、信用债和利率债四大资产,港股因占比低未作为重点。
- 模型训练与验证:在头部基金公司(产品数量排名前5)半年度基础上调整超参数,追踪2017年末至2022年中月度资产配置拟合与季报披露的对比。
- 图3(A股仓位变化)说明:
- 拟合值与报告值整体趋势高度一致,拟合值略高于披露值,说明模型有效捕捉A股仓位变动。
- 2018年初至2019初仓位较低,2020年开始稳步上升,2021年后维持在15%-20%区间。
- 图4(转债仓位变化)说明:
- 拟合与报告数据吻合度非常高,反映模型对转债资产的探测准确性。
- 转债仓位经历2017年末到2020年初快速增长峰值约20%,后逐渐下滑至10%-15%。
- 方向性正确率(图5):
- A股方向性在时序上达到72%,22H1截面上更优,达到89%(时序)和67%(截面)。
- 这表明模型能有效区分股票仓位的加减趋势,对转债仓位的准确度也较高。
- 数据前向填充技巧保证了季报数据时间点的连续性,增强了模型拟合的时间序列完整性。
[page::6][page::7]
3.2 偏债混合型基金
- 延续混合债基超参数:说明此类基金资产组合变动更复杂,单一超参数可能适应性不足。
- A股仓位(月度拟合与报告)比较(图6):
- 拟合值与报告值较为接近,但波动幅度大于混合债基,显示其更灵活的投资动作。
- A股仓位总体在15%-25%波动,2020年中达到峰值。
- 转债仓位(图7):
- 拟合值基本贴合报告值,转债仓位在2019-2020年间达到最高,随后逐渐回落到5-10%。
- 方向性正确率(图8):
- A股时序方向性正确率61%,截面提高到81%;转债截面正确率61%,时序更高达83%。
- 相比混合债基,偏债基金更难用统一超参数拟合,反映其资产变动的复杂性。
[page::7][page::8]
---
4. 最新一期结论
4.1 最新整体二级债基资产组合暴露
- 样本:选取拟合效果较好的混合债券型二级基金。
- 分析区间:2022年6月30日至11月30日,使用2021年底至2022年中训练的超参数。
- 资产组合动态(图9):
- 头部基金转债仓位整体呈现下跌趋势,股权仓位则小幅上升,从大约15.5%增至16.3%。
- 同期重仓指数收益下跌约2.9%,反映新进股票资产并非市场上涨驱动。
- 整体二级债基股票仓位则略有下降,显示头部基金增仓策略更为积极。
- 基金重仓指数呈现波动下跌走势,暗示风险偏好变化。
- 个体基金股票仓位变动分布(图10):超过20%的基金股票仓位增加超过5%,超过73%的基金增仓超过1%。
- 转债仓位变动分布(图11):约50%的基金转债仓位为正向变动,明显持平或略有减少。
- 预测方向性正确率:股票约71%,转债约60%,模型较好捕捉近期资金流向。
[page::9][page::10]
4.2 可投港股二级债基资产组合暴露
- 样本界定:港股通股票市值占比大于1%的基金(约占样本6%)。
- 资产仓位变化(图12):
- A股仓位自14%上升到18%。
- 转债仓位小幅下降,整体维持约9%左右。
- 港股仓位变化不大,徘徊在1%-3%之间,确认港股配置相对稳定。
- 说明:头部基金在A股端积极加仓的同时,可投港股部分维持持平,体现重心偏向A股市场。
[page::11]
---
三、图表深度解读
- 图3-4 & 图6-7(资产仓位拟合与报告值对比):折线图对比拟合值(模型估计结果)与季报报告值趋势,均显示较好匹配,体现模型有效捕捉资产组合趋势的能力。A股及转债仓位细微波动和周期性高低点均被成功追踪。
- 图5 & 图8(方向性正确率表格):以表格形式呈现时序与截面方向性“正确率”,即预测与报告仓位变动方向的一致比例,展现模型在不同时间维度捕捉资产变动趋势的能力,均维持在60%-90%之间。
- 图9(2022年中至末期资产仓位动态):横轴为月份,左轴为股票及转债仓位百分比,右轴为基金重仓指数收益率。图表清晰呈现头部基金对股票做出加仓动作,而整体市场则反向下跌的对比,反映其主动操作能力。
- 图10-11(仓位变动直方图):通过直方图分布揭示股票与转债仓位正负变动基金数量分布,直观呈现“固收+”基金加仓仓位的普遍情况和分布态势。
- 图12(可投港股基金资产组合变化):多条折线显示转债、A股及港股仓位变化,反映港股仓位稳定但A股显著增加的动态。
总体图表支撑文本中模型拟合有效性和实证结论的可靠性,展示了资产类别间仓位波动和结构性变化的时间序列及截面特征。
---
四、估值分析
- 本报告核心为投资组合结构的探测与分析,无直接公司估值内容,未涉及传统估值模型如DCF、市盈率等。
- 估值的意义转化为对基金资产组合风险偏好及仓位变化的理解,重点放在仓位预测准确率与组合结构变化的洞察。
---
五、风险因素评估
- 历史数据滞后风险:报告武断依赖年份历史数据和季度半年报披露,存在信息延迟,可能无法及时捕捉快速变化。
- 数据准确性风险:使用第三方数据提供的资产指数与基金披露数据,存在误差或不完整风险。
- 模型局限性:改进lasso基于历史关系,有统计属性但无法完全模拟现实复杂的市场环境,尤其极端市场条件下解释力不足。
- 历史规律失效:市场结构或监管变化可能导致过去有效的规律不再适用,模型需动态调整。
- 解释力有限:模型估计的权重为统计意义上的拟合,不代表真实投资决策,投资者需谨慎解读。
- 无缓解策略详述:报告提示风险但未专门说明缓解对策或风险发生概率。
[page::0] [page::11]
---
六、批判性视角与细微差别
- 稳健性考虑:模型优先照顾高波动资产,可能导致对低波动资产估计不足,影响部分类别资产解析。
- 超参数依赖:基金公司的差异影响调参效果,偏债基金较为灵活导致单一超参数难有普适效果。
- 港股通指数简化:仅构造单一港股通指数,忽略港股市场内板块/行业异质性,降低组合探测细度。
- 数据更新频率与模糊期:半年或季度报告带来数据更新延迟,部分短期仓位变动可能被忽视。
- 模型对极端行情敏感性不明:虽述模型在极端情形下解释力不足,但具体在2022年市场波动剧烈时的表现未详尽分析。
- 方向性正确率偏差:部分正确率低于65%的时序探测存在一定误差,应结合其他监测工具辅助判定。
- 报告中信息未涉及投资建议评级,难以直观看出作者对基金资产配置趋势持明确判断,仅提供分析工具和数据支持。
- 整体上报告结构严谨、数据详实,辅助理解具备较高价值。
---
七、结论性综合
本报告以机器学习改进lasso模型为技术核心,结合多源底层资产指数,创新性地实现了对固收+基金—混合债券型二级基金和偏债混合型基金两类产品资产组合的高频实时探测。基于2017年底至2022年中历史数据的深度建模,报告验证了模型的拟合能力和对仓位变化方向的有效预测,尤其在头部基金及主要资产如A股和转债的拟合中达到较高方向性正确率(60%-90%区间)。
通过图表数据,报告详细展示了基金在各资产类别上的仓位演变轨迹,捕捉到明显的结构性变动趋势:
- 头部混合债基股票仓位自疫情后逐步回升,转债仓位经历波峰后整体回落。
- 偏债基金资产变动更为活跃,模型拟合准确率相对较低,显示其灵活运作特征。
- 2022年10月以来,头部基金明显加仓股票,整体基金股票仓位微幅上升,逆市押注改善,显示出“聪明资金”积极布局信号。
- 可投港股基金持仓稳定,股票端加仓主要集中于A股市场。
报告在数据采集、模型构建、调参优化及实证回测方面体现出较高的专业性和技术深度,所提方法和结果为市场参与者洞察固收+基金的资产配置行为提供了有益工具和参考。
风险方面,报告客观提示模型依赖历史数据和公开披露,存在滞后与局限性,极端市场下解释力不足,提醒用户理性解读。
综上,报告强调固收+基金的量化资产组合探测可为投资者提供领先的仓位变动及行业配置信号,展示了机器学习方法在固收+领域的有效应用潜力,并为未来基金管理和风险监控提供了坚实的数据支持与技术路径。[page::0][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11]
---
致谢
感谢中泰证券研究所发布的详实报告,提供公开完整的模型、数据和实证结果,为本次解析提供可靠依据。