可转债研究系列之(二)应用遗传算法构建的可转债策略
创建于 更新于
摘要
本文应用遗传算法基于可转债量价及基本面信息挖掘因子,通过非线性因子合成和策略优化构建多因子周度调仓策略,实证显示持仓10个加权策略年化收益35.3%,夏普1.43,最大回撤19.5%,显著超越传统等权和中证转债,且策略在样本外2024年验证保持优异表现,适合不同投资者操作需求,策略优化揭示持仓个数与仓位分配对收益和回撤影响显著,保留极值有利策略效果提升。报告充分展示遗传算法在可转债量化投资中的应用优势和模型稳健性 [page::0][page::3][page::4][page::5][page::13][page::17][page::19]
速读内容
遗传算法优势及模型设定 [page::3][page::6][page::7]
- 遗传算法具备全局搜索、非线性建模、多目标优化和自动生成能力,相较线性回归和随机森林更适合复杂因子挖掘。
- 设计双层因子运算体系,采用加减乘除与时间序列窗口统计量运算捕捉量价关系。
- 以收盘价收益率(Y1)、开盘调仓收益(Y2)和日内波段收益(Y3)作为多目标测试变量。
- 模型超参数设置详见表5,采用Pearson相关系数(IC)评价适应度,训练集2018-2021年,测试集2022-2023年,样本外2024年。
因子表达与筛选 [page::8][page::9][page::10][page::11][page::12]
- 挖掘 Y1 目标的因子在训练集和测试集表现较好,因子线性合成后采用相关性矩阵剔除高共线性因子,选择单调性强且表现优秀的因子(如F10, F14, F19等)。
- 多组因子分组日度回测结果(表9-11)显示因子稳定超额收益,分组超额收益在样本外也保持一致。
- 因子回测统计显示多个因子累计净值和夏普比率突出,高组别因子值对应更优收益表现。
策略构建与优化过程 [page::4][page::12][page::13][page::14][page::15][page::16]
- 提出四个基于因子合成的可转债策略,分别对应持仓10个和约50个仓位,采用等权和加权两种仓位分配方式。
- 策略周度调仓,交易成本考虑0.01%手续费及0.2%滑点,最小交易单位1手(10张)。
- 因子合成中,线性+权重优化策略净值最高,非线性合成提升组合整体表现,但削弱第十组进攻性。
- 持仓数10个为策略局部最优,5个持仓表现较差,持仓50个策略更适合机构投资者且胜率更高。
- 保留极值因子优于去极值策略,去极值降低选债能力和净值表现。







策略表现统计 [page::4][page::5][page::17][page::18]
| 策略 | 回测净值 | 年化收益率 | 年化超额 | 年化波动率 | 贝塔 | 阿尔法 | 夏普 | 胜率 | 周胜率 | 盈亏比 | 最大回撤 | 最大回撤起止 |
|----------------|----------|------------|----------|------------|------|--------|-------|--------|--------|--------|----------|----------------------|
| 持仓10个等权 | 8.02 | 33.8% | 27.68% | 23.2% | 1.41 | 0.260 | 1.37 | 55.5% | 53.8% | 1.94 | 21.2% | 2023-06-19 - 2024-02-05 |
| 持仓10个加权 | 8.68 | 35.3% | 29.16% | 23.3% | 1.40 | 0.275 | 1.43 | 55.7% | 53.0% | 2.00 | 19.5% | 2023-06-19 - 2024-02-05 |
| 持仓约50个等权 | 3.55 | 19.4% | 13.28% | 18.0% | 1.31 | 0.120 | 0.96 | 56.3% | 52.5% | 1.51 | 17.6% | 2022-01-04 - 2022-04-25 |
| 持仓约50个加权 | 4.54 | 23.5% | 17.43% | 19.2% | 1.33 | 0.161 | 1.12 | 57.7% | 54.4% | 1.64 | 18.5% | 2023-08-07 - 2024-02-05 |
| 转债等权 | 2.00 | 10.2% | 4.06% | 14.9% | 1.18 | 0.033 | 0.55 | 53.6% | 53.8% | 1.26 | 21.5% | 2022-08-15 - 2024-09-18 |
| 中证转债 | 1.53 | 6.1% | 0.00% | 11.5% | 1.00 | 0.000 | 0.36 | 53.0% | - | 1.21 | 17.0% | 2022-01-04 - 2024-09-18 |
- 持仓10个加权策略在收益、夏普、盈亏比及最大回撤上表现最优。
- 机构侧持仓约50个策略胜率更高,操作体验更佳。
- 策略年度表现稳健,除2018年外均录得正收益,2021和2024年表现尤为突出。
量化因子构建及策略概要 [page::3][page::4][page::7][page::12][page::17]
- 因子基于量价及正股Barra市值,综合加减乘除运算及时间窗口统计量进行构造。
- 因子筛选通过相关性考察和日度回测验证,剔除高相关性因子提升组合稳健性。
- 策略分为持仓数10个和约50个,仓位分配有等权与加权,适配不同投资者需求及交易方式。
- 回测包含手续费、滑点及最小交易单位,周度调仓确保策略实时适应市场变化。
- 样本外测试验证了策略对市场环境变化的适应性,表现持续优异。
深度阅读
金融工程研究报告《可转债研究系列之(二)应用遗传算法构建的可转债策略》详尽分析
---
一、元数据与报告概览
- 报告标题:《可转债研究系列之(二)应用遗传算法构建的可转债策略》
- 发布机构:江海证券研究发展部
- 分析师:梁俊炜(执业证书编号:S1410524090001)
- 发布日期:2025年初(具体未注明,报告内含2025年部分数据)
- 研究主题:可转债投资策略构建,基于遗传算法进行量价及基本面因子挖掘与策略优化,适配不同投资者群体。
- 相关研究:
- 《可转债研究系列之(一)基于传统双低策略的优化》
- 《量化因子掘金系列(三)遗传算法因子挖掘与因子非线性合成》
核心论点与投资建议:
该研究核心在于利用遗传算法挖掘可转债的有效因子,构建多种策略并对策略进行逐步优化,表现优异,超越传统等权和指数基准。四套策略适合不同投资者和交易场景,实现年化收益显著提升。其中,"持仓数10个加权"策略表现尤为突出,回测年化收益35.3%,夏普1.43,且最大回撤控制在19.5%以内。整体报告给出积极的策略建议,强调策略的稳健性及适应性,同时提醒投资者风险。本报告重点展示了遗传算法在复杂非线性因子挖掘上的优势,为可转债多因子策略提供创新路径[page::0,3,4,19]。
---
二、章节深度解读
1. 研究概要
- 研究背景:可转债兼具债券稳定收益和股性弹性特征,传统双低策略(低转股溢价率与低久期)效果有限,需更智能化因子挖掘方法。遗传算法具有全局搜索、多目标优化、非线性建模和自动化生成特点,能克服线性模型局限[page::3]。
- 方法对比(表1):
- 线性回归无法进行全局搜索或非线性建模
- 随机森林允许非线性但缺乏多目标优化和自动化生成
- 遗传算法支持全局搜索、非线性建模、多目标优化且自动化生成因子
- 研究概要:结合遗传算法与Barra市值因子(体现小市值正股的超额收益),整体构建非线性、动态调整的多因子策略框架[page::3]。
2. 因子挖掘
- 研究基于可转债的日度量价数据(交易金额、开盘收盘价等)及部分基本面数据(正股Barra市值因子、转股比例、转股溢价率、传统双低因子等),以辅助基因算法构建复合因子。
- 表3明确展示了各底层因子的含义和计算方法,交易金额(money)和Barra市值因子(size)为最核心变量。
- 模型设定部分(节2.3)介绍遗传算法如何通过双层运算架构(如加减乘除函数及统计量)构建复杂因子表达式,适应非线性动态市场。
- 目标变量Y分为三类:Y1为收盘价收益率,Y2为开盘调仓收益率,Y3为t+1日的开盘收盘收益率比,采用Pearson相关系数评估适应度(IC)。实验当中,Y1因子稳健性最佳,Y2存在过拟合风险,Y3性能介于两者之间[page::5,6,7]。
3. 因子筛选与回测
- 对所有挖掘出的因子进行了日度回测筛选,重点观察因子分组的超额收益表现。
- 表9-11展示了Y1、Y2、Y3因子在训练集、测试集及样本外阶段的超额收益率,Y1因子整体表现更平稳且持续性更好。
- 因子处理环节采用市值加权的标准化和归一化,努力消除量纲分布偏差,提升多因子合成效果。
- 相关性矩阵(表12)用于删减共线性较高的因子,筛选出3个相关性较低、分组表现较优的因子(F10、F14、F19)。
- 表13-15详细给出这三大因子分组的净值表现、年化收益率、夏普率、最大回撤等多维指标,显示出良好的风险调整收益能力,且对比基准如转债等权和中证转债均表现优越[page::9,10,11].
4. 策略优化过程
- 通过因子筛选(图2)、共线性处理(图3)和权重优化,策略表现逐步提升,最终策略组合净值显著优于基准。
- 非线性合成与线性合成对比分析(图4,5)显示,非线性增强了各分组的整体表现,但削弱了最优组(第十组)的锋芒,提示非线性合成需平衡进攻性与稳健性。
- 持仓个数(图6)对策略表现有显著影响,显示先增后减的局部最优效应,10支持仓在多因素权重优化下表现最佳,避免过度集中或稀疏带来的风险或收益损失。
- 极值处理(图7)显示对极值的去除反而损害了策略表现,保留极值信息可以提升因子及策略的区分能力,反映本模型对数据特性的敏感处理策略[page::12-16]。
5. 策略结果分析
- 图8和表16详细展示了最终四套策略(持仓10个/50个,等权/加权)在2018年至2025年期间的累计净值增长及风险收益指标对比。
- 样本外2024年表现尤其出色,年化收益达45.4%,策略稳健性与适应性得到验证。
- “持仓数10个加权”策略整体最优,年化收益35.3%,年化超额收益达29.16%,夏普比率高达1.43,最大回撤仅19.5%,显著优于转债等权和中证转债。
- 持仓约50个策略更适合机构投资者,胜率更高,投资体验更优,风险收益表现相对温和。
- 表17进一步细化年度表现,四策略2018年唯一亏损年份,后续年度均实现正收益,尤其2021年和2024年表现突出,最大回撤相对于收益水平较低,符合稳健投资要求[page::16-18]。
6. 总结与风险提示
- 该研究证实遗传算法在可转债因子挖掘中优势明显,能够捕捉传统双低策略难以识别的市场异象和非线性特征,提升因子信息量和策略收益。
- 策略同时满足机构和个人投资者需求,支持多样化持仓和灵活仓位分配,针对不同投资风格设计差异化解决方案。
- 强调收盘价收益率因子稳健可持续,持仓数量中庸(约10只)可实现风险与收益平衡,非线性合成提升整体表现但需谨慎组合设计。
- 策略超额收益依赖市场波动性,低波动环境下需严格仓位管理,未来研究或关注因子权重动态调整以提高鲁棒性。
- 风险提示充分指出模型构建、参数估计、假设前提及历史数据不完美预测未来的局限,提醒投资者结合实际情况审慎使用本报告内容[page::18-19]。
---
三、关键图表与数据深度解读
图1 可转债遗传算法因子策略(周度调仓)
- 该图对比了四个遗传算法策略(持仓10个/50个,等权/加权)与转债等权和中证转债指数的累计净值表现。
- 时间跨度从2018年至2025年初,净值基点设为1。
- 视觉上,策略净值稳步上升,波动幅度明显高于基准,且样本外期(2024年以后)加速增长。
- “持仓10个加权”策略净值最高,显著领先其他组合和指数,表明该策略优化后的仓位分配取得明显超额收益。
- 该图佐证研究对仓位数量及加权方法的论断:适度集中持仓配合加权分配更能捕捉市场机会[page::4]。
表2 策略表现对比
- 该表详细量化策略间的多项指标差异,包括年化收益率、超额收益、波动率、Beta、Alpha、夏普比率、胜率、盈亏比和最大回撤。
- “持仓10个加权”策略收益率35.3%,超额29.16%,夏普1.43,最大回撤19.5%。
- 对比基准中证转债指数收益率6.1%,超额收益优势明显,夏普和最大回撤均处于理想区间。
- 其中Beta >1说明策略波动性大于市场,衡量为积极进攻型策略。
- 盈亏比2.0表明每获利一单位对应损失0.5单位,风控表现出色。
- 数据直观反映了投资组合的风险调整后优异表现[page::5,17]。
因子表达式(表6至表9)
- 多个利用遗传算法构建的复合表达式因子例子,涉及trigonometric函数(sin, tan)、时间序列统计(tsmean, tsstd)、基础运算(min, neg, inv)等,体现非线性与时间序列结合。
- 训练测试集显示因子IC(信息系数)普遍在0.04至0.06之间(部分最高0.08),对应的IR(信息比率)也表现稳定,表明因子具备一定预测能力。
- 以收盘价收益率Y1为目标的因子更稳健,开盘价收益Y2因子虽表现较好但存在可能过拟合迹象,结合表10-11的分组超额收益情况做进一步筛选与剔除。
- 表12的相关矩阵确认筛选了低相关性的因子集合,提升组合多样性与信息量[page::8-11]。
因子筛选优化过程(图2,3)
- 图2显示因子筛选和权重优化对累积净值的正向影响。
- 图3通过左(去除前)右(去除后)两张图对比,揭示了共线性去除有效强化了核心组别性能,降低噪音,使第十组因子表现更突出,验证了因子筛选过程中降维的必要性[page::13]。
线性与非线性合成对比(图4,5)
- 图4净值表现表明非线性合成方法(maxICIR)提升了整体收益率水平。
- 图5分组表现显示非线性增强了平均水平,但减弱了最优组的锋芒,意味着非线性合成需要权衡进攻与保守,避免过度平滑带来的策略锐度损失[page::14]。
持仓数量与极值处理(图6,7)
- 图6展示不同持仓数量对策略净值表现的影响,10支持仓表现最佳,之前少量持仓(5支)或等分前10%的做法均不如10支组合稳健。
- 图7对比极值处理情况,表明保留极值可以增加模型信息量,削弱极值反而降低了策略区分度和收益水平,体现对极值的特殊处理需求[page::15,16]。
最终策略净值表现(图8)与年度统计(表16,17)
- 图8展示最终策略(四个不同持仓及权重组合)净值走势,一致优于市场基准。
- 表16详细量化了策略指标,强化了策略的优越性和稳定性。
- 表17年度绩效显示,策略除2018年小幅回调外,其他年份均有稳定甚至爆发性收益,夏普和Alpha指标表现出色,认同组合策略的持久有效性[page::16-18]。
---
四、估值分析
报告本质为策略和量化模型研究,未涉及对某单一股票或可转债标的的估值分析,因此无传统DCF或PE估值。目前策略估值体现在风险调整收益指标(夏普、Alpha、Beta)及最大回撤对投资价值的描述,重点反映策略预期收益与风险配置平衡。
---
五、风险因素评估
- 模型风险:参数估计、模型构建方法可能有误差,尤其基于历史数据的假设未必适应未来市场。
- 过拟合风险:检测到Y2目标收益因子存在过拟合风险,策略设计中有意识剔除或优化。
- 市场风险:策略表现依赖市场波动性,低波动震荡市场可能削弱策略超额收益,需要结合仓位控制。
- 其他:动态市场环境变化、基于量价和基本面数据的模型可能面临数据滞后或异常情形。
- 投资者需结合实际市场与专业意见谨慎使用报告结论,避免盲目跟随[page::0,19]。
---
六、批判性视角与细节审慎
- 报告高度聚焦遗传算法,明显对该方法持积极态度,但对可能存在的计算资源消耗、参数敏感性没有过多披露,未完全展现算法潜在限制。
- Y2因子被判断过拟合,但相关技术细节和具体处理措施未详述,投资者应关注策略稳定性验证。
- 极值保留策略虽提升表现,但是否在不同市场或极端行情仍优有效需持续验证。
- 不同持仓数表现的先增后减规律体现了数据驱动风险,作者谨慎设置10支持仓的设计符合业界经验,但最后持仓构建的动态调整逻辑尚未详细阐述。
- 年度与样本外表现优异,但历史数据时间较短,对极端市场环境下策略稳健性未知。
- 文章未提供明确投资评级,但整个报告基调偏积极,读者需结合自身风险偏好判断接纳程度[page::0,19,20]。
---
七、结论性综合
本报告由江海证券研究团队梁俊炜主导,详细介绍了基于遗传算法的可转债多因子挖掘和策略构建过程,涵盖因子设计、筛选、线性与非线性合成、持仓数和极值处理等多个投资关键环节。遗传算法以其全局搜索与非线性建模能力,规避传统方法局限,实现了稳健且显著优越于市场基准的策略收益。
具体优势如下:
- 多因子策略年化收益率达35%以上,夏普远高于基准,最大回撤控制在20%以内。
- 适配不同投资者需求的多样化策略设计(个人10支持仓与机构50支持仓)。
- 因子筛选体现非线性合成与共线性去除的有效结合,使策略更精准且风险更可控。
- 样本外2024年数据验证了模型较强的市场适应性。
- 通过引入正股Barra市值因子捕捉小盘弹性机会,提升因子预测效力。
- 详细的风险提示强化了投资者风险意识,提醒慎重决策。
图表数据贯穿描述了策略优化背后的多维度表现和演进过程,特别是图1、2、4、6和8与表2、13-17共同构筑了策略有效性和超额收益的坚实实证基础。策略优势及风险均被全面阐释,体现专业且科学的量化研究方法。
总体来说,该报告提出了一套创新且实用的可转债投资解决方案,对行业量化投资研究有重要参考价值,适合资本市场投资者做为策略参考和模型构建蓝本[page::0,4-5,9-18,19]。
---
附:全文关键图表示例(Markdown)
- 图1 可转债遗传算法因子策略(周度调仓)

- 图2 因子线性合成的优化过程

- 图3 共线性去除前后的分组回测结果

- 图4 因子线性与非线性合成的净值对比

- 图6 持仓个数的变化对比

- 图7 去极值的处理对比

- 图8 可转债遗传算法因子策略最终呈现

---
【全文溯源页码】
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]