BigQuant 2026年度私享会

新版保温杯LGBM存模型

由bq5campb创建,最终由bq5campb 被浏览 4 用户

笑宇老师新版保温杯策略是一套非常经典实用的机器学习滚动训练框架,可在此框架上进行魔改。原模型使用的是XGB模型,实际使用时如果回测期较长的话,耗时比较长,笔者将模型改为基于LightGBM 机器学习模型,用于快速验证魔改效果。同样使用2C/8G情况下,XGB跑5年数据常常宕机,LGBM实测十几分钟就跑完了,而且预测效果也差不多,但时间节省一半以上,可以为未来上实盘选因子节省时间。

一、 核心框架与业务逻辑

  1. 策略流程闭环:完成「数据获取→模型训练 / 加载→收益预测→定期调仓→绩效回测」的完整量化策略链路,可直接运行生成绩效报告。

  2. 核心逻辑:基于股票估值、动量反转、流动性三大类因子,用 LightGBM 回归模型预测股票未来 5 日收益排名(

    label
    

    ),筛选预测分数前 10 的标的进行等权持仓,每 5 个交易日调仓一次。

  3. 回测配置:默认以 2025-01-01 至今为回测周期,初始本金 20 万,设置了符合 A 股实际的交易手续费(买入 0.03%、卖出 0.13%,最低 5 元)。

二、 显著技术特点

  1. 多因子特征体系完善
    • 构建了 8 个结构化因子,覆盖估值因子、动量反转因子、流动性因子三大类经典量化选股维度,因子均做了当日横截面排名标准化,降低市场整体波动干扰。
    • 标签设计合理:以未来 5 日收盘价相对次日开盘价的收益排名作为预测标签,贴合 5 日持仓的策略周期,更具实战性。
    • 数据预处理严格:通过 SQL 过滤剔除 ST 股、风险警示股、停牌股、上市不足 120 天的次新股等垃圾标的,提升样本有效性。
  2. 机器学习模型落地成熟
    • 选用 LightGBM 回归模型,配置了合理的基础超参数(学习率、子采样、叶子节点数等),支持

      force_col_wise
      

      提升小样本训练效率,适合量化场景的高维因子数据。

    • 模型支持定期重训练:每 90 个交易日自动重训一次,兼顾模型时效性和计算效率,避免因子失效导致策略退化。

    • 训练效果可量化:输出训练集 R² 评分,便于监控模型拟合效果,及时发现模型过拟合 / 欠拟合问题。

  3. 工程化设计贴心,可扩展性强
    • 参数集中管理:将模型参数(

      LGBM_PARAMS
      

      )和策略参数(

      STRATEGY_PARAMS
      

      )分离集中配置,便于后续调参优化,无需修改核心业务代码。

    • 模型持久化存储:训练完成的模型以「模型名 + 毫秒级时间戳 + 训练次数 + 日期」命名,保存到指定目录,支持离线加载最新模型进行预测,解决二次运行无内存模型的问题。

    • 完善的日志输出:关键节点(持仓市值、模型训练 / 加载、调仓详情)均有打印日志,便于排查问题、复盘策略运行过程。

    • 全局统计监控:记录模型训练次数、累计交易笔数、调仓次数,便于后续策略绩效归因分析。

  4. 调仓机制
    • 定期调仓:每 5 个交易日调仓一次,平衡交易频率和手续费成本。
    • 等权配置:买入标的采用等权分配仓位,降低单一标的黑天鹅风险,简化仓位管理。
    • 先卖后买:调仓时先清仓非目标持仓,再建仓新目标持仓,逻辑清晰,避免仓位超限。

三、 待优化与可提升点(补充)

  1. 因子层面:可加入自研因子、高频因子。

  2. 模型层面:无超参数自动优化(如网格搜索、贝叶斯优化),无模型验证集(仅用训练集 R² 评估,易过拟合)。

  3. 调仓层面:无止损 / 止盈机制,无流动性筛选(可能选中无法成交的小盘股),等权配置可优化为基于预测分数的加权配置。\n

    下方是分享代码:

    https://bigquant.com/codesharev3/7239e474-175b-4157-b614-007f4fcd240d

    \n

\

标签

量化策略
{link}