`

新股上市首日卖出策略研究

创建于 更新于

摘要

本报告针对注册制新股上市首日无涨跌幅限制的制度背景,研究了基于单一时间点卖出、固定涨幅卖出及分类卖出等策略,结合14项股票特征,采用时间序列交叉验证训练随机森林及XGBoost模型对新股进行类别预测,应用不同卖出策略。结果表明,XGBoost模型结合分类卖出策略2实现了最高的累积收益791.82%,显著优于基准709.03%,且稳定性较高,证明分类卖出策略在新股首日交易中具备显著优势 [page::0][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17]

速读内容


注册制新股上市首日交易制度及样本情况 [page::3]


  • 注册制新股首日无涨跌幅限制,增加日内波动率,为日内卖出策略提供可能。

- 样本时间2019年7月22日至2021年7月5日,共453只注册制新股。

新股日内交易可行性分析 [page::4]


  • A股一般涨跌幅±10%限制和交易成本导致日内交易难盈利。

- 注册制新股首日均涨跌幅3.42%,扣交易成本后仍有盈利空间。

简单卖出策略:固定时间和固定涨幅卖出最佳点确认 [page::5][page::6][page::7]





  • 最佳固定卖出时间点为11点08分,累计收益498.27%。

- 固定涨幅卖出最佳涨幅为46%,累计收益达99.34%。
  • 基准策略选择最佳涨幅卖出法。


分类卖出策略设计及新股特征介绍 [page::7][page::8][page::9]

  • 根据日内均价相对开盘价将新股分为Good和Bad两类。

- 四大类14个特征:行业、上市板块、财务指标、打新相关、首分钟股价信息。
  • 运用哑变量处理、归一化及二值化等数据预处理。


时间序列交叉验证方法及样本划分 [page::9][page::10]


  • 避免未来信息泄漏,样本按时间顺序划分训练集与测试集。

- 四轮训练-测试划分,累计训练样本361支股票。

机器学习分类模型及卖出策略组合 [page::10][page::11]

  • 对Bad类股票采用开盘后9:32卖出。

- Good类股票采用策略1(11:08前涨幅超46%卖出或11:08卖出)或策略2(收盘前涨幅超46%卖出或收盘卖出)。
  • 表4展示分类卖出策略详情。


决策树模型效果及弃用理由 [page::12]


  • 多次运行决策树模型,平均累积收益均低于基准,故弃用。


随机森林模型及收益表现 [page::13][page::14]




| 策略 | 胜率 | 累积收益区间 | 100次平均累积收益 |
|---------|------|-------------------------|------------------|
| 基准 | - | - | 709.03% |
| 策略1 | 0% | 470.69% - 603.95% | 529.16% |
| 策略2 | 87% | 638.63% - 850.09% | 753.15% |
  • 随机森林+策略2胜率高达87%,平均收益优于基准,实际累积收益746.51%。


XGBoost模型及收益表现 [page::15][page::16][page::17]




| 策略 | 胜率 | 累积收益区间 | 100次平均累积收益 |
|---------|------|-------------------------|------------------|
| 基准 | - | - | 709.03% |
| 策略1 | 0% | 598.38% - 628.69% | 625.89% |
| 策略2 | 100% | 765.36% - 793.50% | 790.05% |
  • XGBoost+策略2稳定性最高,胜率达100%,实际累积收益791.82%,超越随机森林及基准。


报告总结及风险提示 [page::17]

  • 分类卖出策略结合机器学习模型显著提升新股上市首日卖出收益。

- XGBoost模型表现最佳,能稳定提供超越基准的收益。
  • 风险提示:模型基于历史数据,市场具有不确定性,报告不构成投资建议。

深度阅读

新股上市首日卖出策略研究报告详尽分析



---

一、元数据与报告概览


  • 报告标题:新股上市首日卖出策略研究

- 发布机构:广发证券发展研究中心
  • 主要分析师:张超、安宁宁、罗军(首席分析师,华南理工硕士)

- 发布日期:未知(截至2021年7月5日的数据)
  • 研究主题:注册制下科创板和创业板新股上市首日交易策略,特别聚焦卖出时机与策略的优化。

- 报告核心论点:随着科创板和创业板推行注册制,新股上市首日不设涨跌幅限制,日内波动提升带来日内卖出策略可行性。通过机器学习分类方法(随机森林、XGBoost)对新股进行分类,并应用差异化卖出策略,可提升卖出收益。
  • 主要结论及目标

- 简单卖出策略(固定时间卖出和固定涨幅卖出)表现良好,固定涨幅卖出策略为主要基准,累积收益约709%。
- 机器学习分类卖出策略提升交易收益,其中XGBoost模型表现最佳,累积收益达791.82%,比基准策略高出约11.68%。
- 提示风险:模型基于历史数据,存在市场不确定性,报告不构成投资建议。

[page::0]

---

二、逐章深度解读



1. 新股上市首日的交易制度


  • (一)注册制改革背景

2019年科创板推出注册制,2020年创业板推行注册制改革。注册制区别于旧核准制,企业上市由市场和投资者决定,首日股票不设涨跌幅限制,导致价格波动加大,为投资者提供更多交易机会。本报告假设投资者持有打新成功的新股,在首日进行卖出研究。
  • (二)样本描述

样本涵盖2019年7月22日至2021年7月5日之间上市的注册制新股共453只,科创板30只,创业板423只(图1显示以时间为序的注册制新股上市数量,呈逐步增长态势)。

[page::3]

2. 新股上市首日日内交易的可行性


  • 传统A股有涨跌幅限制(±10%),且交易成本较高,导致日内交易难以覆盖成本,实现盈利困难;

- 注册制新股首日无涨跌幅限制,价格波动加剧;
  • 样本中首日涨跌幅平均3.42%,扣除千分之二的卖出手续费后依然具有显著盈利空间;

- 引用股指期货中的EMDT日内趋势交易策略作为对比,单笔交易收益仅0.14%难以抗衡成本,股票日内交易需更大波动支持。

[page::4]

3. 简单的首日卖出策略


  • 固定时间卖出

所有股票在同一时间点卖出,分析了首日9:31至15:00不同时点的平均收益率,计算交易成本为卖出千分之二。图3显示开盘初期收益呈负,约开盘后40分钟转正,峰值出现在11:08,平均单日收益最高达约3.5%。对应累积收益(单利累加)约498.27%(图4)。
  • 固定涨幅卖出

设定卖出阈值为涨幅,从1%至20%,当涨幅触及阈值即卖出,否则收盘卖出。收益峰值涨幅阈值为46%(图5),对应的累积收益为99.34%(图6)。
固定涨幅卖出累计收益较固定时间卖出明显更高,呈现策略优越性,后续研究以固定涨幅卖出作为基准。

[page::5,6,7]

4. 分类卖出策略


  • 分类依据

以新股上市首日日内均价与开盘价比较,将新股分为“Good(均价高于开盘)”和“Bad(均价低于开盘)”两类,样本中247只Good类和206只Bad类。
  • 卖出策略差异

- 对Bad类股票,因预期表现差,设定最早可卖出时间为9:32,选择当时卖出以规避亏损。
- 对Good类股票,则按照前述分析,实行两种卖出策略:
- 策略1:11:08前若涨幅达46%即卖出,否则11:08卖出;
- 策略2:收盘前若涨幅达46%即卖出,否则收盘卖出。
  • 结合上述,表4展示了两种分类策略的具体卖出安排。


[page::7,10,11]

---

5. 机器学习模型应用



(一) 新股特征介绍:



14个不同特征分为4类:
  • 基本信息特征:行业(6类哑变量)、上市板块(科创/创业板)、地区;

- 财务报表特征:上一财年ROE、净利润增长率、每股经营现金流/发行价;
  • 打新相关特征:超额认购倍数、中签率、回拨比例等7项,均归一化处理;

- 股价相关特征:开盘价相较发行价涨跌幅、首分钟换手率。

数据预处理包括哑变量处理、二值化、归一化,确保模型输入标准化。

[page::8,9]

(二) 时间序列交叉验证



为防止使用未来信息作弊,采用时间序列交叉验证,将数据分为5部分,逐步训练和测试,避免未来数据泄漏。训练数据累积递增,测试集是未来段(表2,图7详述验证流程),4次训练测试分期覆盖全样本。

[page::9,10]

(三) 基准策略表现


  • 基准1(最佳时间卖出):累计收益436.96%;

- 基准2(最佳涨幅卖出):累计收益709.03%,明显优于基准1(图8,表3)。

因表现差异大,后续以基准2作为后续模型评估对比基准。

[page::10,11]

---

6. 机器学习模型实证结果



决策树模型


  • 单棵决策树拟合数据,classification准确率中等;

- 多次训练后决策树策略1&2累积收益均低于基准(图9),策略效果不理想,故放弃单棵树模型。

[page::11,12]

随机森林模型(Bagging装袋算法)


  • 原理:多棵决策树集成,训练不同随机子样本,投票决定分类;

- 多次迭代和参数调优找最优模型;
  • 平均累积收益曲线显示策略2优于基准,策略1不及基准(图11);

- 策略2100次模拟中87次累计收益超越基准,平均收益753.15%,取值区间波动较大(表5);
  • 实际模拟应用时,集成100颗基分类树,经投票分类后,累积收益为746.51%,较基准提升5.29%(图12,表6)。


[page::12,13,14]

XGBoost模型


  • XGBoost采用梯度提升算法(Boosting),迭代训练每棵树弥补前一棵的不足,基分类器相关;

- 采用并行计算等多种技术优化计算速度和效果;
  • 多次重复训练策略2收益稳定压倒基准,策略1低于基准(图14,表7);

- 100次模拟中策略2均超越基准,胜率100%,平均累积收益790.05%;
  • 实际应用中,采用由100基分类器组成的集成分类器,累积收益791.82%,超基准11.68%(图15,表8);

- 总体对比,XGBoost较随机森林预测更稳定,收益更优。

[page::15,16,17]

---

7. 总结与风险提示


  • 经过多层策略演变,报告验证了固定涨幅卖出优于固定时间卖出,作为基准;

- 机器学习分类策略(基于一定新股特征体系)能进一步提升卖出收益,其中XGBoost策略表现最佳;
  • 采用时间序列交叉验证确保模型训练科学,模型稳定性强,预测准确率高;

- 报告强调数据和结果基于历史统计规律,不构成投资建议,市场存在不确定性;
  • 建议投资者慎重考虑具体实施风险。


[page::17]

---

三、重要图表深度解读



图1:近两年注册制新股上市数量

  • 反映2019年7月至2021年6月累计453只注册制新股陆续上市,从时间序列看,呈波动但总体平稳的新股发行趋势,支持样本充足性。


图2:EMDT策略历史累积收益

  • 显示一种股票期货日内多频趋势跟踪策略累计收益达500%以上,但单笔交易平均收益只有0.14%,揭示股票日内交易高交易成本阻碍盈利可能。


图3 & 图4:按固定时间卖出平均收益及累积收益曲线

  • 初盘波动剧烈,40分钟后由负转正,最大收益点在11:08,日内交易时点的重要参考,累计收益近500%偏低。


图5 & 图6:按固定涨幅卖出平均收益及累积收益曲线

  • 最大平均收益出现在涨幅46%,对应策略累积收益近1000%,远超时间卖出,突显盈利阈值设定重要性。


图7:时间序列交叉验证示意

  • 明确防止未来数据泄漏的交叉验证合理性,保障模型训练泛化。


图8 & 表3:基准策略累积收益

  • 详细比较两基准策略,确定基准2(最佳涨幅卖出)为后续比较基准。


图9:决策树模型平均累积收益

  • 低于基准表现,决策树单独模型稳定性不足。


图10:Bagging装袋算法示意

  • 间接说明随机森林集成方法原理。


图11 & 图12 & 表5 & 表6:随机森林100次平均及实际应用累计收益

  • 策略2效果好于基准,且表现稳定,实际累计收益达746.51%。


图13:Boosting提升算法

  • 说明XGBoost背后的算法流程。


图14 & 图15 & 表7 & 表8:XGBoost平均及实际收益表现

  • 证明XGBoost策略稳定性极佳,实际收益高达791.82%,显著优于基准。


---

四、估值分析



报告未涉及传统意义上的公司估值过程(如DCF或市盈率估值),核心聚焦于交易策略下的收益累积,即优化股票卖出交易时点和涨幅阈值以最大化短期收益。估值意义更多体现在收益策略的相对比较(基准与模型策略)而非公司价值本身测算。

---

五、风险因素评估


  • 市场不确定性:模型基于历史数据统计规律,未来市场波动及新股表现可能不同,存在失效风险;

- 模型局限性:机器学习模型的预测能力依赖于输入特征、样本质量及稳定性,存在过拟合或结构变更导致的预测偏差;
  • 执行风险:实际交易时存在操作延迟、滑点、流动性风险,真实收益可能低于模型预期;

- 样本及时期限制:研究样本截至2021年7月5日,且仅聚焦注册制下新股,市场制度或规则变动将影响适用性;
  • 报告声明:不构成投资建议,投资者需自行承担交易风险。


[page::0,17]

---

六、批判性视角与细微差别


  • 模型收益优势有限:随机森林策略2比基准收益仅高出5.29%,优势不明显;XGBoost虽提升显著(11.68%)但仍需考量过拟合风险及实际执行复杂度;

- 策略依赖单一卖出时间或涨幅设置:卖出时间策略较为刻板,且涨幅阈值设定(如46%)基于历史数据,未来可能不适用;
  • 风险披露较清晰,但未深入探讨潜在极端市场环境下策略失灵风险

- 报告未明确各算法训练模型的超参调整细节和准确率指标,机器学习模型具体性能衡量指标不足,影响透明度
  • 样本偏重创业板新股,科创板因样本量较小(30只),模型泛化能力待观察

- 文中出现少部分排版及符号轻微混乱,影响阅读流畅性,但不影响内容理解

---

七、结论性综合



本报告系统详尽地研究了中国注册制新股上市首日卖出策略,重点在于利用机器学习方法提升卖出收益。在无涨跌幅限制的制度背景下,实现日内交易盈利成为可能。

首先,报告通过统计分析确定最佳卖出时间11:08和最佳卖出涨幅46%,其中固定涨幅卖出策略累积收益(709%)远高于固定时间卖出(436.96%),后者作为对比基准。图表清晰展示了不同卖出时点和涨幅设置下的平均收益及累计收益趋势。

进而,将新股根据首日均价与开盘价的关系划分Good/Bad两类,针对不同类别制定差异卖出方案(Bad类9:32早卖,Good类依策略1或策略2卖出)。机器学习模型—决策树、随机森林和XGBoost被用以预测新股类别,避免机械统一策略的缺陷。

决策树模型表现不佳,随机森林模型在多次模拟中策略2胜率高达87%,累计收益优于基准;而XGBoost模型胜率达到完美100%,累积收益最高达791.82%。图表直观展现了这三种模型策略相较基准的收益优势和稳定性。

风险提示强调,模型仅基于历史统计学基础,市场实际复杂且多变,报告不构成投资建议,投资者需谨慎。

总体来看,报告逻辑严谨,数据详实充分支持结论;图表功能完善,强调了注册制新股高波动特征对于交易策略设计的重要性。以机器学习辅助卖出策略实现了收益和风险的有效平衡,尤其是XGBoost模型的强稳定性为策略实施提供了理论支持。同时,报告的风险意识清晰,可作为理解注册制新股日内交易策略发展的有力参考。

---

结论标注溯源



综合信息均来自报告中页码0-17,[page::0,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17],图表均有详细说明及数据支持,风险及声明部分见页17-19[page::17,18,19]。

---

附件关键图片举例



XGBoost策略累积收益曲线 [page::0]

XGBoost策略累积收益曲线

图3:新股按固定时间卖出的平均收益 [page::5]

图3:新股按固定时间卖出的平均收益

图14:XGBoost的100次平均累积收益曲线 [page::16]

图14:XGBoost的100次平均累积收益曲线

---

此详尽分析以结构化专业视角,覆盖报告全部重要内容、数据、图表并结合金融和机器学习术语解读,确保对投资者或策略研究者深刻理解报告提供帮助。

报告