`

温故知新:新股首日涨幅预测模型及卖出策略 类固收系列报告之四

创建于 更新于

摘要

本报告基于2009-2012年市场化发行阶段主板新股数据,系统分析影响新股首日涨幅的因素,构建线性回归和随机森林分类模型,实现对新股首日涨幅的有效排序和分类预测。结合科创板新制度,提出前5个交易日卖出策略,针对新股首日涨幅排序不同采取盯市或均价抛售策略,旨在为网下配售机构优化卖出时点提供量化参考和实操建议[page::0][page::3][page::6][page::7][page::14][page::17][page::18][page::19]

速读内容


新股卖出策略重要性与必要性 [page::3][page::6][page::7]



  • 科创板新股取消市盈率限制,前5日不设涨跌停,制度与2009-2012年市场化定价阶段最为相似,卖出策略尤为重要。

- 2009-2012年间首日交易限制宽松,新股走势存在显著分化,部分新股下午时段涨幅快速拉升,卖出时点把握影响收益率。

新股首日涨幅影响因素详解 [page::8][page::9][page::10][page::11][page::12]





  • 新股首日涨幅由定价偏差(行业市盈率与发行市盈率差异)和情绪偏差(市场情绪)共同驱动。

- 市盈率管制阶段首日涨幅主要来源于定价偏差,市场化阶段则以情绪偏差为主。
  • 重要影响指标包括网下超额认购倍数、发行价、发行后EPS、行业首日涨幅等。

- 股东性质(国有>民营>外资)、地域(西部>其他)和行业分类对首日涨幅有显著影响。

新股首日涨幅预测模型构建及效果 [page::13][page::14][page::15][page::16][page::17][page::18]




  • 线性回归模型选取9个解释变量,R平方0.36,预测值误差较高但能够较好排名新股涨幅,高预测涨幅组实际收益显著优于低组。

- 随机森林分类模型更适合精确挑选首日涨幅高的新股,前10-50%涨幅分位数阈值中,以0.7分位数表现最优。
  • 分类模型对样本外预测准确率可达60-80%,对涨幅超10%的新股识别率约80%。




科创板卖出策略建议 [page::18][page::19]

  • 科创板新股估值多元,首日交易制度新颖,预计前五日出清率高,破发概率低。

- 建议卖出时点控制在前5个交易日内;首批新股可基于回归模型涨幅排序,涨幅靠前者采用盯市策略,涨幅靠后者首日均价卖出。
  • 后续发行新股可结合首批交易特征调整策略,避免初期市场波动带来的不确定性。

深度阅读

报告分析:温故知新——新股首日涨幅预测模型及卖出策略(类固收系列报告之四)



---

1. 元数据与概览


  • 报告标题:《温故知新:新股首日涨幅预测模型及卖出策略 类固收系列报告之四》

- 作者:刘均伟(执业证书编号:S0930517040001),光大证券研究所
  • 发布日期:2019年4月(具体时间未详,最新研报数据截止于2019年二季度)

- 研究机构:光大证券研究所
  • 主题:聚焦科创板新股发行背景下的首日涨幅及其卖出策略,通过历史市场化定价阶段数据探讨新股首日涨幅的影响因素与预测模型,最终推荐针对科创板制定具体卖出策略。

- 核心内容
- 解析科创板新股制度对卖出策略的重要性;
- 基于2009-2012年市场化定价阶段数据构建新股首日涨幅预测模型(线性回归+分类模型);
- 研究涨幅的两个核心来源:定价偏差与情绪偏差;
- 启示科创板新股前五日卖出策略建议及风险提示;
  • 主要结论:科创板由于市场化定价及前五日无涨跌停限制,导致新股首日涨幅及后续表现分化明显;通过构建线性回归及随机森林模型对新股首日涨幅进行有效预测,建议投资者合理把握卖出时点,优选涨幅预测前列的新股进行盯市操作,卖出时机集中在上市5个交易日内,以稳健锁定收益。[page::0,3,5,6,7,13,14,16,18]


---

2. 逐节深度解读



2.1 科创板制度决定卖出策略重要性


  • 报告回顾证券市场2006年至今多阶段新股发行与交易制度(表1&表2),明确指出科创板制度特征与2012年4月至11月(T4阶段)最为相似:取消市盈率限制,首日无涨跌停,这一阶段新股首日涨幅和交易均较为充分,亦无锁定期。

- 然而,2014年后(T5,T6阶段)实行涨跌停限制(首日涨幅限制44%),新股多连续涨停,交易不充分,首日换手率极低(小于10%,最高约2.7%),此时卖出策略相对简单。
  • 市场化定价阶段(T2、T3、T4)新股破发率显著提高,发行市盈率普遍偏高,涨幅回落但分化显著,卖出时点选择尤为关键。

- 卖出策略重要性依制度环境变化而异,科创板采用市场化定价,首日无涨停规则,投资者需精细策略以提升回报。[page::3,4,5]

2.2 卖出策略必要性:初期溢价与日内分化


  • 通过图1展示不同阶段新股上市后相对行业基准超额收益走势,发现多数阶段(除T5)新股上市后长期表现不佳,特别是T1及T2阶段持续跑输,提示首日卖出较优。

- 对于市场化定价且首日无涨跌停限制阶段的样本(T2,T3第一阶段),首日股票日内走势分化显著(图2——30分钟箱型图),显示部分股票在下午交易时段出现快速拉升,意味着卖出时点甄别变得关键。
  • 综上,卖出策略研究满足实际市场需要,尤其科创板初期卖出策略对于收益影响显著。[page::6,7]


2.3 新股首日涨幅影响因素


  • 通过理论剖析(图3、图4),首日涨幅主要拆解为:

- 定价偏差:一级市场发行定价与行业估值偏差,受询价热情、投行定价偏好、行业市盈率限制影响。
- 情绪偏差:一级市场定价后,市场交易时段投资者情绪对价格的追捧或冷遇导致的价格偏离。
  • 报告显示,市盈率管制阶段涨幅主要由定价偏差驱动,市场化定价阶段由情绪偏差主导(图5,图6)。

- 影响因素综述(表4,表5),区分定价偏差与情绪偏差影响指标,涵盖财务指标、发行环节热度、价格规模、股权结构、行业地域、市场走势等。
  • 大股东性质对首日涨幅有显著影响,国有股首日涨幅显著高于民营及外资;地域西部公司涨幅最高;行业差异较小,金融制造略低(图7、8、9)。

- 非财务指标如网下超额认购倍数、发行至上市行业涨幅正相关,发行后EPS及发行价负相关(图10);财务指标中营运效率指标小幅正相关,盈利能力指标负相关(图11),表明高盈利能力企业首日涨幅趋于保守。
  • 系统地筛选关联指标为后续模型构建提供基础。[page::8,9,10,11,12]


2.4 新股首日涨幅预测模型


  • 线性回归模型(3.1节):

- 从100多项指标中,依据相关性、共线性和逻辑性筛选9个变量(6数值+3哑变量),例如发行价、发行后EPS、网下超额认购倍数、行业涨幅、大股东性质、西部地域等(表6)。
- 训练结果显示模型R²=0.36,模型参数均显著,负系数的发行价、EPS等指标反映估值相关性,正系数网下热度及西部地域显示市场情绪及结构影响(表7)。
- 预测结果显示模型预测误差较大,绝对涨幅预测能力有限,但预测涨幅排序效果良好,样本外IC均值达到0.57,IR为1.54(图13、14、15,表8)。
- 按预测排名分组,新股首日涨幅呈单调递减趋势,收益分组明显(表9,图16、17)。
  • 分类模型(3.2节):

- 采用逻辑回归和随机森林对新股首日涨幅进行分类,定义涨幅较高的标签(按涨幅分位数0.5~0.8阈值调整)。
- 随机森林优于逻辑回归,尤其在高阈值条件下(0.7至0.8分位),随机森林仍具较强判别能力,准确率高达约80%(图18、19,表10)。
- 该模型特别适用于捕捉日内涨幅超过10%的高拉升股票,样本内外均表现稳定。
  • 两类模型协同使用,回归模型用于排序筛选,分类模型准确识别高涨幅潜力标的。[page::13,14,15,16,17,18]


2.5 科创板新股卖出策略建议


  • 结合2009-2012市场化定价阶段的经验,科创板的新股卖出策略应重点考虑以下制度及市场效应的变化:

- 估值体系多样,缺乏统一市盈率标准,提高预测难度。
- 前5日无涨跌停限制,初期交易模式尚不稳定,有买卖双方博弈动态。
- 绿鞋机制的广泛应用有助于稳定首发初期股价,降低破发风险。
- 融券机制完整推行,增加空头力量但抑制初期炒作有限,更作用于中长期价值回归。
  • 建议:

- 以卖出时点严格控制在上市5个交易日以内为原则,大概率可以规避后期破发风险;
- 对首批大规模集中上市的新股,依模型预测涨幅排序,优先盯市高排位股票,耐心等待拉升机会;对低排位新股则采取首日均价卖出策略;
- 随着市场交易数据积累,应及时对新股涨幅预测模型进行修正与策略调整。
  • 风险提示集中于历史数据与模型假设的局限,未来制度变革或市场环境变化可能导致模型失效。[page::18,19]


2.6 附录与制度梳理


  • 附录详尽罗列了上海、深圳交易所自2007年以来首日涨跌幅及交易控制制度调整历史,清晰展示了T1-T6阶段制度演变;

- 广泛涵盖了影响因素的财务指标计算方法、行业及企业分类标准,为模型数据提供扎实基础;
  • 明确评级体系及分析师独立性声明,保障报告权威性和客观性。[page::19,20,21,22]


---

3. 图表深度解读



图1:不同阶段新股初期涨幅之后相对市场走势(第6页)


  • 展示各时期新股上市首日收盘价作为基准,未来一年半内相对所属行业基准指数的超额收益表现。

- T1、T2阶段新股持续跑输行业基准,跌幅达到20%-25%;而T5阶段特殊,持续跑赢,最高超额收益逼近20%。
  • 图显示大部分市场化定价后阶段新股难以维持长期超额收益,支持首日卖出策略。

- 该趋势反映了不同时期新股市场环境、制度和溢价空间的变动。[page::6]

图2:2009.7.10-2012.3.7新股日内走势(30分钟箱体图)(第7页)


  • 观察该市场化定价且无涨跌停严限制阶段新股首日每半小时股价变动。箱体图中显示出涨幅分布范围及异常值情况。

- 显著发现下午14:00后异常值(极端高涨幅股票)数量增加,说明部分新股首日存在快速拉升阶段。
  • 此走势差异提示卖出时点具有分化价值,及早捕捉上涨窗口极为重要。[page::7]


图3、图4:首日涨幅影响因素分析及分解示意图(第8页)


  • 图3为定价水平与市场情绪等因素对首日涨幅作用路径的框架图,清晰界定影响链条。

- 图4则以柱状图形式直观分解首日涨幅为定价偏差和情绪偏差两部分。
  • 该框架支持后续深入量化分析,逻辑清晰。[page::8]


图5、图6:定价偏差&情绪偏差历史变化(第9页)


  • 图5利用季度中位数统计展示2006-2019年定价偏差和情绪偏差的长周期趋势。

- 显示市盈率浮动管制对定价偏差影响显著,情绪偏差则表现出周期性的涨落。
  • 图6聚焦2009-2012年间月度数据,显示在市场化定价阶段定价偏差呈负值(即发行市盈率高于行业估值),情绪偏差波动更为活跃。

- 反映市场环境下制度变化对新股价格形成的双重影响。[page::9]

图7、8、9:股东性质、地域、行业对首日涨跌幅的影响(第11页)


  • 图7显示国有股的首日平均涨幅远超民营与外资,且波动较大,表明国有股可能更受市场关注。

- 图8显示西北、西南等西部地区新股涨幅明显高于东部及华北等地区,地域对市场情绪认同和资金关注度有影响。
  • 图9行业差异较弱,但制造和金融平均涨幅偏低,反映不同行业对投资者吸引力不同。

- 这些结果引入哑变量辅助模型解释力提升。[page::11]

图10、11:新股首日涨跌幅与非财务及财务指标的相关性(第12页)


  • 图10(非财务指标)显示股票发行后EPS和发行价与涨幅负相关,网下超额认购倍数和行业涨幅与涨幅正相关,显示市场热度及整体行情对涨幅的影响强烈。

- 图11(财务指标)揭示多数盈利指标负相关,营运效率如资金周转等正相关,显示资金效率高而盈利能力却暂时低的企业更容易获得首日溢价。
  • 该结果为变量筛选和模型构建提供关键支撑。[page::12]


图13、14、15:线性回归模型样本内、样本外预测效果及IC序列(第14、15页)


  • 图13、14的散点图显示预测与实际涨幅仍存在较大误差,体现线性模型的局限性。

- 图15的IC(信息系数)序列展现模型对涨幅排序的较好捕捉能力,尤其样本外表现优异。
  • 相关统计指标(表8)显示样本内外IC均值分别为0.48、0.57,IR表现稳定,说明模型具有良好的相对排名预测能力。

- 图16、17则展示按周分组涨幅走势,预测先验较好适配实际涨幅分布。
  • 该结果表明模型适宜用于新股涨幅排序辅助选股。[page::14,15,16]


图18、19、20、表10:分类模型效果分析(第17、18页)


  • 图18显示逻辑回归模型在预测高涨幅标签(根据分位数阈值设定)的F1Score表现随标签阈值上升而迅速下降,尤其阈值>0.7时几乎丧失预测能力。

- 图19随机森林模型在整个阈值范围内均有较高F1
Score表现,尤其在0.7-0.8为最佳。
  • 表10展示不同阈值设定下,模型对涨幅样本在样本内外的预测分类准确率及对应收盘、均价涨幅的区分度。

- 图20揭示分类模型对日内涨幅超过10%的高拉升新股预测能力,表现出高达80%的捕获率。
  • 综合判断,随机森林模型在实际操作中对捕捉短线高涨幅标的更具实用价值。[page::17,18]


---

4. 估值分析



本报告不直接针对公司估值做详细现金流折现或市盈率倍数估值,但对新股涨幅预测模型的输入变量中充分考虑发行价、行业市盈率、发行后EPS等估值指标,变相体现对估值因素的定价和偏离。模型结合市场情绪因素(发行认购热度、行业涨幅)平衡定价与情绪影响,从而实现新股涨幅的有效预测与排序。

---

5. 风险因素评估


  • 主要风险来自模型基于历史固定制度及市场环境(2009-2012)构建,未来科创板及资本市场制度可能发生新变化导致模型失效。

- 科创板估值体系复杂多样,缺乏成熟可比公司及统一估值参考,增加预测难度。
  • 前5日无涨跌停限制下的交易模式尚在磨合期,可能导致首日及后续行情波动超出历史规律。

- 绿鞋机制及融券制度对价格波动的影响尚难充分量化,潜在机制失效或强化的可能需实时关注。
  • 风险提示强调历史数据风险,提醒投资者审慎判断。[page::0,18,19]


---

6. 批判性视角与细微差别


  • 模型预测误差:线性回归模型预测首日绝对涨幅存在较大误差,主要发挥在排序筛选上,模型对个别极端涨幅事件预测能力不足,风险容忍度需注意。

- 样本与时间限制:模型训练基于2009-2012年数据,科创板作为全新市场,其交易行为、投资者结构、发行制度虽有相似但不可完全等同,存在制度差异的适用性风险。
  • 情绪偏差的周期性:情绪偏差表现出明显周期性和波动性,难以稳定量化,未来市场极端情绪环境或使模型失效。

- 指标单一与多变因素:财务指标相关度普遍较低,强调市场情绪,可能忽视某些公司基本面变化的长期影响。
  • 交易机制:新制下融券、绿鞋机制的实际执行效果及对首日交易的影响复杂,报告中评述带有一定假设性,实际可能波动。

- 总体而言,报告在逻辑框架严谨、数据支持充分的基础上,对科创板新股卖出策略给出务实建议,但也明确告知历史与制度变动风险。

---

7. 结论性综合



本报告深度研究了中国资本市场多阶段新股发行交易制度,针对科创板市场化定价及首日无涨跌停的新股环境,系统分析了2009-2012年市场化定价阶段主板数据,构建新股首日涨幅预测模型及卖出策略,提供机构投资者重要参考。
  • 制度结构决定卖出策略重要性,科创板与2009-2012年主板相似,市场化定价及无涨跌停限制使得卖出时点高度敏感,需有效策略规避风险。

- 新股首日涨幅主要源自定价偏差与投资者情绪偏差,发掘包括发行价、行业涨幅、网下认购、股东性质及地理位置等关键因素。
  • 线性回归模型对涨幅排序预测能力强,随机森林分类模型对高涨幅潜力新股筛选精准,尤其能捕捉日内涨幅超过10%的标的,提升投资决策便利性。

- 卖出策略建议首五日完成,以限制造成的初期高溢价获利回吐,首批新股可依模型排序盯市,分层次实施卖出策略,后续发行结合初期数据调整策略。
  • 风险提示涵盖模型基于历史数据和制度假设,未来制度演化及市场机制调整或带来失效风险,投资需审慎。

- 本报告经典结合金融工程模型与实证分析,洞悉新股市场博弈,为机构投资者参与科创板提供量化决策支持和制度环境理解,具有较强的应用价值及前瞻性。[page::0-22]

---

附:部分关键图表示例


  • 图1 不同阶段新股初期涨幅相对市场走势


  • 图2 新股日内走势(30分钟箱体图)


  • 图5 定价偏差与情绪偏差历史变化(2006-2019)


  • 图13 样本内均价涨幅真实值与预测值对比


  • 图15 新股回归因子IC序列


  • 图19 随机森林算法测试集高涨幅标签F1_Score


  • 图20 不同分位数下分类模型对新股日内涨幅预测能力



---

本报告以严谨的数据分析和制度解读为基础,结合机器学习与统计模型,围绕新股发行制度变革下的卖出策略设计,体现系统性和前瞻性,彰显光大证券研究团队在金融工程应用领域的深厚实力与创新思路,极具实操参考价值。

报告