【量化研报分享】中泰证券-寻找另类Alpha因子系列之一:基于新闻舆情数据的选股因子-20200824


(adhaha111) #1

摘要

股价主要受业绩和估值两方面因素驱动。新闻中体现的市场情绪一方面影响中短期的估值水平,一方面也反应了市场对公司未来业绩的预判,因而把握舆情对预测股价收益有重要影响。

新闻舆情的刻画方法:
新闻舆情对股价的影响可以从两个方面刻画:舆情的热度(新闻数量)和舆情的评价度(新闻情感值)。对个股每月新闻情感值求和作为新闻情绪因子,既体现了新闻对个股的正负向评价度,又体现了新闻热度。

新闻情绪因子的改进方式:
对月度新闻情感求平均数计算新闻情感因子→增加新闻热度的刻画,用月度新闻情感之和作为新闻情绪因子→补充对新闻类型的筛选条件:新闻标签为“包含基本面信息”→补充新闻相关度的筛选条件:新闻相关度为强相关。
对新闻标签和相关度进行改进后,新闻情绪因子的多空年化收益率由 3.65%提升至 8.10%;因子最大组的多头年化收益率由 5.63%提升至 14.53%,最大回撤由-32%缩小至-27.5%,相对基准月胜率由 63%提升至 69%;因子不同时期的分层单调性也有所提升。

新闻情绪因子在不同市值下表现:
1)新闻情绪在月频上,对大市值股票的影响较为持续;市值越小,反转效应越明显(即本月情绪最高的股票组合,次月收益最低);
2)月频的新闻情绪对较小流通市值的股票影响不大;
3)对较小市值的股票做新闻情绪分析时,更应当注重结合基本面信息,尤其
是规避基本面信息下的低情绪股票,其负收益可能性更大。

新闻情绪因子的其他刻画方法:
1)新闻情绪差值因子的分层单调性并不明显,但情绪变化最大组收益远远跑输其余四组,即月度情绪提升最大的股票组合次月表现可能不及预期。
2)标准差下的分歧度因子没有明显的单调性分层。但结合新闻情绪的绝对值水平后,当月新闻情感的总值较高、且标准差较小的组合表现最好,即高一致性的高舆情组合有最高的月度收益表现。
3)用正向情感得分占比计算分歧度因子,采用包含基本面信息的强相关新闻数据。正向情感得分占比越大,说明个股当月的正向情感一致性越强,从回测结果看,其次月收益也相应较高。

新闻舆情多头策略:
从多头组合策略角度,有三种多头策略收益表现较好。在强相关且去重的新闻数据中,分别筛选 1)高情绪组合;2)高情绪、低标准差组合;3)高正向情绪占比组合。
叠加三种选股条件,选择高情绪、低标准差、高正向情感占比的股票组合,收益可以进一步提升。组合的多头持仓年化收益率提升至 31.22%,最大回撤减小至-17.2%,相对基准月胜率为 70%。
风险提示:1)单因子测试结果是历史经验的总结,回测结果依赖于 2016 年以来的历史数据,存在失效的可能;2)监管政策超预期变动,外部环境超预期变化可能对市场风格产生影响。