社交媒体效应、投资者认知和股票横截面收益—“学海拾珠”系列之五十一
创建于 更新于
摘要
本报告基于中国股吧社交媒体大数据,实证研究社交媒体效应对股票横截面收益的影响。研究发现社交媒体发帖数量作为投资者认知度的直接衡量指标,具有显著的风险调整后回报,能提高Fama-French三因子等模型的解释力,支持默顿投资者认知假说。基于社交媒体因子的多空策略在不同公司特征子样本均表现优异,年化收益率可达30%以上,提示投资者应重视社交媒体溢价对投资组合配置和风险管理的作用[page::0][page::3][page::6][page::8][page::13][page::15][page::16][page::17]
速读内容
社交媒体发帖量是有效的投资者认知代理变量 [page::0][page::4][page::10]
- 社交媒体发帖数量与传统投资者认知指标(股东数、新闻报道、广告投资)显著正相关。
- 社交媒体信息更具交互性和实时性,优于单向传播的大众媒体,刻画潜在和未来投资者的认知水平。
- 通过股吧发帖量,投资者认知情况能被更精准地量化和动态跟踪。
社交媒体因子 (SMF) 具有显著的风险调整回报与解释力 [page::6][page::7][page::8][page::9]

- 构建的社交媒体因子在Fama-French三因子、Carhart四因子、五因子模型中均表现为显著正风险溢价(约1.5%月度风险溢价)。
- SMF与规模、账面市值等经典因子呈相关但提供超额信息,且不能被流动性或大众媒体因子完全解释。
- 资产定价模型加入SMF后,GRS检验p值显著提升,模型表现更优。
社交媒体溢价存在于不同情绪分类与公司规模中 [page::11][page::12][page::13]
- 社交媒体效应独立于情绪效应,情绪中性、正面、负面贴子的社交媒体溢价逻辑一致,支持认知而非情绪驱动。
- 不同规模、账面市值及动量分组均存在显著正向的社交媒体溢价,特别是在小市值及低认知度股票中尤为明显。
社交媒体因子驱动的交易策略表现优异 [page::13][page::14][page::15][page::16]


- 构建社交媒体发帖数量的多空投资组合,最低1/10与最高1/10发帖量组合间月度超额收益逾2.4%。
- 买入持有策略年化收益约40%,多空策略年化收益约32%,夏普比率达1.168。
- 策略对沪深300、中证500及中证1000均有效,表现稳健优于大盘。
经济解释与投资者认知假说支持 [page::9][page::10][page::17]
- 社交媒体帖子的数量直接反映投资者认知度,信息传播便利且成本低。
- 支持Merton(1987)投资者认知假说,即认知有限导致的不完全分散化风险催生社交媒体溢价。
- 研究为投资者认知作为资产定价风险因素提供新证据。
风险提示和研究范围
- 结论基于历史数据与国外文献综述,不构成具体投资建议。
- 受限于中国股市数据及社交媒体平台,未来需进一步验证不同市场环境的适用性。
深度阅读
金融研究报告详尽分析——《社交媒体效应、投资者认知和股票横截面收益—“学海拾珠”系列之五十一》
---
1. 元数据与报告概览
- 报告标题:社交媒体效应、投资者认知和股票横截面收益—“学海拾珠”系列之五十一
- 报告发布日期:2021年7月12日
- 分析师:炜(执业证书号:S0010520070001)、朱定豪(执业证书号:S0010520060003)
- 发布机构:华安证券研究所
- 研究主题:本报告聚焦于社交媒体平台(尤其是中国股吧)发布的股票相关信息如何影响投资者认知进而反映于股票横截面收益上,且通过构建社交媒体因子(social media factor, SMF)完善并扩展经典的Fama-French因子模型,同时验证默顿(1987)的投资者认知假说。
- 核心论点:在传统的Fama-French因子模型基础上引入社交媒体因子,显著提升对股票横截面收益的解释力。股吧发帖数被证明是衡量投资者认知的直接指标,并且构建的基于社交媒体效应的投资组合能获得显著超额的风险调整后收益。投资管理者应将社交媒体溢价视为重要考量;这一结果在控制大众媒体报道和流动性变量后依然稳健[page::0, 3, 6, 8, 16, 17]。
---
2. 章节深度解读
2.1 简介(第3页)
- 关键点与逻辑:大众媒体报道长期被认为影响股票的风险补偿,具体表现为报道较少的股票收益率更高,理由在于信息不完全与投资者认知限制(missing investor recognition)。但传统大众媒体信息单向传播,难以量化投资者实际认知。社交媒体通过投资者互动提供非对称信息的传播渠道,且发帖数量能更好反映市场对个股的注意力。
- 案例环境:采用中国东方财富股吧数据,该平台影响覆盖1200万至2200万投资者,数据覆盖3000多只股票,样本时段2012.1-2017.6,共计约1.5亿帖子。股吧帖子月度发帖数作为投资者认知衡量指标[page::3]。
2.2 数据与实证研究(第4-6页)
- 数据描述:
- 以股吧月度发帖数作为主要的社交媒体活跃度指标;股吧每日帖子超过10万条,覆盖广泛投资者。
- 对比传统媒体(新闻平均每月报道约7.8篇,且20%的股票一个月无媒体报道),股吧发帖数平均每只股票每月超过700条,且几乎每只股票月月都有帖子。
- 数据样本覆盖A股市场,剔除了非正常交易及数据异常的股票,样本平均约2500只股票,覆盖市值占比90%以上[page::4, 5]。
- 实证方法与主要发现:
- 通过公司规模、账面市值比、流动性等因素的双重排序,分析不同组别中股吧发帖数量与股票1个月超额回报的关系(见图表2)。
- 发现:社交媒体活跃度与超额收益呈负相关,即在低发帖数股票中存在溢价,尤其在小盘股和中低流动性股票中,超过2%的月度超额收益尤为显著。
- 解释逻辑:知名度低的股票因信息不对称和认知度不足导致风险溢价,社交媒体数据正是体现并捕捉了这一现象[page::5, 6]。
2.3 社交媒体因子(SMF)与风险定价(第6-9页)
- 因子构建与统计:
- 根据社交媒体发帖数量,将股票分为三组,构造多空组合收益作为SMF的值,历时2012-2017年。
- SMF平均月度风险溢价为1.54%,超过传统因子如规模(1.45%)、账面市值比(0.21%),且与Fama-French多因子存在较高相关性。
- 关键是SMF不能被传统因子完全解释,因子冗余回归显示截距持续显著,说明SMF携带额外有效风险信息。
- GRS统计检验表明,加入SMF的模型对横截面收益解释能力显著提升,p值明显增大,模型拟合优于无SMF模型[page::6, 7, 9]。
- 风险溢价实证:
- Fama-Macbeth 两步回归验证SMF风险溢价显著,在1%水平上,年化收益率约27%。
- SMF保持独立于大众媒体因子(MMF)和流动性因子,表明其捕获的是投资者认知风险[page::8, 9]。
2.4 社交媒体因子经济解释与投资者认知验证(第9-12页)
- 投资者认知衡量的创新:使用股吧帖子数作为认知的直接代理变量,并与股东数、媒体报道、广告成本等传统指标对比,展示其正相关且数据更加实时和丰富。
- 相关性测试:
- 股吧发帖数与股东数的对数水平及其变化正相关。
- 通过双重排序(股东数×社交媒体活跃度),回归仍显示二者正相关,确认了股吧发帖数的稳健性。
- 情绪影响控制(通过文本情绪分类、MAX效应、交易量等指标)后核心结论不变,强调社交媒体发帖数量反映的是认知而非情绪[page::9-12]。
2.5 社交媒体溢价与策略表现(第13-16页)
- 投资组合表现:
- 构建按社交媒体帖子数量十分位数划分的投资组合,最低发帖十个百分点(认知最低)股票投资组合平均超额收益高达2.67%。
- 多空策略(买入低发帖数,做空高发帖数股票)月度超额收益为2.4%,表现显著且风险调整后的alpha稳定为正。
- 子样本检验:
- 在不同规模、账面市值比和动量组均显著呈现正风险调整收益。
- 使用非流动性指标(Amihud比率和交易量)及情绪代理进一步排除因流动性及情绪驱动的溢价,支持社交媒体溢价非错误定价或情绪影响的解释。
- 策略累计收益与年度表现:
- 买入持有与多空策略的累计回报均显著跑赢市场,累积涨幅约300%。
- 年化收益率分别接近40%(买入持有)与32%(多空策略),胜率和夏普比率均表现优异[page::13-16]。
2.6 结论(第16-17页)
- 社交媒体因子有效捕捉投资者认知风险,补充并提升传统Fama-French模型的解释力。
- 该因素与大众媒体、流动性因子及情绪因素相互独立。
- 通过股吧数据提供了对默顿认知假说的实证支持。
- 基于社交媒体因子设计的交易策略具有显著的经济利润,市场参与者应重视其投资价值[page::16, 17]。
---
3. 关键图表解析
图表 1:社交媒体和大众媒体报道汇总统计(第5页)
- 描述:统计了2012年1月至2017年6月间股吧发帖数量和传统大众媒体新闻报道的均值、标准差、各种分位点。
- 数据解读:
- 股吧发帖月均700余条,远高于平均7.8条的新闻报道。
- 发帖数量在2015年达到峰值,反映市场活跃度与社交媒体活跃度同步提升。
- 传统媒体存在20%股票未被报道,社交媒体覆盖更广泛、实时性强。
- 结论联系:支持将股吧发帖数作为投资者认知的及时且全面的代理变量[page::5]
图表 2:$(3\times3)$ VW 投资组合的每月超额收益(第6页)
- 描述:展示了基于社交媒体发帖数量与公司特征组合所形成投资组合的月度超额收益,重点关注低-高发帖数组合间收益差。
- 数据解读:
- 小市值、低流动性等组别中低发帖数组收益明显高于高发帖组,多空组合收益高达2%。
- 大市值、高流动性股票中社交媒体效应减弱,可能因信息透明度和覆盖率高。
- 论证意义:强调社交媒体的影响主要体现在信息不对称较大、认知度较低的股票上,验证投资者认知溢价[page::6]
图表 3:风险因素的汇总统计(第7页)
- 描述:SMF与其他主流因子的统计特性及相互相关性矩阵。
- 关键数据点:SMF平均月度风险溢价1.54%,高于市场因子及其他风格因子。
- 趋势:SMF与SMB、HML等因子相关性高但显著负的与HML相关,显示其独特风险信息。
- 文本支持:SMF带来Fama-French模型无法解释的新风险因素[page::7]
图表 4:SMF的因子冗余测试(第7页)
- 描述:通过多因子回归检验SMF的独立性和解释能力,观测截距显著性。
- 结果:无论添加大众媒体因子、流动性因子,SMF的截距均显著,表明该因子溢价解释了市场未捕捉的风险。
- 分析:证实SMF的统计有效性和经济价值,是对传统模型的重要补充[page::7]
图表 5:Fama-Macbeth回归的因子风险溢价(第8页)
- 描述:基于Fama-Macbeth两步回归,估计SMF的风险溢价水平并检验显著性。
- 发现:SMF月度溢价约2%,显著性达到1%水平,表明单位风险对应较高回报。
- 联系:展示SMF实际带来的经济价值和风险定价能力[page::8]
图表 6:因子模型的GRS检验(第9页)
- 描述:GRS统计检验模型对多个股票组合横截面收益的解释优度。
- 数据说明:加入SMF的模型p(GRS)明显增大,误差指标下降,调整后R^2提升,反映模型性能提升。
- 意义:SMF的引入使得资产定价模型更贴合实证数据,有效减少未解释的超额收益[page::9]
图表 7-8:投资者认知和股吧发帖数量相关性检验(第10-11页)
- 描述:横截面回归结果,验证股吧发帖数量与传统投资者认知指标(股东数、媒体报道、广告投入)之间的相关性。
- 结果:显著正相关,尤其是发帖数量与股东数的对数相关系数高达0.45。双重排序稳健性验证增强信心。
- 推断:股吧发帖数是对投资者认知度的较优直接代理[page::10, 11]
图表 9-10:情绪影响检验及控制(第12页)
- 内容:基于文本情绪分析对帖子分类,展示不同情绪组的社交媒体溢价情况,及情绪指标对SMF的回归影响。
- 结果:社交媒体溢价在正面、中性和负面情绪组中均存在,且情绪因素无法完全解释社交媒体效应。
- 结论:社交媒体因子主要反映投资者认知而非纯情绪波动[page::12, 13]
图表 11-15:投资组合表现与策略回报(第13-16页)
- 表11-13:详细展示了不同因子模型调整后社交媒体低发帖组合的月度及子样本alpha收益,均显著为正,特殊说明流动性及情绪不可完全解释。
- 图表14:两种主策略(买入持有与多空)累计收益走势显著优于市场,涨幅约3倍。
- 表15:年化收益与相对基准的超额收益均达到20%以上,胜率高达90%,夏普比率超过1。
- 含义:策略具备稳定显著超额回报并且风险调整表现良好,具备实际应用潜力[page::13-16]
---
4. 估值与风险因素分析
- 估值方法:本报告未直接涉及企业估值方法论和具体估值模型,而是通过构建社交媒体因子(SMF)丰富资产定价模型(以Fama-French等经典多因子模型为基础),从而更好理解股票横截面收益风险溢价来源。
- 风险识别:作者强调SMF反映了投资者认知程度的不完备风险,这种认知不完全导致投资者组合不完全分散化,故需认知风险溢价作为补偿。该风险独立于传统市场风险、规模风险、价值风险及流动性风险。
- 情绪风险:通过多种情绪代理变量检测表明,SMF不可简化为纯情绪风险因子,且情绪变量控制后SMF风险溢价依旧显著。
- 非流动性风险:作者针对流动性较差股票进行了子样本分析,结果反驳了社交媒体效应源于流动性不足的假说[page::7, 8, 12-14]。
---
5. 风险因素评估
- 报告提示风险:该研究基于历史数据和海外文献总结,强调不构成任何投资建议。投资者需注意结论的历史局限及模型适用范围。
- 潜在风险:社交媒体数据可能受操纵风险、数据噪声、平台生态变化等影响;认知风险因量化难度大,模型假设对个别市场或事件驱动的适用性存在不确定性。
- 缓解策略:报告未详细描述具体缓解机制,但通过多重控制因素(情绪、流动性、传统因子)及稳健性检验,增强结果稳健性的可靠性[page::0, 17]。
---
6. 批判性视角与细微差别
- 优势:报告围绕海量股吧发帖数据,提供了比传统媒体报道更为细腻和及时的投资者认知代理,丰富了资产定价理论。
- 潜在限制:
- “股吧发帖数”虽为认知指标,但发帖本身可能受情绪、投机炒作、网络舆论操纵影响,不能完全等同于理性投资者认知。
- 中国市场的散户主导特性及社交媒体普及率高,结论在其他市场可复制性待商榷。
- 由于数据及样本时间段主要涵盖2012-2017年,后续市场发展及监管变化可能影响因子稳定性。
- 报告强调社交媒体效应独立于情绪,但情绪测量本身复杂,情绪指标的多样性和全面性尚有待优化。
- 结论建议:需结合更多市场环境变动因素,持续动态更新模型参数验证其跨时空的适用性[page::3, 12, 17]。
---
7. 结论性综合
本报告以中国最大金融社交媒体—东方财富股吧数据为核心,创新地利用社交媒体帖子数量作为投资者认知度的直接衡量指标,建立了包含社交媒体因子(SMF)的多因子资产定价模型。该模型显著优于传统的Fama-French和Carhart因子模型,能够更充分解释股票横截面收益的差异。
从实证分析中,股吧发帖数量与传统投资者认知代理(股东数、媒体报道、广告投资)呈显著正相关,且这一指标能弥补传统指标时滞和单向信息传播的不足。通过控制投资者情绪和流动性风险等因素,社交媒体效应仍旧独立显著,验证了默顿的投资者认知假说。
构建的多空社交媒体因子投资组合每月可获得约2.4%的超额收益,年化回报率超过30%,且该策略在不同公司特征和流动性区间均表现稳健。丰富的统计检验、GRS测试和因子冗余检验进一步加强了研究结论的稳健性。
图表部分清晰展示了社交媒体活跃程度与股票收益的负相关趋势,以及加入社交媒体因子后资产定价模型性能的显著提升。策略累积收益和年化表现亦表明,社交媒体信息为投资者提供了重要的增量信息和风险溢价源。
综上,社交媒体因子不仅提升了横截面资产定价的解释力,还为量化交易策略提供了新的高阿尔法来源,建议投资者和风险管理者将社交媒体数据纳入分析体系,尤其是在alpha机会稀缺且信息不对称较明显的市场环境下[page::1-17]。
---
参考文献及数据来源
- Xiangtong Meng, Wei Zhang 和 Youwei Li 等,Social media effect, investor recognition and the cross-section of stock returns,International Review of Financial Analysis
- 本报告作者以该文为核心内容进行总结和二次分析
---
报告声明
分析师声明严格遵守中国证券业协会要求,报告信息基于公开市场数据,独立、客观;不构成投资建议。华安证券保留相关版权及法律责任追究权力[page::18]。
---
本分析严格依据报告原文展开,所有结论均带页码溯源,力求客观、翔实、全面。