`

基于舆情的大类 资产配臵模型

创建于 更新于

摘要

本报告提出将互联网舆情数据引入经典Black-Litterman模型,构建大类资产配置新模型。通过构造舆情因子并结合传统因子,采用多元线性回归预测资产预期收益率,辅以贝叶斯资产配置方法提升资产配置效果。2013至2017年历史回测年化收益16.18%,夏普比率1.02,模型最新配置建议覆盖权益、债券、商品及现金资产,体现互联网数据对资产配置的较强辅助作用[page::0][page::4][page::9][page::16][page::17][page::18][page::19]。

速读内容


互联网舆情数据与资产配置背景 [page::3][page::4][page::5]


  • 互联网舆情数据通过搜索引擎关键词热度反映投资者关注度,成为分析投资者情绪的代理变量。

- 百度指数、360指数和谷歌趋势均为典型的搜索舆情数据来源,百度使用最广泛。
  • 投资者情绪与资产价格呈现交互影响,关注度变化形成正反馈或价格调整的动态过程。


大类资产与舆情数据特征分析 [page::5][page::6][page::7]


  • 研究覆盖沪深300、中证500、标普500等七种大类资产,匹配对应舆情搜索数据。

- 权益类资产与舆情数据呈正相关,债券和货币类资产相关性弱,商品类呈负相关。
  • 结合多资产类别特征差异,采用差异化舆情因子策略。


Black-Litterman模型及其基于舆情数据的改进 [page::8][page::9][page::10]


  • BL模型采用投资者观点与市场均衡收益融合,计算资产后验预期收益率,进行二次规划计算配置权重。

- 传统BL模型对投资者预期收益率输入要求高,存在较强主观依赖。
  • 本报告用舆情数据构建主观收益率向量Q,降低人为观点错误带来的风险,提升预测准确性。


舆情因子构建与多元回归筛选方法 [page::10][page::11][page::12]


  • 因子分为纯舆情因子、舆情动量因子和传统因子,主要度量舆情值累计、波动及增长变化率等指标。

- 实施数据去极值和标准化处理,采用信息系数(IC)和信息比率(IR)定量衡量因子预测稳定性。
  • 每月选取信息比率绝对值最大的8个有效因子做多元线性回归,预测下一月资产超额收益率。


主要资产舆情因子筛选结果示例 [page::13][page::14][page::15][page::16]


  • 权益类沪深300典型因子有近3月舆情值增长率、近1月舆情值波动率及加权收益率等,均展现负或正相关特性。

- 债券类中证国债主要有效因子为舆情加权日收益率标准差和近3月舆情增长率。
  • 商品类贵金属和农产品因子中,舆情值波动率及增长率变化率表现明显。

- 货币基金因子大多为收益率波动率相关指标,舆情加权收益率有一定辅助。

实证分析及回测表现 [page::16][page::17][page::18]


  • 回测期间2013年至2017年,使用12个月滑动窗口,月度调仓。

- 模型年化收益16.18%,年化波动率16.02%,最大回撤14.28%,夏普比率1.02,表现稳健。
  • 净值曲线优于等权配置,说明采用舆情改进BL模型提高了配置效率。


最新资产配置建议 [page::18][page::19]



| 资产 | 配置比例 |
|-----------|----------|
| 沪深300 | 40% |
| 中证500 | 5% |
| 中证国债 | 5% |
| 贵金属 | 5% |
| 农产品 | 5% |
| 标普500 | 35% |
| 货币基金 | 5% |
  • 配置覆盖权益、债券、商品、货币四大类资产,结合舆情数据持续动态调整权重。

深度阅读

金融研究报告详尽分析与解构



---

一、元数据与概览(引言与报告概览)



1.1 报告基本信息

  • 标题:《基于舆情的大类资产配臵模型》——互联网大数据挖掘系列专题之(十一)

- 作者:史庆盛
  • 发布机构:广发证券发展研究中心

- 发布时间:约2017年6月
  • 主题:综合利用互联网舆情数据,改善传统资产配置模型,提高大类资产配置准确性,实现投资效益最大化。


1.2 报告核心论点与信息


报告核心观点在于:通过分析互联网搜索舆情数据(投资者关注度指数),解读市场群体智慧,从而预测资产收益率,指导资产配置。尤其结合传统Black-Litterman(BL)模型,将舆情因子融入投资者主观观点中重新计算资产预期收益率,解决传统BL模型对投资者先验观点依赖过高、易受主观误判影响的缺陷。回测显示,模型实现了16.18%的年化收益率和约1.02的夏普比率,表现优异。报告同时最新给出2017年6月的资产配置建议,体现了模型实际应用价值。[page::0,1,19]

---

二、逐节深度解读



2.1 网络舆情数据介绍与大类资产舆情构建(第1章)



关键点总结

  • 报告指出互联网大数据时代,网络搜索行为数据(如百度指数)为投资者情绪和关注度的有效代理变量,能反映市场热点和投资者心理。

- 当前主流国内搜索指数为百度指数和360指数,百度市场占有率90%以上,因而选用百度搜索数据来构建资产对应的舆情指数。
  • 以权益(沪深300等)、债券(中证国债)、商品(贵金属、农产品)和现金(货币基金)四类资产为对象,利用其搜索舆情数据与资产价格数据对应分析。

- 认为投资者情绪与资产价格存在正反馈机制:舆情上升带动价格上升,价格推升舆情,直至达到顶点后价格回落,形成可预测规律。
  • 报告结合已有行为金融学理论,强调传统数据难反映投资者情绪,互联网舆情数据弥补这一不足。


逻辑分析


通过对百度指数的实证例证,报告展示了舆情指标的现实可操作性,并阐述用搜索热度反映投资者关注度的理论基础,提供了“群体智慧”驱动资产价格波动的投资逻辑判断,同时指出传统金融模型因忽略情绪因素存在不足,互联网舆情数据有望提高预测能力。[page::3,4,5]

关键数据点

  • 百度指数市场占有率达手机端88.6%、PC端84.3%。

- 7类资产舆情数据涵盖2011至2017年期间的月度累积搜索量。
  • 资产月行情与月舆情的相关性差异分明,权益资产与舆情正相关(沪深300相关系数0.538,标普500为0.826),商品类呈负相关(农产品为-0.524,贵金属-0.402),债券与现金类弱相关。[page::4,5,6,7]


---

2.2 大类资产配置模型与BL模型介绍、改进(第2章)



2.2.1 BL模型原理

  • BL模型基于贝叶斯框架,将市场均衡收益率(由CAPM和资产市值权重推断)作为先验分布,投资者主观观点作为似然函数,联合形成资产后验收益率分布。

- 投资者可输入对单只资产收益或资产组合差异的预期,及其信心水平。
  • 通过二次规划在约束条件下求解最优资产权重,实现风险与收益的均衡配置。

- 公式详述了后验收益率均值与协方差的计算方式,体现了模型的数学严谨和可实现性。

2.2.2 传统BL模型局限

  • 依赖投资者对资产收益率的主观观点,投资者难以给出准确观点,误差易导致配置失真。

- 模型需提升【主观观点的准确性】和【模型鲁棒性】,以提高实际智慧性。

2.2.3 本报告改进

  • 通过引入互联网舆情数据,采用多元线性回归预测资产下月收益率作为投资者观点收益率Q的输入,以减少主观观点偏差。

- 形成“市场均衡收益+投资者主观观点+互联网舆情数据”三者整合后的后验投资组合收益率分布,实现更准确的资产预期收益率计算。
  • 图表显示改进型BL模型加入舆情因子后的流程图,体现了方法论创新点。


[page::8,9,10]

---

2.3 舆情因子选取与测试(第3章)



2.3.1 因子构造

  • 分为三大类:

1. 纯舆情因子:近1月、2月、3月舆情累积值、波动率、增长率及其变化率。
2. 结合舆情的动量因子:以舆情值加权的日均收益率及日收益率波动率。
3. 传统因子:日收益率波动率、对数市值、近1-3月收益率等。

2.3.2 数据处理

  • 先进行异常值剔除(2.5倍标准差阈值),随后标准化(均值0、标准差1),保证回归因子的可比性和稳定性。


2.3.3 因子有效性检验

  • 利用因子IC(因子收益率相关系数)和信息比率IR衡量预测能力和稳定性,滑动窗口12个月。

- 筛选出IR绝对值最高的8个有效因子,作为多元线性回归的输入变量。

2.3.4 详细结果解读


  • 不同资产的有效因子IR值和IC均值显示了显著差异性和方向性:

- 沪深300:多数舆情因子呈现负向IC与IR,但近1月舆情加权日均收益率有正面影响(IR=0.868)。
- 中证500:近2月舆情值增长率IR超过1,显示强预测能力,部分因子表现负相关。
- 国债类因子IR以舆情加权日收益率标准差类为负,表现出较强的稳定性。
- 贵金属与农产品舆情因子大多IR均为负,表明舆情上升反而预示价格下跌,契合行业特性。
- 标普500舆情因子多数IR为负,收益率相关因子存在正负极端。
- 货币基金因子表现最好,所有IR均大于2,表明舆情加权收益率与传统因子均有很强解释能力。
  • 图表中的柱状图直观展示了IR和IC的绝对值强弱,资产之间因子表现差异显著,该点暗示模型需针对不同资产定制策略,不能简单一刀切。


[page::10,11,12,13,14,15,16]

---

2.4 实证分析与回测(第4章)



2.4.1 建模与回测参数

  • 资产池:7类资产涵盖权益(沪深300、中证500、标普500)、债券(中证国债)、商品(农产品、贵金属)、现金(货币基金)。

- 回测时间:2013年1月~2017年5月。
  • 窗口设置:12个月滑动窗口用于因子筛选,月度调仓。

- 资产市值以市值或净值等合理指标替代,风险无风险利率采用银行一年期存款利率。

2.4.2 回测结果

  • 年化收益成绩优秀:16.18%年化收益率。

- 风险水平适中:16.02%年化波动率,14.28%的最大回撤属于合理范围。
  • 夏普比率为1.02,表现领先传统均值-方差配置。

- 分年度分析显示,收益在2014、2015年表现突出,部分年份如2016年有回调,反映了市场波动的影响。
  • 模型表现明显优于等权配置策略,且调仓频率和回测周期合理。


2.4.3 回测净值图

  • 红色(模型配比)净值曲线持续高于蓝色(等权配置)曲线,确认了改进模型的有效性。


2.4.4 最新资产配置建议

  • 根据2017年6月最新行情和舆情,配置如下:

- 沪深300:40%
- 标普500:35%
- 中证500、国债、贵金属、农产品、货币基金:各5%
  • 体现权益资产为主, international diversification(标普500)占比较大,配置中固收与商品通过低权重分散风险。

- 资产配置结构稳健,符合市场长期配置逻辑。

[page::16,17,18,19]

---

2.5 总结与风险提示(第5章)


  • 本报告创新地将互联网舆情数据与BL模型融合,补充了投资者主观观点的不足,提高资产预期收益预测的准确性。

- 舆情因子的多维度选取、标准化和有效性检验为模型稳健运行提供了保证。
  • 回测数据验证了结合舆情数据的BL模型较传统方法有显著提升。

- 最新配置建议体现了模型的实际应用能力,有助于大类资产合理配置。
  • 明确指出基于舆情数据的模型存在失效风险,资产收益仍受多重复杂因素影响,提示投资者审慎使用。


[page::19]

---

三、图表深度解读



3.1 舆情与资产行情关系图(图2-8)


  • 图表通过叠加折线展示资产的月行情(红线)与对应月舆情值(蓝线)的动态变化。

- 股指(沪深300、中证500、标普500)显示价格和舆情同步上升与波动,标普500更为显著,说明投资者关注度直接推动指数变化。
  • 债券和货币基金舆情波动较小,波动与价格关联较弱。

- 商品类资产特别是农产品和贵金属表现为舆情与价格负相关,舆情峰值往往出现在价格下跌前后,可能反映其投机性波动或投资者恐慌情绪。
  • 结合表3相关系数,图表验证文本表述,直观展现不同资产类别舆情与价格关联差异。数据可靠来源于Wind与广发证券。


图2-8资产行情与舆情值关系
(图2沪深300示例,其他资产类似)

3.2 BL模型流程示意(图9-11)


  • 图9描绘了传统BL模型融合投资者观点与市场均衡收益形成后验收益分布的基本思想,图形清晰表达贝叶斯更新过程。

- 图10表明基于后验收益构建的资产组合,在约束条件下通过二次规划获得最优配置,描述配置决策流程。
  • 图11展示本报告改进模型加入互联网舆情数据后对投资者观点部分进行补充,合理利用群众智慧提升收益率预测,增强模型鲁棒。


图9 BL模型主要思想

3.3 舆情因子测试示意(图12)


  • 流程图逻辑清晰,表明通过计算因子IC及IR,筛选有效因子,利用多元线性回归预测资产下月收益。

- 公式定义标准,展示因子值与资产月超额收益的相关系数计算,及因子信息比率(IR)的数学表达,提升方法透明度。

图12舆情因子测试流程

3.4 舆情因子测试结果图(图13-19)


  • 各类资产对应图表为柱状图,蓝色代表因子IR值,淡蓝色为因子IC均值。

- 资产间因子表现差异突出,如沪深300和中证500部分负向反应,货币基金表现全为正且数值较大,突显舆情加权收益率的显著预测效果。
  • 图表揭示不同资产对舆情特征反应迥异,强调配置模型中因子筛选需差异化处理。


图13 沪深300舆情因子测试

3.5 回测净值与最新配置图(图21-22)


  • 图21净值曲线对比显示基于舆情的BL模型显著跑赢等权配置,净值稳健上升。

- 图22以饼图形式形象展示最新配置比例,权益和标普500占主导,具备良好的资产分散和风险控制意识。

图21 回测净值结果
图22 最新资产配置建议

---

四、估值分析



本报告的核心并非传统单一资产估值而是“大类资产配置”的模型构建与优化。估值的关键在于资产预期收益率的准确估计,BL模型整合市场均衡收益与投资者观点调整后的收益为关键输入。通过舆情数据回归得到投资者观点收益,以贝叶斯方法更新后验,解决主观判断不准确的难题。报告中未详细涉及具体估值倍数或现金流折现法,但清楚解释了构建资产预期收益率的核心方法论及其数学模型。

---

五、风险因素评估


  • 报告明确指出模型基于舆情数据,舆情只是影响资产表现的众多因素之一。

- 资产收益受宏观经济、政策风险、突发事件等多方面影响,舆情数据本身反映的市场关注度变化并不完全解释价格变动。
  • 模型潜在失效风险存在,尤其在突发市场异常或舆情误导情况下。

- 报告无具体缓解策略,但通过多因子回归及升级BL模型提高鲁棒性。
  • 投资者应理解模型性质,结合传统分析谨慎应用。


---

六、批判性视角与细微差别


  • 报告积极整合网络大数据技术与传统金融理论,创新性显著。

- 但舆情数据的因果关系尚存争议,舆情变化是否领先价格、或仅是价格结果的反馈仍需更多实证支持。
  • 多数舆情因子IC和IR指标为负,提示某些情绪指标可能反映市场过度反应,而非稳健信号。模型需进一步筛查和权重调整。

- 资产类别间差异巨大,尤其商品类表现反向,表明“舆情=情绪”对此类资产的预测能力较弱,未来改进空间大。
  • 模型对参数选择(风险偏好系数𝜆、先验方差𝜏等)敏感,报告中未深入讨论,可能影响结果稳健性。

- 回测窗口和样本期间局限,尚不能完全覆盖极端市场环境,建议后续完善。

---

七、结论性综合



通过对《基于舆情的大类资产配臵模型》报告的深入分析,可以总结:
  • 报告创新利用互联网搜索舆情数据反映投资者关注度,作为投资者主观观点量化的重要输入,改进传统BL资产配置模型实现资产预期收益率的更准确预测。

- 舆情数据与资产价格之间存在显著动态关联性,但不同资产类别其表现方式和方向各异,权益类资产舆情与价格正相关,商品类出现负相关趋势。
  • 建立了基于多元线性回归筛选的舆情因子体系,经过标准化处理和用信息比率评估因子预测能力,筛选出针对每类资产有效的舆情和传统因子。

- 实证回测结果显示,结合舆情改进的BL模型在2013-2017年表现突出,年化收益16.18%,最大回撤14.28%,夏普比率1.02,显著优于等权配置的基准。
  • 模型月度调仓适应市场变化,2017年6月的最新资产配置建议体现出权益类及海外资产为配置核心,兼备债券、商品和现金类,风险收益平衡合理。

- 风险提示层面,模型依赖舆情因素,存在失效可能,需结合宏观及其他因素综合判断。
  • 报告具有较强的理论与实证价值,但部分因子表现及参数敏感性等问题提醒使用者保持审慎,进一步研究舆情与资产价格关系的因果机制是后续重点。


整体而言,本报告不仅创新地在资产配置领域引入舆情大数据因子,推动金融量化模型应用新浪潮,同时通过严谨的数学模型与实证测试支撑了模型的可行性和有效性,为资产管理者提供了新的视角和工具,有助于提升资产组合的预判和调整能力。[page::0-19]

---

参考图表


  • —— 不同资产月行情与月舆情值关系示例(沪深300)

- —— BL模型主要思想
  • —— 因子测试流程

- —— 舆情因子测试沪深300示例
  • —— 回测净值曲线

- —— 最新资产配置建议饼图

---

此分析严格基于报告原文内容与结构展开,全面覆盖核心论点、模型建设、因子测试、实证分析及最新策略,提供了系统、专业且富有深度的剖析。

报告