`

【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建

创建于 更新于

摘要

本报告基于DeepSeekV3大语言模型对约18000份主动型权益基金季报观点文本进行定量解析,构建14项行业观点指标,结合看多/看空比例及关注度,设计季频行业轮动策略。策略显示,从历史回测看结合看多看空比的复合指标在牛熊市阶段表现差异明显,筛选低关注低看多比例的组合整体表现优于市场平均水平。行业关注度和看多看空比例具备一定指示价值,且轮动策略跑赢同期行业指数平均水平,为投资提供参考依据 [page::0][page::16][page::19][page::20][page::21]。

速读内容


DeepSeek模型及其金融应用简介 [page::2][page::3][page::4]


  • DeepSeek为先进的基于Transformer架构大语言模型,采用多头潜在注意力等技术,成本效益领先业内同类模型。

- 具备强大文本理解、信息提取和推理能力,能够处理基金季报中非结构化观点文本,挖掘行业情绪和观点。

主动型权益基金规模及季报观点文本特征 [page::4][page::6][page::7]



|观点字符数量区间|季报数量(篇)|季报占比(%)|
|--------------|-----------|----------|
|100以下 |198 |1.10 |
|100-300 |2945 |16.36 |
|300-500 |4925 |27.36 |
|500-1000 |7222 |40.11 |
|1000以上 |2714 |15.07 |
  • 截至2025年3月31日,主动型权益基金资产规模仍超3万亿,偏股混合基金指数2025年以来累计收益率4.65%,跑赢中证800约5%。

- 季报观点文本长度集中于300-1000字符,中位数约600字符,季度观点字数变化平稳。

基金经理季报观点文本定量解析流程 [page::6][page::8][page::9][page::10]




  • 选取权益仓位超60%、存续超过5年的主动型权益基金样本约900只,提取2019Q4以来约18000份季报观点文本。

- 通过Python调用硅基流动平台DeepSeekV3 API,输入文本和申万一级、二级行业提示词,输出行业看多看空评分。
  • 示例:基金经理观点中提及加大信息技术比重,模型对应看多计算机、电信等行业,看空钢铁、建筑材料等行业。


分行业观点统计及动态变化 [page::11][page::12][page::13][page::14][page::15]


|行业|提及观点数|看多占比(%)|看空占比(%)|
|-|-|-|-|
|电子|10527|84.7|15.3|
|通信|8266|85.3|14.7|
|计算机|10065|82.6|17.4|
|电力设备|11732|83.5|16.5|
|食品饮料|8010|73.4|26.6|
|医药生物|8337|79.2|20.8|
|房地产|7054|45.9|54.1|
|机械设备|7981|91.2|8.8|
  • TMT板块行业关注度高,2023年因AI热点关注度大涨;消费板块食品饮料、医药生物关注度较高但近年波动下行。

- 上游周期板块关注度波动明显,煤炭行业2022年以来关注较活跃;中游制造板块关注度随行情震荡,机械设备保持稳定。
  • 大金融板块银行、非银关注度稳定,房地产关注度自2022年显著上升。


行业观点指标构建及相关性分析 [page::16]



|指标序号|指标名称|计算方法|
|-|-|-|
|1|季度看多观点占比|看多行业的季报数量占所有季报比|
|2|季度看空观点占比|看空行业季报数量占所有季报比|
|3|看多-看空观点差值|指标1减去指标2|
|7|行业关注度|提及行业观点的季报数量占比|
|…|…|…|
  • 关注度与看多比例正相关,与看空比例负相关,体现投资者热点和正面看法间的关联。


行业轮动策略回测测试结果 [page::17][page::18][page::19][page::20][page::21]




  • 以季度为调仓频率,基于行业观点指标分别构建前3至前6行业等权策略。

- 单一关注度指标构建的组合未跑赢行业平均。
  • 看多比例及其环比指标在牛市表现优异,熊市不及平均;看空比例及环比指标在熊市阶段跑赢指标平均。

- 结合看多、看空比例及关注度构建的8个轮动组合中,低关注度且低看多比例组合表现最好,高关注度高看多比例组合表现一般。
  • 此类轮动策略跑赢行业指数平均水平,显示行业观点定量指标可为行业配置及投资决策提供有效参考。


深度阅读

【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建 深度分析报告



---

一、元数据与报告概览


  • 报告标题:《DeepSeek定量解析基金季报行业观点及行业轮动策略构建》

- 作者与发布机构: 李豪(广发证券资深金工分析师),及安宁宁等团队,广发证券发展研究中心,2025年4月8日,上海发布
  • 主题: 结合最新大语言模型DeepSeekV3技术,利用基金季报中的文本观点对行业看多看空倾向进行定量解析,进而构建基于基金行业观点的行业轮动策略。

- 核心论点: 利用大语言模型对主动权益基金季报中的行业观点文本信息进行自动解析和量化,提炼出基金经理对各行业的看多、看空及关注度指标。基于此,构建多指标的行业观点指数,并以季频周期设计行业轮动策略。实证发现,基于看多看空比例及关注度的复合指标构建的行业轮动策略具备超过平均行业指数表现的潜力,尤其是在市场不同阶段具有一定区别表现。
  • 主要信息传递: 本文首次较系统地将高性能大语言模型应用于金融行业文本定量分析,标志着人工智能与主观行业观点结合实现定量投资的新尝试。研究成果为投资者理解基金行业观点提供量化工具及可操作的行业轮动策略模板。


---

二、逐节深度解读



1. 引言及技术背景


  • 报告开篇阐述了近年来人工智能技术催生的大语言模型(LLMs)在金融领域的广泛应用潜力,包括文本理解、信息提取、情感分析及决策推理能力。强调金融行业作为数据密集型领域对高效文本分析工具的需求。

- 特别介绍了DeepSeek系列模型,尤其是DeepSeekV3模型,作为国内领先的混合专家模型,其推理能力、成本效益及性能在多个基准测试中表现优异。
  • 图3详述了LLMs在金融领域的典型应用场景(语言任务、情感分析、时序分析、金融推理等),并对模型发展历程展开,展示了DeepSeek在主流模型生态中的独特技术地位。

- 图4的数据对比显示,DeepSeek-R1及DeepSeekV3在多项金融智能推理任务的准确率和排名表现突出,相较OpenAI以及其他金融定制模型展现竞争优势。

2. 主动型权益基金样本筛选及季报观点文本数据


  • 样本定义:包含普通股票型、偏股混合型、平衡混合型、灵活配置型等基金,权益资产占比大于60%,存续超过5年且规模超过2亿。

- 目前活跃主动权益基金规模依然巨大,超过3万亿,即便2021年以来基金数量及规模有所波动,主动权益基金对市场风格影响明显。
  • 图4展示了该类基金数量及规模历史走势,基金数量稳步增长,规模在2021年达到高峰后有所缩减。

- 根据历史净值表现,主动型权益基金整体跑赢大盘中证800,且行业配置贡献接近0.9%,尤其TMT板块配置上升是主驱动(表1,图5)。
  • 提取基金季报中“报告期内基金投资策略和运作分析”部分作为文本观点原文,字数集中在300-1000字之间(表2,图8),为后续定量解析提供素材。


3. DeepSeekV3模型调用及文本解析方法


  • 利用Python通过硅基流动平台DeepSeekAPI批量处理共计18000份季报观点文本(图9、图10),调用流程及参数设置详尽展示,确保复现性和效率。

- 设计特定提示词控制模型任务:明确提炼行业看多、看空观点,涉及申万一级及二级行业分类,输出固定格式文本方便后续量化处理(图11、图12)。
  • 模型平均单次处理耗时约10秒,数据量较大,计算总耗时约50小时,输入输出tokens数量也被详细统计。

- 案例验证展示基金经理观点与模型解析结果高吻合,既能够正确识别基金经理的多空行业板块,也可区分不明确表达行业观点的情况(表3,表4)。

4. 行业观点统计分析


  • 行业观点文本被提及频次差异明显。电子、计算机、医药、食品饮料等行业热度持续较高,房地产呈现更多看空观点(表5)。

- 不同行业、不同季度,行业观点的看多与看空比例存在清晰分布,看多比例通常较高。
  • 季度平均每份观点涉及行业数约8.5个,其中看多行业约6.5个,看空约2个(图13)。

- 时间维度上,不同行业关注度表现出周期性波动,TMT板块在2023年由ChatGPT带动的AI行情中关注度大幅上升(图14)。
  • 消费板块中电子、食品饮料、医药生物关注度较高,而纺织服饰、轻工制造关注度较低(图15)。

- 上游周期板块(煤炭、钢铁、有色金属、基础化工)关注度随周期变化明显(图16)。
  • 中游制造板块(电力设备、汽车、机械设备)突出表现集中在近两年新能源行情期(图17)。

- 大金融板块关注度中游,房地产关注度自2022年以来提升明显(图18)。

5. 行业观点指标构建与轮动策略设计


  • 依据模型定量解析结果,从看多数量、看空数量、观点占比、关注度及其环比变化等维度设计14个细化行业观点指标,详见表6。

- 指标间相关性分析显示,关注度指标与看多比例正相关,与看空比例负相关;看多和看空指标负相关(表7)。
  • 设计基于单一指标的行业轮动策略:

- 关注度指标7及其环比变化14构建的行业组合表现不佳,未跑赢行业平均(图20、图21)。
- 看多比例指标1及环比变化8在牛市阶段表现优异,熊市阶段表现不及平均(图22、图23)。
- 看空比例指标2及环比变化9在熊市阶段跑赢行业平均,牛市表现持平(图24、图25)。
  • 综合看多、看空比例及关注度,设计8种策略组合(表8):

- 组合2(低关注低看多)表现最好,组合1(高关注高看多)表现不佳(图26)。
- 组合6(关注和看多均下降)表现出较好的回测结果,组合5(关注和看多均上升)牛市表现较好,熊市逊色(图27)。

6. 风险提示


  • 报告数据基于历史,未来表现不保证。

- 模型解析及指标构建存在假设限制,无法完全反映现实。
  • 研究结论非投资建议,存在可变风险。


---

三、图表深度解读



图1-2:技术解析图


  • 图1描绘了DeepSeek等LLM的生态组件及对金融多任务(如情感分析、推理等)的应用示意,凸显模型多样性能。

- 图2历史时间线追踪LLM发展,突出DeepSeek作为国产高性能模型及Transformer优化技术的整合。

图3-4:模型性能与平台调用示例


  • 图3展示DeepSeek等国内外多个金融领域定制LLM,及其在训练、验证、推理能力上的相对位置。

- 图4通过对比不同LLM在多个测试基准(如MATH-500、Codeforces、SWE-bench等)上的准确率,表明DeepSeek-R1及DeepSeekV3综合能力强。

图5:主动型权益基金数量和规模


  • 条形和折线图展示2009至2024年基金数量增长趋势与规模波动。近年数量持续增长,而基金总规模峰值后有所下滑,提示市场结构变化。


表1 & 图5:基金绩效归因与TMT板块配置


  • 表1详细拆分偏股混合型基金表现的超额收益贡献项,行业配置贡献有序排在资产配置之上,数据有较好参考价值。

- 图5以净值回归展示TMT板块持仓比例上升趋势,呼应Brinson归因结果,验证行业配置观点市场影响。

表2 & 图8:基金观点文本长度分布


  • 表2统计季报观点文本字数分布,样本均聚焦在300-1000字符区间,可靠且具有代表性。

- 图8展示季报观点字数中位数稳定,保障模型解析输入文本的合理长度。

图9-12:模型调用和解析流程


  • 图9-10分别截图展示了硅基流动平台的模型列表界面及Python调用示例代码,直观表达技术实现路径。

- 图11与图12详细展现模型输入提示词设计及输出结构,体现定向任务导向和数据产出标准化。

表3-4:代表基金经理观点及模型输出


  • 两表直观显示基金经理在文字观点中表达的行业倾向与DeepSeek定量输出的行业看多看空对应关系,验证模型高效提炼主观观点。


表5 & 图13-18:行业观点统计与演化


  • 表5纵览申万28个一级行业的观点提及次数和看多看空比例,揭示投资关注度和情绪多空倾向分布。

- 图13至图18分板块追踪行业观点占比动态走势,反映行业投资热点及周期性波动。

图19 & 表6-7:行业观点指标设计和相关性


  • 图19总结性展示行业观点指标构造流程。

- 表6列出核心指标定义,包含看多、看空数量比、关注度及环比变化等。
  • 表7为指标间相关性矩阵,反映变量间内在关联,为后续策略构建提供统计基础。


图20-27 & 表8:行业轮动策略回测表现分析


  • 系列图清晰展现不同单一和复合指标构建的行业组合在时间序列上的超额收益表现。

- 表8系统描述8种基于行业观点的策略细节。回测发现“低关注低看多”组合表现优异,而高关注高看多组合表现逊色,提示市场过热行业不具备持久超额收益。
  • 看空观点指标在熊市阶段体现较强对冲特性,策略灵活性良好。

- 综合指标策略在股市不同阶段展现出差异化胜率。

---

四、估值分析



报告未涉及传统的企业估值模型如DCF、市盈率等,而是创新地通过文本解析量化基金经理行业观点构建动态行业轮动模型。指标解释与统计充分,使用大语言模型技术作为数据源解读,为估值及资产配置提供新工具,但非典型估值报告。

---

五、风险因素评估


  • 采用数据历史回测,未来市场环境不确定或模型适用性降低均可能影响策略效果。

- DeepSeek模型非专为金融设计,尽管提示词约束保证一定准确性,但仍存在文本理解偏差及错误分类风险。
  • 行业观点文本具有一定延迟性和主观性,可能导致预测与实际市场走势脱节。

- 策略基于等权构建,未考虑行业间的风险调整,可能存在集中风险。
  • 法律声明明确指出报告结论非投资建议,且免责声明强调数据及模型局限。


---

六、批判性视角与细微差别


  • 报告对LLMs的优点强调较多,尤其在DeepSeek模型性能方面突出,但对模型潜在误判或偏差不足以着墨,存在一定技术乐观倾向。

- 基金观点直接反映基金经理主观判断,模型解析仅为定量工具,未深度评估观点的实际时效性和一致性。
  • 行业轮动策略侧重提及比例及环比变化,但未充分考量行业估值、基本面等其他重要因子,存在单一指标主导的风险。

- 策略回测区间和市场环境未详尽说明,可能造成未来表现估计偏差。
  • 细节上,表7的相关性表部分数据存在排版或转录异常,需关注完整原文确认。


---

七、结论性综合



该报告以创新视角结合最新国产大语言模型DeepSeekV3对主动型权益基金季报中的行业观点进行定量提炼,打造多维行业观点指标体系,进而构建了基于行业观点的季频行业轮动策略。研究系统详实,图表丰富,验证了基金经理行业观点在投资决策和市场表现中的一定前瞻性和参考价值。

具体发现包括:
  • 主动权益基金依然在市场配置中占据重要位置,TMT等热点板块配置比例显著,推动行业配置超额收益。

- 超18,000份季报观点文本通过DeepSeekV3实现批量定量解析,精准映射基金经理的行业看多看空态度。
  • 行业观点的提及频率和看多/看空比例具有一定时间和行业差异,精准反映市场热度和风格轮动。

- 构建的14个行业观点指标相互关联,结合看多看空观点及关注度形成更具辨识力的投资信号。
  • 回测表明,单一关注度或看多比例指标表现有限,而结合看多看空态度及关注度指标构造的多维策略在不同市场环境有差异表现,具备一定超额收益潜力。

- 熊市中,看空比例较高的行业组合具备抗跌性,牛市阶段看多比例较高的组合表现更优。
  • 策略调仓节奏与季度基金季报发布周期匹配,有助于紧跟行业观点动态变化。


总体而言,报告展示了人工智能技术特别是大语言模型在金融文本信息提取与量化分析领域巨大的应用潜力。通过结合基金经理真实行业观点,该研究突破传统量化投资技术局限,为行业轮动策略构建提供新思路。

报告对投资者具备一定参考价值,但需警惕模型局限和历史数据依赖,结合基本面及宏观环境进行综合判断。

---

附件:关键图表示例


  • 图6:DeepSeek定量解析流程示意图


  • 图13:季度平均行业观点数量趋势


  • 图26:结合看多/看空比例及关注度的行业轮动策略表现



报告全文数据及内容均引用广发证券发展研究中心与Wind数据支持,确保权威性和专业性[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21]。

报告