你接受基金经理访谈了吗?
创建于 更新于
摘要
本报告通过分析603篇基金经理访谈文本,利用TF-IDF算法提取关键词并采用层次聚类法刻画基金经理群像,揭示基金经理在不同时间、不同管理规模条件下的关注焦点及投资理念差异,展示了基金经理视角下的投资热点与策略类型分布,为基金研究提供了新视角和方法论支持[page::0][page::3][page::4][page::5][page::7][page::9][page::11][page::12]。
速读内容
访谈样本时序及分布分析 [page::4]

- 访谈样本主要集中在2020年和2021年牛市期间,70.53%的访谈发生在牛市中。
- 每个月接受访谈的基金经理与所属基金公司数量基本持平,2020-2021年部分基金公司出现多位基金经理访谈。
基金经理访谈频度及基金公司分布 [page::5][page::6]


- 共计341位基金经理,其中210位仅接受1次访谈,15位接受5次及以上访谈。
- 近一半基金公司访谈次数超过5次,部分基金经理访谈战线最长接近5年,访谈战线中位数约为1年。
受访基金类型与主题基金时序分布 [page::7]


- 偏股混合型基金访谈占比最高,灵活配置型及普通股票型基金次之,主题基金中2020年以科技、消费、医药为主,2021年消费和电新主题兴起。
基金经理关注热点词云分析 [page::9][page::10]


- 关键词聚焦"收益率"、"个股"、"景气"、"科技"、"医药"等。
- 不同时间段关注焦点变化:2020年上半年为“疫情”“经济”,下半年转向“消费”“医药”,2021年下半年关注“仓位”、“均衡”、“成长”,新能源主题大热。
基金经理管理规模对关注点的影响 [page::10][page::11]



- 管理规模30亿以下基金经理更注重“回撤”“景气”等风险及景气度。
- 管理规模100亿以上基金经理关注面更广,偏重“产业”“框架”“经济”等中观宏观维度。
基金经理群像刻画及聚类分析 [page::12]
| 聚类编号 | 关键词摘要 | 访谈数量(个) |
|--------|------------------------------------------------|------------|
| 1 | 个股、仓位、医药、选股、策略、超额收益、均衡、回报等 | 80 |
| 2 | 债券、资产配置、回撤、宏观、控制、流动性、团队、经济等 | 49 |
| 3 | roe、定价、增速、基本面、现金流等个股特征相关词汇 | 40 |
| 4 | 经济、流动性、政策、景气、赛道、仓位等宏观经济视角关键词 | 30 |
| 5 | 新能源、商业模式、品牌、白酒、创新等主题赛道相关词汇 | 28 |
| 6 | 量化、模型、策略、alpha、指数、数据等投资方法相关词汇 | 20 |
- 聚类揭示基金经理投资理念主要分为自下而上个股价值投资、自上而下宏观策略、固收风险控制及量化策略等多样类别[page::0][page::4][page::5][page::7][page::9][page::10][page::11][page::12].
深度阅读
元数据与概览
报告标题:基于基金经理访谈数据的基金经理群像刻画研究
分析师:郑兆磊(联系邮箱 zhengzhaolei@xyzq.com.cn)
发布机构:兴业证券经济与金融研究院
报告日期:2022年5月28日
研究主题:通过基金经理访谈数据,从文本分析的视角,对基金经理的投资关注点和群像进行刻画与解析。
核心观点及目标:
报告创新性地跳出传统通过基金净值和财务报表刻画基金经理风格的手法,采用文本挖掘和机器学习中的TF-IDF算法与层次聚类,基于603篇基金经理访谈数据,绘制基金经理关注焦点词云图,进而剖析其投资理念与群体特征。报告不仅定量分析访谈的时序分布、受访频次、基金类型与管理规模,还从词频和语义相似性层面构建基金经理群像分类,拓展了基金经理研究的新范式。报告强调基金经理访谈数据能更直观且多维度展现基金经理当时投资思路和趋势变化,帮助市场理解基金经理行为背后的微观逻辑。
1、基金经理群像刻画新视角
这一章节介绍研究切入点。传统抓取基金经理画像依赖净值表现与基金财报中的数据,难以捕捉投资理念和投资热点的微观动态。本文则用基金经理的访谈文本作为原始数据,通过词云图来展现集体关注的投资热点,实现基金经理群体投资偏好的量化刻画。数据来源是4个知名自媒体公众平台,截至2022年4月22日,数据清洗后共获得603篇有效访谈。表1展示了部分访谈来源的示例,涵盖2018年至2021年的不同时段。该章节明确了数据的权威性及其代表性基础。
2、访谈数据概览
2.1 访谈样本时序分布
通过对时间轴上访谈篇数的统计,图1揭示了基金经理访谈主要集中于牛市阶段,高达70.53%的访谈发生在牛市,熊市和震荡市的访谈比例相对较低,分别为17.88%和11.59%。这一结果反映基金经理在市场向好时更积极地向外界表达观点。图2显示每月被访基金经理人数基本等同于其所属基金公司数量,说明每公司一般有1名基金经理发声,2020和2021年牛市期间部分公司出现多经理同时访谈的情况,显示市场热度提升基金经理参与度增强。
2.2 受访频度分析
访谈数据显示共涉及341位不同基金经理,绝大部分(61.6%)仅被访一次,少数15人接受5次及以上访谈。图3和图4详细展示了访问频次分布,部分基金经理的访谈跨度达数年。基金公司层面,55%覆盖1-5次访谈,26%接受访谈次数超过10次,显示部分头部基金机构更积极参与市场沟通。图6分析基金经理访谈跨度,最长达到4.85年,表明部分基金经理保持长期的观点连续性与市场活跃度。
2.3 受访基金类型分析
访谈主要覆盖偏股混合型基金最多,其他如灵活配置型、普通股票型及混合债券型依次,且这些类别的占比在2019至2022年间保持稳定。图7给出详细时序分布,反映主流基金类型的受访比例一致。主题基金中,2020年科技、消费、医药表现活跃,2021年消费和新能源主题基金比例显著提升,科技主题份额下降,表明基金经理关注重点随市场主题发生转移,反映行业热点演变对话基金经理关注的直接影响。
3、基金经理在谈论什么
3.1 关注焦点方法论介绍
为提取基金经理访谈中的核心关键词,报告采用经典的文本分析技术—TF-IDF算法。
- TF(词频)表示词在单篇文档中出现的频次占该文档总词数比例,反映词语在该文档中的重要程度
- IDF(逆文档频率)则度量一个词语在整个语料库中出现的稀缺性,数学公式中通过对数变换平滑处理频率分布
- TF-IDF为两者的乘积,既强调某词在特定文档中出现频率高,同时又在整体语料中较少出现,极大提升关键词筛选质量,剔除常见无意义词(如“基金”、“经理”)
通过TF-IDF计算,报告对每篇访谈生成词语重要性数值,并将这些词语的TF-IDF向量用于绘制词云及聚类分析,保证了对基金经理访谈文本的准确量化表达。
3.2 关注热点词云图分析
整体词云(图9)显示基金经理普遍关注“个股”、“收益率”、“产业”、“景气”、“经济”等核心投资维度,行业方面“科技”和“医药”显著。分时间段观察:
- 2020年上半年,疫情爆发使“疫情”、“经济”成为关键词,科技股受到重点讨论(图10);
- 2020年下半年,消费及医药成为主流热点,科技、医药、消费三驾马车特点明显(图11);
- 2021年上半年,市场风格快速切换,无明显投资主线,基金经理开始强调“均衡”和“仓位”,也关注“成长”股(图12);
- 2021年下半年,新能源主题火热,“新能源”、“赛道”成为关注核心,基金经理对“均衡”、“仓位”等风险管理也更加重视(图13)。
按管理规模细分,0-30亿的小基金经理关注“回撤”、“景气”等风险与景气周期变量(图15);而100亿以上大规模基金经理关注范围广泛,特别强调产业链、框架与经济大势等中观宏观因素(图16)。该分析表明基金规模与投资关注点呈现一定的层级差异。
4、基金经理群像刻画分析
4.1 群像刻画方法论
基金经理访谈文本通过TF-IDF变为高维词向量。为揭示基金经理间潜在的投资理念类别,报告选用层次聚类算法,该算法优势在于:
- 不需预先指定分类数量,能根据不同阈值调整;
- 可解释性强,有助构建基金经理分类体系;
- 能解决非球形数据分布问题,适合复杂文本聚类。
用聚类阈值设定为24类后,报告取得了较为均衡的分类结果。
4.2 群像刻画结果(表2节选)
报告节选了部分聚类并解释其投资特色:
- 聚类1:专注个股层面,关键词如“个股”、“选股”、“超额收益”、“仓位”等,体现自下而上的价值投资风格。
- 聚类2:以固收为主,关键词“债券”、“资产配置”、“回撤”、“宏观”等,注重风险控制与稳健配置。
- 聚类3:偏重个股基本面指标,如“roe”、“增速”、“现金流”等,进一步体现对基本面深入研究。
- 聚类4:倾向宏观视角,关注“经济”、“政策”、“流动性”等自上而下投资框架。
如上聚类结果将基金经理划分成不同投资理念类别,符合行业对基金经理风格的理论认知,透视不同视角对投资决策的影响。
5、结论性综合
本报告创新性地运用基金经理访谈文本数据,利用TF-IDF关键词提取与层次聚类技术,系统地刻画基金经理的集体画像及其投资理念。整体来看:
- 基金经理访谈集中在牛市期间,时序上表现出对宏观环境和热点主题的敏锐反应;
- 访谈覆盖多样,包括偏股混合型、灵活配置型及主题基金,反映基金经理在不同基金类型和管理规模上的异质性;
- 关键词词云揭示基金经理关注焦点因时间与市场环境变化显著,从疫情冲击到行业轮动,尤其新能源与消费主题崛起;
- 管理规模较小的基金经理更关注回撤与景气,而大型基金经理则关注宏观经济与产业景气,体现规模带来的策略差异;
- 聚类分析科学归类基金经理,显示自下而上个股精选和自上而下宏观配置两大主流理念,同时展现固收型经理的风险管理关注,形成多样化投资画像。
这些发现丰富了对中国基金经理行为研究的理解,为资产管理行业提供了全新的定量语言工具,有助于投资者和机构结合理念识别与风险管理。本研究的独特价值在于将文本挖掘技术引入基金经理研究领域,突破传统纯业绩分析的局限。
重要图表深度解读
- 图1(访谈样本月度分布):展示2017年至2022年基金经理访谈数量,牛市期访谈显著增多,验证市场环境对基金经理曝光度影响。
- 图3和图4(基金经理访谈次数分布):绝大多数基金经理仅被访一次,少数多次访谈显示行业内存在意见领袖或重点基金经理。
- 图7和图8(基金分类与主题分布):偏股混合型基金为访谈主体,主题基金中消费、电新崛起,科技主题在2021年占比下降显著。
- 图9-13(词云图系列):时间段词云反映基金经理关注点的动态迁移,从疫情到行业热点转换清晰可见,词云形象地表达了基金经理思想脉络。
- 图15与图16(按管理规模词云):管理规模差异明显映射投资焦点的不同,小基金侧重风险防控与短期波动,大基金则关注产业宏观框架。
- 表2(聚类结果节选):层次聚类明确区分基金经理的投资风格类型,体现出投资理念多元且有代表性的基金经理群体结构。
风险提示
报告模型及结论基于历史访谈及市场背景,存在市场环境变化导致模型失效的风险。投资者应结合宏观经济、行业政策及其他定量指标综合决策。
审慎视角
报告重点在于文本数据驱动的群像描绘,较少涉及基金经理实际业绩的对应验证,可能存在基金经理言论与实际操作不完全一致的偏差。此外,访谈样本偏向牛市、高关注度基金经理与机构,可能导致结果对冷门领域或熊市时段关注不足。层次聚类结果基于语义相似性,聚类阈值选择对结果有一定主观性,需结合实际投资风格进行验证。
结语
此报告通过科学严谨的文本分析方法,深入刻画了基金经理的投资关注与理念,拓宽了基金经理研究的视角,提供了丰富的数据和分析支持,具备较高的学术和实务价值,适合基金研究人员、资产管理机构及市场参与者参考使用。[page::0,3,4,5,6,7,8,9,10,11,12,13]
---
附图部分示例
基金经理访谈样本月度分布情况(图1)

全体基金经理关注点词云图(图9)

管理的基金规模在 100 亿以上的基金经理关注点词云图(图16)

基金经理聚类分析结果(表2节选)
| 聚类编号 | 关键词(节选) | 聚类内部访谈数量(个) |
|----------|------------------------------------------------------------------------------------|------------------------|
| 1 | 个股, 仓位, 医药, 选股, 超额, 盈利, 策略, 排名, 收益率, 超额收益, 均衡 等 | 80 |
| 2 | 债券, 资产配置, 回撤, 宏观, 流动性, 控制, 团队, 经济, 仓位, 策略, 规模 等 | 49 |
| 3 | ROE, 定价, 增速, 基本面, 现金流, 收益率, 盈利, 价格, 超额收益 等 | 40 |
| 4 | 疫情, 经济, 流动性, 政策, 景气, 赛道, 控制, 仓位 等 | 30 |
资料来源:知名自媒体公众平台,兴业证券经济与金融研究院整理 [page::12]