`

The Rise of Health Economics: Transforming the Landscape of Economic Research

创建于 更新于

摘要

本报告通过结合文献计量分析和自然语言处理技术,系统梳理过去30年健康经济学在经济研究中的兴起,揭示该领域论文在顶级经济学期刊比例的显著提升及其创新性贡献。研究利用RoBERTa模型进行论文分类,发现健康经济学论文的创新性和影响力显著高于其他领域,并通过时间序列分析展示了创新高峰的周期性及不同子领域的贡献,最终确认健康经济学从边缘学科成功迈入主流经济学的过程及其对经济学知识体系的重大影响 [page::0][page::1][page::9][page::10][page::12].

速读内容

  • 健康经济学论文在不同类型经济学期刊中的占比持续增长 [page::1]:


- 1994-1998年间,“Top-5”顶级期刊中健康经济学论文占比约2%,2020年提升至6%。
- 一般经济学期刊健康经济学论文比例从7%增长到14%。
- 相关领域期刊如劳动经济学、发展经济学的健康经济学论文增加了4倍。
  • 创新型自然语言处理模型(RoBERTa)助力精准分类健康经济学论文 [page::3][page::5]:

| 分类样本 | 灵敏度 (Sensitivity) | 特异性 (Specificity) | F1分数 |
|--------------|--------------------|----------------------|---------|
| 期刊样本 | 0.960 | 0.969 | 0.956 |
| 作者样本 | 0.481 | 0.956 | 0.441 |
| 综合样本(阈值0.498) | 0.949 | 0.962 | 0.929 |
- 综合模型在分类中表现优异,极大减少分类歧义,作者和期刊观点结合提高准确率。
  • 论文创新质量评分采用向量文本相似度指标,包括“新颖性”、“影响力”和“质量”三核心维度测度学术贡献 [page::4][page::10]:



- 健康经济学论文在新颖性和影响力指标上均高于其他经济学论文,质量指标有明显周期性波动。
- 2006-2009及2014-2016两个创新高峰期分别受“影响力”和“新颖性”驱动,代表文献集中于早年生命经历、医疗保障和支付激励机制等主题。
  • 不同经济学子领域健康经济论文的集中分布及其关系验证 [page::8][page::9]:



- “公共财政”和“健康、教育、福利”领域健康经济论文比例最高,体现跨学科融合。
- 词向量降维和聚类分析显示健康经济学论文呈现高度结构化、与劳动经济、发展经济等密切相关的学术集群。
  • 创新性质量指标对未来论文引用数具有显著正向预测作用,且控制期刊固定效应后预测效应增强 [page::11]:

| 指标 | 未控制期刊 | 控制期刊 |
|-------|------------|----------|
| 新颖性 | +3.8% | +7.1% |
| 影响力 | +4.3% | +5.5% |
| 质量 | — | +8.0% |
- 健康经济学论文的创新性质量指标对引用的影响低于非健康论文,表明其评价与其他学科较为客观。

深度阅读

The Rise of Health Economics: Transforming the Landscape of Economic Research — 详尽分析报告



---

1. 元数据与概览(引言与报告概览)


  • 报告标题:The Rise of Health Economics: Transforming the Landscape of Economic Research

- 作者:Lorenz Gschwent, Björn Hammarfelt, Martin Karlsson, Mathias Kifmann
  • 发布日期:2024年10月10日

- 发布机构:未明确(但从文献和引用逻辑推测为学术研究机构背景)
  • 研究主题:健康经济学在经济学领域中的兴起、其研究输出的变化、影响及评价方法。重点聚焦健康经济学如何从一个边缘的专门研究领域,成长为经济学主流领域的重要组成部分。

- 摘要核心内容
- 过去30年间,健康经济学从边缘学科逐渐成为经济研究和学术发表中的主流。
- 利用文献计量学与自然语言处理(NLP)方法,对健康经济学论文进行分类和质量评价。
- 研究发现健康经济学论文因创新性和高质量研究推动其快速发展,且不同子领域表现出周期性的质量波动。

此报告的主要信息是,通过先进的定量与文本分析工具,揭示了健康经济学不仅增长迅速,而且在经济学知识体系中的贡献显著,特别是通过创新驱动而非单纯模仿传统方法。[page::0][page::1]

---

2. 逐节深度解读



2.1 引言与背景(Section 1)


  • 关键论点:健康经济学虽有历史悠久的基础理论(如Arrow 1963,Newhouse 1970,Grossman 1972),但30年前仍然是小众领域,难以进入顶级经济学期刊。

- 现状变化:过去三十年,健康经济学迅速进入顶级期刊,论文比例迅猛增长,顶级5大期刊(AER, JPE, QJE, REStud, Econometrica)中健康经济论文占比从2%增长至6%。
  • 数据支持:图1展示不同类型经济期刊中健康经济论文的占比变化,顶级刊物明显上升趋势,且在劳动力、发展等相关领域的期刊中增长更为显著。

- 目的:解释健康经济学崛起背后的推动因素,包括其对经济学知识基础的贡献以及不同子领域的作用。[page::1]

2.2 研究方法与数据(Section 2)


  • 样本选择

包含25个经济学核心期刊(1994-2023年),其中包括:
1.五大健康经济学领域核心期刊,如 JHE, HE 等;
2.涵盖健康领域的顶级综合期刊,如 AER, JPE 等;
3.非健康领域的其他经济学核心期刊,如宏观、国际经济学期刊,以作为对照。[page::2]
  • 论文分类方法

- 传统JEL代码划分存在多重缺陷:代码杂乱、作者编辑判定差异大、时间不一致、多个领域交叉无唯一对应等问题,难以准确分类健康经济学论文。
- 报告采用两种基于NLP的分类方案结合:基于期刊(journal-based)分类和基于作者的(author-based)分类。
- journal-based分类假定健康经济学论文大多发表于健康经济学核心期刊,其他视为非健康经济学论文。
- author-based分类通过作者发表健康经济学期刊比例来标识是否为健康经济学家,再将该作者在综合期刊发表的论文标记为健康经济学论文。
- 使用RoBERTa大型语言模型对论文标题及摘要进行文本编码和分类,模型结构包括文本编码器、线性降维层和sigmoid层(输出概率),训练集划分为训练/验证/测试集。
- 两种分类方法结合优于单独使用,构建了覆盖全部36,314篇论文的高准确度分类器。[page::3]
  • 创新性指标构建

- 采用Kelly et al. (2021)专利评估方法类比,计算论文“新颖性”(Novelty)、“影响力”(Impact)和“质量”(Quality)。
- 利用sentence-t5-xl模型生成论文摘要的768维向量,通过计算论文与过去和未来论文的平均向量之间的余弦相似度确定指标。
- 具体定义:
- 反向相似度(BS):与过去5年论文向量平均相似度。
- 同年相似度(PS):与当年论文平均相似度。
- 正向相似度(FS):与未来5年论文平均相似度。
- Novelty = PS - BS 反映论文相对于当年论文的独特性。
- Impact = FS - PS 反映未来论文对该论文的借鉴程度。
- Quality = FS - BS 体现创新带来的后续影响力。[page::4]

2.3 论文分类结果与验证(Section 3.1)


  • 表1核心发现

- 三个分类器分别是journal-only、author-only和两者结合。
- journal-based 分类器准确率和灵敏度均超过95%,作者分类器稳定性稍低。
- 两者结合使用,通过调整判断阈值获得最高综合F1分数(0.929),作为后续分析的分类工具。
  • 图2

- 分类概率分布极端集中在0和1附近,表明大部分论文的分类结果高度确定,只有少量在0.5附近存在分类不确定。
  • 表2

- 展示不同置信度层次下代表性论文示例及分类概率。
- 高置信度部分健康经济学论文如Manning和Marquis (1996),Decker (2005),Coile et al. (2014);弱置信度中有些涉及发展领域的论文。
- 部分非健康论文也表现出较低置信度,说明分类器在边界问题上表现谨慎。
  • 验证

- 与Angrist et al. (2020)的JEL归类对比,健康类别中I类“健康教育福利”占比最高,且在金融G类与公共H类领域也有明显代表。
- 图3a和3b展示了两种JEL/领域划分方式下,健康经济学论文在各领域中的分布情况。
- 图4通过文本嵌入降维聚类,清晰显示健康经济学论文在二维空间中的聚集及其与劳动力经济、发展经济等领域的关联。
- 通过与Wagstaff和Culyer (2012)最具影响力论文列表对比,分类结果在高置信度上也与既有文献认可度一致。[page::5][page::6][page::7][page::8][page::9]

2.4 创新性、影响力与学术质量分析(Section 3.2)


  • 图5:健康经济学社会文献整体在新颖度(Novelty)和影响力(Impact)两项指标均高于其他领域,且存在明显的波峰(某些年份表现尤为突出)。

- 图6a & 6b:健康经济学论文表现出更高的综合质量(Quality),且该指标的周期性波动由影响力(Impact)先行驱动,随后新颖度(Novelty)响应。
  • 具体洞察

- 2006-2009年波段中,影响力高峰由“胎儿起源”假说相关文献主导,如Bleakley (2007),Doyle Jr (2007),Almond and Currie (2011)的综述等。
- 该波段后期的新颖性上升,主要与医疗融资相关的论文增加有关,如Flores et al. (2008)及其他。
- 2014-2016年另一波质量上升,起始受健康保险中财务激励研究推动(如Clemens and Gottlieb (2014) 等),随后的新颖性增长与实证方法学相关文献增加有关(如Jones et al. (2015)等)。
  • 引用预测(表3):

- 创新性指标和影响力指标分别与论文被引用次数正相关,且两者负相关会削弱单变量估计,联合回归系数几乎翻倍。
- 质量指标(创新+影响综合)与引用量正相关显著,包含期刊固定效应后,系数显著增强。
  • 健康经济学论文与引用关系(表4)

- 健康经济学论文总体引用基准较低,且其创新性、影响力和质量对引用的溢价低于其他领域论文,即健康经济学论文在引用层面的“奖励”较少。
- 以上关系在控制期刊固定效应后依然成立,说明论文被引用的差异主要非由期刊影响。
  • 结论及解读

- 健康经济学论文确实更创新、更有影响,但其被引用“回报”略逊,或许与健康经济学与生命科学接近但经济学界引用习惯有关。
- 这一发现有助于理解为何健康经济学论文在高质量期刊数量上快速提升,且影响深远,但在引用聚焦度上不占优势。[page::10][page::11][page::12]

---

3. 图表深度解读



图1:健康经济论文占比增长趋势(第1页)


  • 内容说明:图1展示1994-2023年期间,健康经济论文在不同类别经济学期刊中的占比变化,类别包括:顶级5大期刊、综合类期刊、以及交叉领域期刊。

- 数据解读
- 顶级5大期刊健康经济论文比例由2%增长至约7%。
- 综合类期刊翻倍增长,从7%至14%左右。
- 其他相关领域期刊健康经济论文量四倍增长。
  • 与文本关联:图表支持了引言中趋势描述,说明健康经济学从边缘领域成功进入主流经济学期刊,体现了健康经济学的学术典范意义。[page::1]



表1:分类器性能统计(第5页)


  • 内容说明:比较journal-based、author-based及两者结合下的分类灵敏度(Sensitivity)、特异性(Specificity)和F1评分。

- 数据解读
- journal-based达到约96%的敏感度和97%的特异度,表现最佳。
- author-based表现较弱(敏感度70%,特异度93%)。
- 综合分类器平衡了两者,敏感度、特异度均达到94%以上,F1最高。
  • 逻辑说明: 表明基于文章和作者双重视角结合的NLP分类方案有效提高健康经济论文的识别精度和广泛适用性。[page::5]


图2:分类概率分布(第6页)


  • 内容说明:展示三种分类器对38716篇论文的健康经济学概率预测分布。

- 数据解读
- 大部分论文概率极接近0或1,显示分类置信度高。
- 在0.5附近概率低,表明分类器对于少数论文存在不确定或冲突。
  • 与文本关系:验证了分类器的稳健性及两种方法一致性。[page::6]



图3:分类与JEL代码/经济学领域对比(第8页)


  • 内容说明:两个子图展示按JEL代码和经济学领域划分下健康经济论文比例。

- 数据解读
- (a)健康经济学论文绝大多数落在I类“健康、教育、福利”,同时在G类“金融经济”和H类“公共经济”中也较多。
- (b) “公共财政”领域三分之一论文属于健康经济学,其他领域均低于10%。
  • 支持论点:说明健康经济学不仅仅局限于传统医疗领域,其跨学科特征突出。[page::8]



图4:文本嵌入降维聚类(第9页)


  • 内容说明:通过PCA+ t-SNE降维,展示所有论文在二维空间的聚类,标注健康经济学论文分布及聚类中最常出现的期刊。

- 数据解读
- 健康经济论文群体呈现局部聚集,区别于其他领域。
- 多个簇显示健康经济与劳动力、发展经济、公共经济等领域关联紧密。
  • 意义:以向量空间模型技术验证学科分类的合理性和领域交错特征。[page::9]



图5:新颖度与影响力时间序列(第10页)


  • 内容说明:历年健康经济学论文与其他经济学领域论文的新颖度和影响力指标对比,含95%置信区间。

- 发现:健康经济学整体得分高于其他领域,且表现出周期性波峰,代表特定时代创新与影响的集中爆发。[page::10]


图6:质量指标及其分解(第10页)


  • 内容说明

- (a)健康经济学论文质量指标整体高于其他领域波动明显。
- (b)质量分解为新颖度(Novelty)和影响力(Impact),发现波峰先由影响力上扬引领,随后新颖度响应。
  • 解读:展示论文质量及其周期性动力传递机制,强调影响力波峰期后续新颖创新的辐射效应。[page::10]



表3 & 表4:文本指标与引用关系(第11-12页)


  • 表3:表明创新、新颖和质量指标均显著正相关于后续引用,控制期刊后效应更强。

- 表4:加入健康经济学交互项后,发现健康经济论文在引用对创新、影响和质量的“回报”较低。
  • 含义:健康经济学的论文虽创新影响显著,但传统引用优势不明显,提供了更深入的影响力层次认知。[page::11][page::12]


---

4. 估值分析



报告核心并非传统意义上的市场估值或财务现金流分析,因此无DCF、市盈率等财务估值模型。其“估值”体现在学术影响力的量化测度(Novelty, Impact, Quality)上,结合文献计量与文本分析形成学术价值评价体系。这种跨学科“学术估值”方法创新地反映了健康经济学的学术贡献大小,替代了传统财务指标。

---

5. 风险因素评估



报告未显著提及健康经济学研究兴起的风险因素及缓解,但隐含关注点包括:
  • 论文分类方法本身的局限(JEL代码不一致,文本分类可能受标题摘要表达差异影响);

- 作者身份认定噪声及模型分类不确定性(图2中间概率区间显现);
  • 不同子领域间的质量周期波动带来研究话语权的不均衡。


以上因素均可视为对研究结果外推和解释的潜在制约。

---

6. 批判性视角与细微差别


  • 优势:采用最新NLP工具,结合文献计量创新指标,分析视角新颖;数据涵盖期刊广,样本量大。

- 潜在局限
- 分类准确度虽高,但基于机器学习模型,仍依赖于训练数据的代表性,对极端边缘论文可能判别不清。
- 结果对引用的解释未反映引用动机复杂性(如自引、领域引用习惯差异等)。
- 对健康经济论文“引用溢价”较低的解释还需更多微观层面分析。
  • 内部一致性:全篇论述连贯,数据与结论互相支撑,验证方法完备,未发现明显矛盾。


---

7. 结论性综合



本报告全面、深入地分析了健康经济学在过去三十年间在经济学主流领域的崛起轨迹。主要发现在于:
  • 健康经济论文在顶级期刊比重显著提高,成为学科的重要组成部分。

- 基于先进的自然语言处理技术和文献计量指标,分类健康经济论文精准且稳健。
  • 健康经济学论文整体质量高于经济学其他领域,表现出明显的创新性和影响力,且质量指标呈现周期性峰值。

- 创新性波峰与具体重要的研究主题相对应,如胎儿起源理论、医疗融资和医患激励机制研究等。
  • 健康经济学的创新与影响力与引用数量存在正相关,但获得的引用“溢价”相对较低,表现出引用动力机制的复杂性。

- 文本嵌入、降维聚类及JEL编码比较均支持健康经济学独特且跨学科性质。

整体上,报告展现了健康经济学从边缘学科转型为融合创新、贡献丰富的经济学分支的清晰路径。通过科学严谨的方法论,也为未来经济学领域内其他子领域的评价提供了可借鉴的量化范式。[page::0][page::1][page::5][page::8][page::10][page::11][page::12]

---

附录:关键图表示例


  • 图1:健康经济论文在不同期刊类型中的增长趋势


  • 图2:分类概率分布


  • 图3:健康经济论文与JEL代码的分布


  • 图4:二维空间聚类展示论文主题关系


  • 图5 & 图6:创新性、影响力与质量指标的时间演进




---

此为该报告基于全文的严谨、全面与详尽的分析解读,涵盖其理论背景、方法创新、数据支持、实证验证以及对学术影响的测量,具有较高的参考和借鉴价值。

报告