IS THE PANEL FAIR? EVALUATING PANEL COMPOSITIONS THROUGH NETWORK ANALYSIS. THE CASE OF RESEARCH ASSESSMENTS IN ITALY
创建于 更新于
摘要
本文提出一种基于网络分析的实证策略,通过对意大利三届经济学、统计学及工商管理研究评估面板成员的合著、期刊发表和机构归属三种网络连结结构比较,检验其智识构成的公平性。结果显示,2004-2010年及2011-2014年两届面板成员之间的合作及相关网络链接显著强于2015-2019年随机抽选的控制组面板,表明前两者存在认知同质性和潜在的不公平状况,可能导致评价结果的偏向和认知偏见。[page::0][page::5][page::10][page::12][page::17][page::23]
速读内容
- 研究背景及问题:近年来,研究评估成为高校及科研政策的核心工具,体现“程序公平”尤为重要。传统评估面板多依据性别、年龄、机构等可观察特征构成,但这些标准并不足以保障“智识层面”的多元性和公平性。[page::0][page::1][page::2][page::4]
- 文献回顾与理论框架:早期研究关注分配性公平,后续关注认知与程序公平,强调评估面板的学科及认知多样性,规避团体思维、裙带关系和认知同质化导致的评价偏差。[page::3][page::4]
- 意大利三届VQR研究评估面板构成差异:
- 2004-2010及2011-2014年面板由ANVUR委员会直接任命;
- 2015-2019年面板成员采用随机抽签方式选出,作为控制组。[page::5][page::6][page::9]
- 网络分析方法与指标设定:
- 构建三类网络:①合著网络(面板成员及其合著者合作关系及强度),②期刊共现网络(成员发表期刊重叠情况),③亲和网络(成员及核心合作者共同所属大学、研究机构及媒体)。
- 通过这些网络结构的集中度、连通度、组件数及中心性指标等,量化面板成员的智识和社交连结强度。[page::7][page::8][page::10][page::17][page::18]
- 合著网络关键发现:
- 2004-2010和2011-2014两面板网络具有明显更大的最大连通分量和更高的共同合著程度,中心学者相互连接密集。
- 2015-2019面板网络则高度分散,成员间合著关系稀疏,中心性指标明显较低。

[page::10][page::11][page::12][page::13]
- 期刊网络分析:
- 2004-2010及2011-2014面板成员发表期刊种类较少,网络密度和成员间期刊重叠度较高;
- 2015-2019面板成员发表面较广,包含较多不同期刊,反映智识多样性。

[page::14][page::15][page::16]
- 亲和网络分析:
- 前两届面板成员及其核心合作者在大学、研究中心和媒体归属上高度集中,有明显的核心群体;
- 第三届面板结构明显松散,重要成员及机构分布更分散,呈现多样性。


[page::18][page::19][page::20][page::22]
- 结论与启示:
- 形式上的多元标准(性别、机构、学科等)不足以保证程序公平;
- 两个被任命面板均表现出高度的学术及社交同质性,担忧认知偏见与裙带关系影响评估结果;
- 随机选拔面板在智识多样性和网络分散性方面优势明显,建议透明且多维度的面板选择机制;
- 可将网络分析视为评估面板智识公平性的有效工具。[page::23][page::24][page::25]
深度阅读
研究报告分析报告
---
一、元数据与概览
- 报告标题:
IS THE PANEL FAIR? EVALUATING PANEL COMPOSITIONS THROUGH NETWORK ANALYSIS. THE CASE OF RESEARCH ASSESSMENTS IN ITALY
- 作者:
Alberto Baccini, Cristina Re
- 所属机构:
意大利锡耶纳大学政治经济与统计系
- 发布日期:
文中未注明具体发布年份,但数据显示数据涉及至2019年结束。补充材料最晚为2024年初。
- 主题:
本报告研究意大利经济学、统计学与商业领域研究评价面板的组成人员公平性,运用社会网络分析方法检视面板成员间的学术合作关系、发表期刊和所属机构,评估能否反映学术多样性及程序正义。
- 核心论点与结论:
作者认为,仅凭面板成员的表面特征(如性别、机构、地理位置)判断公平不足,还需考察其内部的学术和社交联系。利用共著网络、基于期刊的网络及成员所属机构的“亲和力网络”,评估三个不同选拔机制的面板:前两期由意大利政府评价机构直接任命,第三期面板通过随机抽签选出作为对照。结果显示前两期面板的成员联系紧密度明显高于随机选拔的第三期面板,存在潜在的偏向或“认知特殊主义”,导致程序层面和实质层面不公平,影响了研究评估结果的公正性。[page::0,1,2][page::10-16][page::17-23]
---
二、逐节深度解读
1. 引言(Introduction)
报告开始强调研究评估在全球研究政策中正变得愈发核心,逐步融入大学和科研机构资源分配。评估的程序正义(procedural fairness)尤为重要,这是确保决策公正透明的关键,包括评审者的无偏、独立及代表性。通常,面板公平定义依赖于可观测特征(性别、年龄、机构、地域),以及科学能力和学科领域的平衡。然而,单纯的表层特征平衡并不保证学术观点的多元或公平体现。[page::1]
为体现程序公正,面板应合理代表所有受影响利益方。但实际操作中,如何界定“所有利益方”及其评价维度非常复杂。已有研究多关注评估结果的公平分布,例如性别、种族、声望对评奖的影响,较少探讨面板内部知识结构的公平问题。[page::1]
2. 研究评估、程序正义与面板构成的文献回顾(Section 2)
- 第一波研究着眼于是否存在裙带关系、偏见、群体思维(groupthink)及学术门派偏爱,指出同行评审系统有时会抑制创新,偏向保守。
- 第二波研究 更强调“程序正义”——即评审过程的规范与执行,关注面板成员认知结构与知识范式对决策的影响,揭示面板成员可能通过默契或既定规则固化某些学派优势,如正统经济学占主导地位,抑制异端观点。[page::3-4]
该部分强调学科内部的认知与文化差异是面板公正性的核心难题,表明仅满足表面性别与地理的多样性远不足以涵盖智识多元,因而须分析成员的知识网络关联。
3. 意大利研究评估制度与面板选拔(Section 3)
意大利针对2004-2010、2011-2014、2015-2019三轮研究评价(VQR)设立了对应面板(GEV)。前两轮由ANVUR(国家研究评价机构)董事会直接指定,第三轮采用抽签随机选拔,后三者仅从对面板申请者中抽取成员。前两轮关注性别、外籍及机构分布(例如第一轮要求20%外籍),第三轮则要求5%女性且以随机抽签为主。官方宣称各项指标均达标,但缺乏对单个面板的详细数据披露,公众和学界对此公平性存疑。[page::5-7]
特别指出经济学、统计学和商业面板的成员高度同质,后者常被曝光为某特定派别(极端自由主义)的核心,存在“利益集团捕获”的过程,影响评估的客观性和多样性。
4. 研究设计(Section 4)
报告避开复杂主观的视角划分,采用网络分析,以“联系强度”量度面板成员间的知识视角相似度,具体建立三类网络:
- 共著网络:基于成员及其合著者的论文合作,权重为合作论文数。
- 期刊网络:成员间是否在同一或相似期刊发表文章,反映专业定位和学术生态相似度。
- 亲和力网络:成员或其关键合著者的教育背景、现任职机构及媒体合作,揭示潜在的社会与政策倾向联系。
报告以第三期面板作对照组,假设申请流程自选者特性一致,由此控制其自选偏差,仅捕捉政府指派过程可能带来的系统性偏差。[page::7-9]
5. 共著网络分析(Section 5)
先比较三个网络的规模、作者和合作数量,发现前两期面板成员合作更密切、论文重叠性更高。第三期面板合作更分散,作者合作度(degree)和中介中心性(betweenness)较低,结构更分散。前两期面板存在大型主连通分量(第一期65%的节点与24位成员联结),第三期面板则构成更多小团体,成员更孤立,体现出前两期面板成员间较强的合作纽带和认知同质性。[page::10-12, 33-34]

6. 基于期刊的网络分析(Section 6)
三个面板成员发表期刊数逐步增加,第三期成员平均期刊数最高,反映更广泛学术覆盖。基于“期刊重合度”的单模式网络密度及成员连接度,第一二期面板明显高于第三期。采用岛屿检测算法,第一二期大岛(即高度连接子群)分别含有超过一半成员,第三期则无明显大岛,超半成员未归属任何群岛,表明其期刊发表分布更均匀分散,学术视角更为多元。
图2展示了三个面板的期刊网络岛屿分布,核心成员相较共著网络出现位移,显示不同视角层次间联系的差异性。[page::12-16]

7. 亲和力网络分析(Section 7)
数据基于成员及其关键合著者的教研机构背景、硕博院校及社会性媒体发表记录。亲和力网络反映成员社会政治及认知联系。对三面板的双模网络投影分析,第三期面板变量明显较低,机构及成员间邻接程度稀疏,权重偏低。岛屿分析显示,前两期面板存在大型核心群岛,包含绝大多数重要成员和机构,第三期则结构更加碎片化,重要成员分散在多个小岛。
图3和图4展示了成员和机构的亲和力网络,前三均以博科尼大学为核心,但第一二期连接度和中心性远超第三期。此现象揭示前两期存在实质且隐形的社会和意识形态“共同体”,可能影响研究评价的多元性。[page::17-22, 33, 38-42]


8. 讨论与结论(Section 8)
- 问题确认:研究评价作为重要政策工具,需保证程序正义。标准公正指标(性别、地理等)不足以避免学术观点的“认知特殊主义”及“裙带关系”。尤其当学科存在多个对立学派时,面板的学术多元显得尤为关键。
- 创新方法:报告创新地使用多维网络分析揭示隐藏的学术与社会关系,提出任命过程中的非随机性导致了实质的不公。
- 实证发现:通过三个网络指标对比发现,前两轮面板成员间联系远超随机选拔组,呈现紧密社群,缺乏多元学术观点,影响了研究评估的公正性。
- 政策启示:建议研究评价中增加透明、可操作的公平监控机制,考虑成员间合作关系、期刊发表和所属机构的多样性,不应仅依赖表面指标。随机抽签可能作为减缓偏见的手段,但并非完美解法。
- 局限及反驳:针对异议,报告指出即使存在少量异质成员也可能是“象征性代言”;且限制样本(如仅取意大利高引用学者)既不科学也无法反映全球范围。
- 进一步研究建议:由于微观评估数据保密,难以检验具体偏见机制,但通过部分数据已有文献显示评价方法本身也存在异常,暗示面板组成可能影响决策过程。[page::23-26]
---
三、图表深度解读
1. 表1 - 共著网络结构基本统计(页10-11)
- 三个面板的节点和边数量相近,但第一二面板的共著作者重合度高,群体更集中。
- 第三面板拥有更多不同的作者和合作关系,显示更分散的合作网络。
- 最大紧密联结分量大小为第一面板512个节点(占比65%),2011-2014为403,2015-2019仅324,后者呈现更多孤立小群。
- 中介中心性最大值第一面板最高(0.25),第三面板最低(0.045),说明第一二面板中枢成员明显更集中。
2. 图1 - 三面板共著网络组件结构(页13)
- 大红色节点代表面板成员,节点大小表明中介中心性。前两面板展示一个主导的大组件,成员间联系密切。第三面板网络结构碎片化,主组件体量和成员数量明显少。

3. 表2 & 表3 - 期刊基网络统计(页14)
- 面板成员发表的期刊数递增,第一面板360个,第三面板566个。
- 第三面板成员平均发表期刊更多,反映更大学术广度。
- 单模式面板成员网络密度和平均度数第三面板最低。
4. 表4 & 图2 - 最大岛屿统计及期刊发表网络岛屿结构(页14-16)
- 第一二面板大岛比例分别为58.3%和54.8%,第三面板仅16.2%。
- 节点大小与中介中心性相关。
- 色彩区分不同岛屿,灰色节点未归属任何群体。第三面板多数成员未聚集于岛屿,显示发表路径更分散。

5. 表5-7 & 图3、图4 - 亲和力网络分析(页17-22)
- 第三面板的投影网络无论成员还是机构都显示连接度、密度显著较低。
- 亲和力网络中的大岛屿统计、重要成员聚集情况都呈现明显差异,第一二面板存在中心集权式核心群组。
- 顶尖机构多集中于博科尼大学及其关联研究组织,影响覆盖范围有限。
- 图示颜色区分岛屿,节点大小为特征向量中心性,边粗细对应共有附属数量。第三面板机构分布更分散无显著核心。


---
四、估值分析
本报告为社会科学领域的研究方法论研究,不涉及财务数据或估值模型,故无现金流折现(DCF)、市盈率(P/E)等估值方法相关内容。
---
五、风险因素评估
- 报告揭示的风险是程序不公导致学术观点单一、学术权力被特定派别垄断,进而影响评价客观性和学科研发展方向。
- 面板成员过度集中可能强化“认知特殊主义”,阻碍多元创造和创新。
- 数据不公开透明限制了独立验证面板公正性的能力,增加政策设计风险。
- 选择公示标准与实际选择操作脱节构成制度性风险。
---
六、批判性视角与细微差别
- 报告基于网络分析方法突破传统以性别、机构作判断的限制,但所依赖的数据仍有局限,如合著关系不代表认知完全一致,期刊发表存在学科惯性等。
- 报告对随机选拔的假定为公平对照组做基础,但未完全排除自选偏差可能种群结构的差异。
- 政府指定的前两轮面板成员中存在少数异见派,作者评论为象征性代言(tokenism),实际影响有限。
- 报告面对官方和保守异议,给出基于开放样本和全球视角的回应,增加说服力。
- 逻辑严谨且层次分明,但“如何量化界定不公平阈值”的问题承认难以克服。
---
七、结论性综合
本报告通过对意大利三轮经济学、统计学与工商管理学科研究评价面板的详细网络结构分析,确认前两期面板成员间存在显著高于随机对照组的学术和社会联系度,反映其组成远非理想的学术多元和程序公正。具体体现在:
- 共著网络表现为大型紧密合作组件,反映关键中心成员相互合作支配了评估过程。
- 期刊发表网络显示成员集中在较窄的少数学术期刊范围,限制了理论和方法论多样性。
- 亲和力网络进一步凸显成员及其重要合著者归属于有限的教育机构、研究中心和媒体阵地,构成学术-政治话语圈层。
这一系列网络结构的差异表明,前两轮面板通过非随机、且不公开透明的任命程序造成了认知上的“圈内人”效应,可能导致评估结果不公正,并限制了学科内部多样声音和创新。基于以上,报告建议:
- 研究评估程序应加强对面板成员间隐形联系的监督,采用基于网络的公平性测试。
- 推广随机抽签等提高过程透明性和公正性的做法,同时明确限制规则来防止合作密切成员同时入选。
- 对外公开面板构成及其网络指标,保障独立审查与监督,提升评价体系公信力。
综上,面板组成的深层次分析是破解研究评价制度内隐不公平和认知偏见的重要工具,能有效辅助政策制定者构建更公正、有效的学科评估体系。[page::23-25]
---
备注
为确保分析准确,全文对所有章节进行了系统阅读与观点梳理,重点分析了所有关键表格与网络图示的数据内涵和理论联系。所有引用均标注页码便于查验。分析力求客观中立,避免未基于文本的个人臆测。
如需针对报告中任何技术性内容(如“介数中心性”、“岛屿算法”)进一步详细解释,也可提供。