`

The Pay and Non-Pay Content of Job Ads

创建于 更新于

摘要

本报告系统性分析了挪威职位广告中薪酬及非薪酬属性的信息内容,利用文本分析提取47种职位属性并关联雇主吸引力指标,发现约55%广告含薪酬信息,且非薪酬信息的预测力与薪酬相当。高薪雇主更频繁宣传薪酬相关内容,而高福利雇主倾向强调灵活工作等条件。职位广告内容能够解释雇主价值60%的变异,且信息透明提升了劳动力流动的效率与质量,特别是促进了性别和教育层面的自我筛选[page::2][page::3][page::4][page::20][page::32][page::36][page::39][page::44][page::48]

速读内容

  • 挪威职位广告覆盖率高,近300万条样本横跨2002-2019年,包含文本及结构化信息(岗位、行业、地点、雇主编码)[page::7]。

- 利用自然语言处理技术,构建了包含1772个表达的词典,自动识别47类薪酬及非薪酬职位属性,如“灵活工作时间”、“优质工作环境”等,广告中平均包含6类属性[page::12][page::15][page::16]。
  • 验证结果显示文本分析方法准确性高(精确率普遍>80%),能较好反映职位真实属性[page::17][page::18]。

- 55%广告公布薪酬相关信息,具体薪酬(数字/区间)仅占27%,非薪酬如合同期限、工作时间、工作环境等普遍出现[page::19][page::20]。
  • 职位属性的变异更多由雇主个体决定,对行业和岗位的依赖较小,证实了广告内容存在“雇主固定效应”[page::21]

  • 基于Sorkin模型及匹配数据估计雇主整体价值、薪酬价值、非薪酬(福利)价值和工作安全感水平,发现薪酬与非薪酬价值呈显著负相关,体现补偿性差异[page::22][page::32]。

  • 高薪雇主偏向发布薪酬和职业晋升信息,非薪酬价值高的雇主更常提到灵活工时、合同期限等便利条件;两者在广告中体现负相关[page::36][page::38]

  • 仅职位广告内容可解释雇主整体价值60%的变异,且非薪酬属性的解释力接近薪酬属性。加入行业、岗位、地域因素后仍可解释10-20%额外变异[page::39][page::41]

  • 广告信息与职位公开空缺持续时间呈负相关,说明更具吸引力的雇主能更快完成招聘[page::42][page::59]

- 模型显示男女和教育层面存在异质性,女性和高学历者的非薪酬价值更被职位广告信息捕捉,说明信息匹配上存在群体差异[page::42][page::43]
  • 计量模型预测职位广告信息能增加劳动力向更高价值岗位流动1.1%,占充分信息模型增量的约25%。性别和教育层面存在差异,女性和高校毕业生受益更大[page::44][page::45]

- 区分向薪酬更高和非薪酬福利更好的雇主流动,发现男性更倾向通过提高薪酬实现流动,女性则更多流向非薪酬福利更好的岗位,反映偏好差异[page::46][page::47]
- 结论强调职位广告中薪酬及非薪酬属性均为劳动者评估雇主的重要信息来源,为政策制定(如薪酬透明度)和招聘实践提供数据支持,未来可扩展至不同市场、周期及招聘环境研究[page::48]

深度阅读

深度分析报告:《The Pay and Non-Pay Content of Job Ads》—— 挪威职位广告中薪酬与非薪酬信息内容的全面研究



---

1. 元数据与概览



标题:《The Pay and Non-Pay Content of Job Ads》

作者:Richard Audoly, Manudeep Bhuller, Tore Adam Reiremo

发布日期:初版2024年7月,更新版2024年9月

主题:该报告聚焦于分析挪威职位招聘广告中展示的薪酬(pay)及非薪酬(non-pay)工作属性的内容,研究其与雇主吸引力之间的联系及信息含量。

核心论点及主要发现
  • 大约55%的职位广告包含薪酬相关信息,几乎全部广告包含非薪酬属性信息。

- 广告中公开的工作属性是预测雇主吸引力的重要指标。非薪酬属性对预测雇主吸引力的作用与薪酬属性不相上下。
  • 薪酬较高的雇主更频繁提及薪酬相关属性,而提供较多福利的雇主则多提及工作灵活性等非薪酬属性。

- 结构模型估计表明,利用广告信息可以模拟不同信息环境下的劳动力流动,为理解信息披露对劳动市场匹配效率的影响提供了新视角。

关键词涵盖:amenities(福利)、compensating differentials(补偿差异)、worker mobility(劳动力流动)、pay transparency(薪资透明)等,属于劳动经济学领域的多个JEL分类代码[page::0-4]

---

2. 逐节深度解读



2.1 引言


  • 报告背景建立在劳动经济学中工作场所不仅仅是薪酬的观点,强调“补偿差异”和“福利”在工作选择中的重要性。引用实证研究(Mas & Pallais 2017等)指出福利(如远程办公、弹性工作时间)有显著的薪资折价。

- 但工作者如何获得工作薪酬和福利信息尚不清楚。职位广告作为重要信息传递渠道,其内容如何反映实际的薪酬和福利,是该研究的核心问题之一。
  • 报告四个主要目标:①定量分析广告中可获取的薪酬与非薪酬信息;②描述不同类型雇主如何在广告中体现这些信息;③统计评估广告信息对雇主价值的预测能力;④利用结构模型探讨广告信息对劳动市场流动的影响。[page::1-4]


2.2 数据与机构背景



职位广告数据
  • 包括从2002至2019年间挪威近乎全量的招聘广告,约300万条。

- 数据来源涵盖在线招聘网站、报纸扫描及劳务局直接采集,结构化信息包含雇主ID、发布和结束日期(空缺持续时长)、岗位数、职业编码(基于ESCO第四位分类)。
  • 典型职位文本约200词,利用自然语言处理(NLP)工具进行文本分析。

- 独特优势是广告能直接追溯到具体企业,使得文本信息与企业实际表现关联成为可能。[page::7]

匹配的雇主-员工数据
  • 覆盖2000-2019年间所有员工的月度工作经历,含雇主、工资及工作小时数信息。

- 薪资进一步由年收入除以合同工作小时数计算平均时薪,支撑模型中薪酬部分估计。
  • 包含员工背景(性别、教育等)及企业特征(行业、区域)。

- 为分析样本限制,于分析中采用分五年一组,重点关注2015-2019年。[page::8-9]

样本筛选
  • 通过多重筛选步骤,剔除无文本或不含挪威文档的广告,要求企业有充分劳动力流动数据等,最终用于分析的广告和企业数量大幅萎缩但覆盖高比例劳动者和岗点,确保估计质量与代表性。[page::9-10, Table 1]


招聘的有效性
  • 将招聘广告与实际职工入职匹配发现,超过87%的非临时企业广告可在6个月内匹配到入职员工,验证广告作为招聘核心渠道的作用。[page::11]


2.3 职位广告中薪酬与非薪酬属性提取


  • 采用人工审阅与无监督机器学习结合的方法,构建47种工作属性分类,归纳为薪酬、福利、工作时间、工作环境、岗位任务等十大类。

- 利用Word2Vec CBOW模型扩充属性表达的文本词汇库,实现对4348个词组的识别映射精确化、公示化、自动化,有效捕捉广告文本中多样自然语言表达的工作条件信息。
  • 属性检测结果显示,55%的职位广告至少包含一项薪酬信息,27%明示薪资数额或薪资区间,近乎所有广告包含非薪酬相关属性(如弹性工作时间、合同期限、工作环境等)。

- 文本提取的精度与召回率通过随机抽样人工复核验证,整体精准度和回收率均超过80%,但部分非核心属性(如小福利)性能稍差。[page::12-19, Table 2, Table 3]

2.4 广告内容的行业、职业、企业差异


  • 通过逻辑回归分析广告属性与行业、职业、地理位置及企业固定效应的关联。

- 发现行业、职业及地理因素能解释职位属性差异约30-40%,但加上企业固定效应后解释率提升至50-70%,表明企业对所用职位广告属性有较强的一致性和制度化偏好,支持后续以企业为分析单位的研究设计。[page::19-22, Figure 3]

2.5 结构模型:工人对雇主价值的估计



模型设定
  • 基于Burdett & Mortensen (1998)带偏好异质和随机搜索的框架,考虑工作价值由薪酬和非薪酬(福利)两部分组成,同时引入工作安全性(非自愿离职率等)因素。

- 利用匹配数据中工人与雇主间的流动频率和工资信息,反推工人对各雇主的流动偏好(即雇主价值$Vj$),拆分为薪酬溢价$\ln Wj$和非薪酬$aj$组成,以及工作安全度$sj$。
  • 工人通过随机搜索接触不同雇主机会,按价值排序择业,个体选择受极值型偏好扰动影响。

- 模型参数通过观察雇主间工人流、雇主规模和工资雇主固定效应识别,要求雇主间形成强连接集,且每雇主均从非就业流入劳动力。模型区分自愿与非自愿流动。[page::22-30]

估计方法
  • 应用雇主-员工数据,尤其雇主固定效应估计薪酬溢价,结合流向数据解构雇主价值多元构成。

- 利用k-means聚类算法减少参数维度,提高估计稳定性,基于薪酬分布、流动率以及行业、职业和地理位置等综合变量对雇主聚类。
  • 主要样本为20-60岁员工,且截取2015-2019年代做为基准,另外分性别及教育水平异质分析[page::29-31]


2.6 估计结果


  • 估计结果显示雇主整体价值$Vj$与薪酬溢价$\psij$呈正相关(0.36),也与非薪酬福利值$aj$和工作安全$sj$显著相关,但薪酬和福利之间存在负相关(-0.58),支持补偿差异理论。

- 非薪酬福利对低价值雇主区间影响较大,薪酬对高价值区间更显著。
  • 不同性别和教育群体估计揭示,女性和低学历工人非薪酬对雇主价值的影响更大,补偿差异呈现更明显的负相关。[page::32-35, Figure 4, Table 4]


---

3. 图表深度解读



3.1 图2 “职位广告中工资及非工资属性的普及率”


  • 横坐标为47个具体工作属性,包括薪酬方案(薪酬水平、集体协议薪酬等)、金融福利(养老金、保险)、工作时间类别(全职、兼职)、便利/不便利工作时间(弹性时间、班次工作)、工作环境(同事关系、远程办公可能)、岗位任务描述(有趣、挑战性任务)等。

- 纵坐标为对应属性在2015-2019年间全部职位广告中的出现比例。
  • 结果显示约55%广告有薪酬相关信息,但明确列薪资区间或金额的不足10%,27%广告包含具体薪酬水平信息(数值或集体协议)。

- 几乎所有广告展示至少一项非薪酬属性,工作环境和任务描述尤为常见(如45%提及良好环境,30%提及任务有趣)。
  • 该图视觉呈现了广告中信息的丰富性和招聘策略的多样性。[page::20]


3.2 图3 “已发布职位薪酬及非薪酬属性的行业、职业、地理及企业解释比例”


  • 采用伪$R^2$衡量行业(2位码)、地理(10分位区域)、职业(2位码)及企业(固定效应)对不同属性发布概率的解释能力,通过逐层加入固定效应展示解释力提升。

- 行业+职业+地点固定效应最多说明30-40%的属性差异,而增加企业固定效应,解释率显著提升到50-70%,表明雇主层面存在稳定的“发布属性风格”。
  • 该图证实企业行为是职位广告中属性选择的关键驱动因子。[page::21]


3.3 图4 “雇主各估计价值间的关系分布图”


  • 多栏散点图揭示:整体雇主价值$Vj$与薪酬溢价$\psij$、非薪酬福利$aj$、工作安全$sj$均为正相关。

- 薪酬与福利间呈显著负相关,体现劳动力市场中补偿性差异。
  • 工作安全与薪酬正相关,却与福利无明显相关。

- 图中橙线表示局部线性拟合趋势,蓝点大小按雇主规模加权。
  • 该图形象显示模型对劳动市场多维价值结构的刻画能力。[page::32-33]


3.4 图5 “雇主薪酬及非薪酬价值对职位广告属性的影响”


  • 两个散点图分别展示以薪酬溢价$\psij$和非薪酬福利$aj$作为自变量的属性发布变化率(单位:标准差变动引起的属性发布比例变化)。

- 高薪雇主更频繁地公布“保险计划”、“养老金”、“集体协议薪酬”等薪酬相关及职业发展信息;也更强调良好同事和社会环境等工作环境因素。
  • 高福利雇主则倾向强调合同稳定性和便利时间安排(如弹性工作时间、正常工作时段)。

- 相反,薪酬较低与低福利雇主更注重明确合同类型及不便时段(轮班、不规则时间)的说明。
  • 多项系数的置信区间显示,部分属性与雇主价值关联不显著。

- 图示有力验证了工资与非工资补偿属性的相互补偿性和雇主差异化策略。[page::37-38]

3.5 图6 “职位广告对雇主整体及各分项价值预测力”


  • 纵轴为调整后的$R^2$,横轴对比不同解释变量组合。

- 红色柱为薪酬属性解释力,蓝色为非薪酬属性,黑色柱为添加其他广告特征后的整体解释力。
  • 结果显示,薪酬和非薪酬属性对整体雇主价值、薪酬值和非薪酬值均具有约40%-60%的预测力。

- 控制了行业、职业、地区后,属性变量仍能独立解释10%-20%的剩余变异性。
  • 该图实证职位广告属性信息已成为识别雇主多维价值的强有效变量。[page::41]


3.6 图7 “不同性别与教育人群中广告内容预测力的异质性”


  • 分别对男性、女性、大学及非大学学历样本做同类$R^2$分析。

- 广告对所有群体均具备较强的预测能力。
  • 对非大学人员,广告属性对整体及非薪酬价值的预测力较大学者低约10个百分点。

- 女性非薪酬值的预测力略高于男性,但控制行业职业等后差异缩小。
  • 该发现反映不同劳动力群体对职位广告信息的异质反应及价值关联。[page::43]


3.7 表5和表6 “职位广告信息对职工向更优雇主流动的影响模拟”


  • 设定基于文本属性估计雇主价值,模拟如果工人以职位广告信息为依据择业,劳动流动的变化。

- 表5显示,含薪酬及非薪酬属性的广告信息使职工向价值更高雇主的流动增加约1.1%(向价值更低的减少0.8%),相较完全信息模型可解释约25%的额外向上流动。
  • 女性和大学学历员工受此信息提升效应更显著。

- 表6进一步分解向更高薪酬雇主和向更高级福利雇主流动的变化,男性更多依赖薪酬信息,而女性更多倾向非薪酬流动,体现性别偏好差异。
  • 该定量模型模拟增强了对劳动市场信息作用和人员自我筛选机制的理解,[page::44-47]


---

4. 估值分析


  • 使用结构模型方法有效解构了雇主价值,综合薪酬效应、福利效应及工作安全效应。

- 估计采用匹配面板数据,结合k-means聚类方法减少参数维度,提升模型估计稳健性。
  • 采用极值型随机扰动模型,捕捉工人偏好异质性,允许非对称偏好与补偿差异的存在。

- 通过构建线性回归模型,将职位广告文本中识别的薪酬与非薪酬属性对雇主估值进行解释,实现对雇主价值的预测和溯源。
  • 该多层混合模型巧妙融合文本分析与结构就业流动数据,大幅提升了雇主吸引力评估的精细度和现实解释力。[page::22-31, 36]


---

5. 风险因素评估



报告中并未明确列出风险因素专项章节,但可推断以下潜在风险:
  • 文本分析的片面性:尽管准确率高,但对广告中隐含信息或复杂语义的检测仍有限,如“灵活工作时间”涉及上下文理解,词组间的插入文本可能导致识别遗漏。

- 政策环境变化:随着各国对薪酬透明度及招聘广告法规的动态调整,职位广告的内容策略可能快速变化,影响模型外推性。
  • 异质性限制:模型假定工人偏好在一定群体内均质,而真实中存在非观测能力和偏好异质,可能导致价值估计偏误。

- 数据覆盖的局限:样本限制于公开职位广告和特定规模企业,临时工、派遣职位及隐性招聘渠道未被覆盖,影响全面性。
  • 估计假设依赖性:如用以识别非薪酬价值的方差匹配条件($\operatorname{Var}(uj)=\operatorname{Var}(\ln Wj)$)暗含薪酬与非薪酬负相关的严格假设,可能削减估计灵活度。[page::16-17, 27-28, 48]


---

6. 批判性视角与细微差别


  • 报告基于自然语言处理匹配词典方法,固有限制在于文本多样性难以完全覆盖,可能遗漏某些隐晦或新兴措辞,且招聘广告含有宣传成分,不完全反映实际工作条件。

- 结构模型的关键参数对“强连接集”和非就业劳动力流入要求较高,估计可能对大规模小型企业及超短时流动不敏感。
  • 对于非薪酬部分的测度依赖一定的结构假设,限制了对不同维度非薪酬价值(如文化、职业发展潜力等)的更细粒度区分。

- 性别和教育层面的异质性分析未扩展到其他人口特征(如年龄、技能等级),未来可深化。
  • 报告中部分薪酬与非薪酬属性负相关的结论,虽然符合补偿不同ials理论,但实际中可能存在正相关的高薪优福利高端职位群体,模型解析力或有局限。

- 对职位广告价值与实际岗位条件的关系表述谨慎,明示广告内容不必完全等同实际提供福利,现实中仍有信息不对称和招聘策略调整。[page::37-39, 48, 60]

---

7. 结论性综合



该报告开创性地结合了大规模的职位广告文本分析与结构化的雇主-员工匹配数据,首次系统性地识别和量化了职位广告中薪酬及非薪酬属性的广度和层次。研究结果显示:
  • 挪威职位广告在薪酬与福利信息公开上表现活跃,55%广告含薪酬信息,几乎所有广告包含非薪酬内容,平均每条广告涵盖6个属性。

- 通过结构模型反演工人的雇主价值分解,识别到薪酬和非薪酬皆为雇主吸引力的重要组成,且两者显著负相关,支持补偿差异框架。
  • 高薪雇主更常公开薪酬及职业发展信息,高福利雇主着重合同条款和工作时间弹性。

- 职位广告中的具体属性对预测雇主价值贡献巨大($R^2$达0.6),即使剔除行业、职业和地域等控制因素后,依然能解释约15%-20%的价值异质性。
  • 结合职位广告信息的结构模型模拟表明,信息披露促进了劳动力向价值更高雇主的流动,上行流动改善1.1%,占完全信息模型提升的四分之一,且不同性别和教育层面存在信息利用差异。

- 该工作为政策提供实证支撑,暗示完善职位广告中薪酬和非薪酬信息披露,尤其是灵活工作时间等非薪酬属性,有助于市场匹配效率和劳动力满意度提升。
  • 研究方法和开放词典资源为后续跨国扩展、不同市场制度与周期性影响的探索奠定坚实基础。


图表方面,报告图2-3系统展示了职位广告中属性的丰富度及其企业内在风格,图4-7将结构模型估计的雇主价值与广告内容作出全面关联,条理清晰地展现了信息内容如何反映且影响劳动市场结构。

总结而言,该报告以数据为驱动,结合先进文本与结构经济学工具,全面揭示了职位广告作为劳动力信息关键桥梁的价值内容和市场影响,开创了一个深具政策和理论意义的劳动市场研究路径。[page::0-48, 62]

---

附录



报告附录对文本提取算法细节、验证过程、模型数学推导以及补充图表均予详尽说明,确保研究透明可复现。

---

以上为本报告全面详尽的结构化解析,涵盖了报告的核心贡献、方法逻辑、数据基础、关键实证结果以及潜在局限和政策启示。

报告