`

Forecasting Labor Markets with LSTNet: A Multi-Scale Deep Learning Approach

创建于 更新于

摘要

本论文提出基于LSTNet的多尺度深度学习模型,结合多变量劳动力市场时间序列数据,实现了精确的7天就业预测和可解释的行业就业健康指数(IEHI)。模型在多个行业表现优异,尤其是稳定行业,且IEHI排名与实际就业波动高度相关。研究揭示模型在面对行业结构性波动时的局限,并提出未来增强因果推断和空间时间建模的方向 [page::0][page::1][page::5][page::6]。

速读内容


研究框架与数据集概况 [page::0][page::1]

  • 使用美国劳工统计局(BLS)多变量周度就业数据,涵盖就业人数、工资、失业率、职位空缺、入职和离职等指标。

- 数据跨10个主要行业,时间跨度从2006年3月到2024年12月,进行插值至周频率。
  • 构建30天滑动窗口输入,兼顾短期和长期趋势捕捉。


LSTNet模型架构设计 [page::3][page::4][page::5]

  • 采用2D卷积层(内核7, 32通道)提取局部时序和变量间关联。

- GRU层(64隐藏单元)捕获长期依赖关系。
  • 跳跃连接处理周期性(月、周)模式,7天自回归组件补充短期线性趋势。

- 模型输出7天就业变化预测与行业就业健康指数(IEHI),后者结合预测波动性和行业静态指标评估行业健康。


评估指标体系及基线比较 [page::2][page::4]

  • 综合采用SMAPE、RMSE、MAE衡量误差,Spearman秩相关评估排名一致性。

- 基线包括永久保持(Persistence)模型和理论oracle模型,为性能表现提供边界。
  • SMAPE被选为主要评价指标,适用于就业变动多在零附近的特性。


模型表现与行业差异分析 [page::5][page::6]

  • 稳定行业如教育与医疗、金融服务、专业服务,SMAPE约13%,误差最低;信息、制造、自然资源波动剧烈,SMAPE超过40%。

- 模型对大部分行业整体表现良好,平均SMAPE约26.7%。
  • IEHI评分与SMAPE紧密相关(Spearman $\rho=0.95$,p=2.28e-05),显示该指数准确反映预测难度及行业稳定度。



误差模式与模型局限 [page::6]

  • 宏观冲击大幅提升预测难度,特别是2020年新冠疫情导致的异常波动。

- 交通运输等行业存在时间滞后现象,模型响应拐点延迟1-2个月。
  • 数据稀疏和高频噪声影响信息服务等行业预测表现。



量化指标表格展示



Table 3. 行业就业预测绩效(MSE, MAE, SMAPE %) [page::5]

| Industry | MSE | MAE | SMAPE (%) |
|------------------------|--------|--------|-----------|
| Construction | 0.0454 | 0.1284 | 21.44 |
| Education/Health | 0.0358 | 0.0980 | 13.08 |
| Financial Activities | 0.0290 | 0.1117 | 13.42 |
| Information | 0.1383 | 0.2051 | 41.09 |
| Leisure/Hospitality | 0.2787 | 0.1400 | 18.13 |
| Manufacturing | 0.0572 | 0.1443 | 51.32 |
| Natural Resources | 0.1816 | 0.2793 | 52.94 |
| Other Services | 0.4272 | 0.2331 | 33.72 |
| Professional Services | 0.0189 | 0.0737 | 16.94 |
| Transport/Utilities | 0.1653 | 0.2309 | 32.96 |

未来方向 [page::7]

  • 引入因果推断以更好捕捉政策和宏观冲击影响。

- 采用时空模型提升区域间劳动力动态预测。
  • 增强模型解释性及不确定性量化。

- 设计多层次、分辨率的IEHI构建方案。

深度阅读

报告详尽分析报告


报告标题:Forecasting Labor Markets with LSTNet: A Multi-Scale Deep Learning Approach
作者:Omar Abbouchi, Sofia Davila, Meena Al Hasani, Jessica Le, Adam Nelson-Archer, Aleia Sen
发布机构:University of Houston Department of Computer Science
发布日期:未标明具体日期(论文内容中数据截至2024年)
主题:基于深度学习的劳动力市场短期就业预测及长期行业健康评估,聚焦美国劳工统计局数据

---

1. 元数据与报告概览



本报告提出了一种基于LSTNet(Long- and Short-term Time-series Network)的多尺度深度学习模型,旨在对美国不同行业的就业变化进行7天的短期预测,同时生成一个行业就业健康指数(IEHI),以评估行业的长期健康与稳定性。该方法综合利用就业水平、工资、职位流动率及岗位空缺等多变量时间序列数据,比传统模型在多数行业预测上表现更佳,特别是在结构稳定的行业中,IEHI指数与实际就业波动高度吻合,表现出良好的可解释性和预测力。报告涵盖数据集构建、模型架构、评价指标设计、基准对比、详细的结果分析及未来改进方向。

报告核心信息传达:该模型通过结合卷积神经网络、门控递归单元(GRU)、自回归组件和跳跃连接,捕捉了就业数据的短期波动及长期依赖,实现跨行业的高准确度短期预测和行业健康评估,具备较强的可解释性和行业适应力。[page::0,1]

---

2. 按章节详解



2.1 摘要与引言(Abstract & Introduction)


  • 关键论点:就业数据时序复杂,传统预测方法难以同时捕捉短期波动和长期趋势。

- 创新点:采用LSTNet架构,融合卷积层、门控递归单元和自回归机制,处理多变量时间序列数据(就业率、工资、岗位变动等),实现7天就业变动预测与IEHI生成。
  • 推理依据:结合多源指标和深度学习组件解决结构差异大及数据复杂性的行业就业预测挑战。

- 要点:系统数据来源为美国劳工统计局,包括行业级就业人数、工资、工作时长、失业率、岗位空缺、招聘及离职等,全覆盖多维度劳动力信息。
  • 输出:短期就业预测结果和IEHI评分,IEHI代表行业就业的健康度和稳定性。

- 架构特色:卷积层捕捉局部时间序列特征,GRU处理长期依赖,跳跃连接捕获周期性模式,自回归组件强化短期线性趋势建模。
  • 数据期限:2006年至今的每周数据,数据的周频率提供了高分辨率时序输入。


总体而言,引言清楚阐述了劳动力市场预测的难点及提出模型的应对策略,奠定了后续技术细节和实验证明的基础。[page::0]

---

2.2 相关工作(Related Work)


  • 关键观点: 近期深度学习技术在就业率和多变量时间序列预测中表现优于传统计量模型。

- 相关成果
- Yurtsever采用LSTM-GRU预测多国失业率,成为现有技术基准。
- Salinas et al.提出的DeepAR支持多时间序列联合建模,有助行业间数据稀缺时泛化。
- Lai et al.开发的LSTNet混合了卷积和RNN,实现短期和长期模式捕获,报告基于其进行架构设计。
- Transformer和注意力机制提案(TFT, ATT-LSTM)显著提升时序预测的可解释性和准确性。
- Deep VAR等混合模型融合传统向量自回归与深度学习,捕捉非线性经济关系。
  • 衡量指标争议:经典指标如ARIMA依赖性强,但现代复杂动态下表现有限,故替代模型(N-HiTS、N-BEATS)表现更优。

- 指标综合:多个现有就业市场指数尝试整合多重劳动力数据创造更动态的指标,报告中的IEHI延续此类工作思路。

总结来看,本章节系统回顾了深度学习与经济计量方法的融合趋势,强调LSTNet及相关模型对本研究方法设计的启发。[page::0,1]

---

2.3 数据集(Dataset)


  • 数据源:美国劳工统计局BLS的多变量时间序列,包括就业水平、周均工作时长、周均工资、失业率、岗位空缺、招聘和离职人数。

- 时间跨度:2006年3月至2024年12月,数据由月度插值为周度,以增强时间粒度。
  • 行业范围:10个行业(如建筑、教育健康、金融、信息、制造、运输等)。

- 数据预处理:解决缺失值,保证时间顺序,输入序列基于30天滑动窗口设计。
  • 形式:多变量时序样本$X \in \mathbb{R}^{T \times F}$,$T=30$,$F$为特征数。

- 输出:对应的7日就业变化预测和IEHI评分。

由此,数据集结构充分服务于模型学习短期和长期时序依赖,为模型多输入特征提供高质量时间序列基础。[page::1,2]

---

2.4 评估指标(Evaluation Metric)



设计合理的评估框架,考察误差幅度和趋势结构一致性,采用:
  • SMAPE(对称平均百分比误差)

- 解决传统MAPE在零值邻近区的偏斜与非对称性,适合预测变动(可正负)数据。
- 误差范围限制在0%-200%,便于不同波动率行业间比较。
  • RMSE(均方根误差)

- 对大误差敏感,体现极端预测失误的成本。
- 保留原单位,便于直观理解误差规模。
  • MAE(平均绝对误差)

- 抗异常值能力强,衡量模型误差的一致性。
- 与SMAPE结合,揭示绝对误差与百分比误差的差异。
  • Spearman’s Rank Correlation ($\rho$)

- 衡量模型对行业就业走势排序的准确性,反映IEHI排序与实际预测难度的一致性。
- 评价模型发现相对改善或恶化行业能力的重要指标。

报告明确排除了传统MAPE,强调选用这套指标更能贴合就业变化预测的性质。逻辑和公式详尽而准确,体现出评估设计的严谨。[page::2]

---

2.5 模型架构与方法(Main Approach)


  • 核心模型:LSTNet多层深度神经网络,将卷积层、GRU、跳跃连接、自回归(AR)模块融合。

- 数据输入:30天窗口多变量序列,包括宏观经济指标(GDP、CPI等),行业特定静态信息(技能要求、员工流动率)。
  • 模型结构细节

- 2D卷积层(核大小7,32通道)提取局部时序依赖与特征交互。
- GRU层(64隐藏单元)捕获长期时间依赖。
- 跳跃连接处理周期性特征(4步-周,24步-月)。
- AR组件补充短期线性趋势建模。
  • 输出结构:并行生成7日就业预测和IEHI分数。IEHI基于预测波动性和平稳度及行业元数据计算,能定量反映行业健康度。

- 流程步骤:数据标准化->30日窗口构建->输入模型->输出预测与IEHI->通过均方误差(MSE)和排序相关性验证。
  • 训练配置:以均方误差为损失函数,使用保持验证集确保泛化能力。设计考虑了行业季节性和指标特异性。


结构亮点在于模型同时兼顾短期准确度与长期行业健康评估,使预测更具实用价值。模型设计证明了深度学习在捕获复杂时序数据中的潜力。[page::4,5]

---

2.6 基准对比(Baseline and Oracle Evaluation)


  • Persistence基线模型:预测未来7天就业指标保持不变,为简单稳态模型,适合平稳行业。

- Oracle模型:理想预估,假设未来实际就业数据已知,取未来7天均值,用作预测精度极限的理论衡量。
  • 实验结果

- Oracle模型误差最低,定义极限性能边界。
- Persistence模型在波动大行业(信息制造等)表现差,SMAPE极高;稳定行业表现优。
- Persistence的SMAPE波动大,突出指标敏感性。
  • 意义:为LSTNet性能提供上下游对比,验证其整体优越性。


基准对比扎实,强调深度学习模型克服了简单滞后或平均的局限,体现了动态非线性模式学习的优势。[page::3,4]

---

2.7 结果分析(Results and Analysis)


  • 整体表现

- 平均SMAPE约为26.7%,跨行业精度差异显著。
- 稳定行业如教育健康(13.1%)、金融(13.4%)和专业服务(16.9%)表现最佳。
- 结构波动大行业如自然资源(52.9%)、制造(51.3%)和信息(41.1%)误差最高。
  • 图表解析

- Fig.3条形图展示SMAPE排序,清晰体现行业误差梯度。
- Fig.4(金融行业)与Fig.5(自然资源)预测对比,展示模型偏差与趋势拟合差异。
  • IEHI一致性

- 通过Spearman’s Rank Correlation量化IEHI与模型预测难易程度的高度相关(0.95,p=2.28e-5)。
- IEHI有效反映预测难度和行业健康状况。
  • 误差原因分析

- 经济灾难(如2020年疫情)导致数据非平稳,模型拟合难度加大。
- 某些行业存在时间滞后效应,预测信号响应迟缓。
- 数据稀缺或噪声大行业,模型可靠性降低。

测评结果丰富,结合指标及案例展示,充分揭示模型优劣及风险,显示模型具备实用推广价值。[page::5,6]

---

2.8 未来展望(Future Work)


  • 引入因果推断技术,模型识别宏观冲击、政策变动对就业的直接影响。

- 尝试时空建模,覆盖区域层面的劳动力市场传播和影响。
  • 提升模型可解释性,挖掘输入特征对预测的贡献(如注意力机制)。

- 集成不确定性量化,提供预测置信区间。
  • 优化IEHI指标体系,考虑多时间尺度融合(周、月、季)。


未来工作路径丰富,体现作者对模型应用和研究深化的明确规划。[page::7]

---

3. 图表详读



3.1 表1(第1页)



描述:展示2024年12月不同部门的就业相关周度数据快照,包括员工数(千人)、平均工作时长、平均周薪、失业率、岗位空缺、招聘和分离人数。

解读
  • 教育和健康服务行业员工最多(26931千人),失业率最低(2.7%),体现稳定行业特征。

- 娱乐与酒店业员工众多但平均薪资较低($22.4前$/小时),失业率较高(5.4%),行业波动性较大。
  • 制造业工作时长最长(40.1小时)与较中等薪资(34.54$)匹配。

- 不同行业的岗位空缺与招聘流动情况差异显著,反映行业间劳动力市场活跃度差别。

联系文本:数据为模型输入的基础,多维度反映劳动力市场复杂性。多变量时序特征结合构成预测基础。[page::1]

---

3.2 图1(第3页)——模型架构图



描述:图示LSTNet处理流程,包括多变量输入序列,2D卷积层,GRU模块,跳跃连接,自回归分支,融合输出,最终产出就业预测与IEHI。

解读
  • 输入为30天×多特征序列,卷积负责提取局部时序特征。

- GRU捕获长期依赖,跳跃连接强化周期性信息。
  • AR组件补充线性短期变化。

- 三大模块输出融合,分别生成两大预测头。

联系文本:该图为模型设计核心,直观展示了多路径信息流动逻辑,体现模型多尺度特点和输出设计。
[page::3]

---

3.3 图2(第3页)——所有行业平均失业率预测



描述:黑色实线为实际平均失业率,红色虚线为模型预测,时间轴2008-2024。

解读
  • 模型预测整体趋势一致,尤其能捕捉2008金融危机和2020疫情失业剧增的走势。

- 预测在峰谷对应时存在一定滞后,2020年疫情剧烈波动时预测出现短暂偏差。
  • 误差量化指标MSE、MAE和SMAPE均显示预测具备较高准确度。


联系文本:验证模型总体市场趋势捕捉能力,支持对行业级指标预测有效的论断。
[page::3]

---

3.4 图3(第3页)——不同行业SMAPE误差排序条形图



描述:各行业的SMAPE误差值,最低为“教育与健康服务”,依次是“金融活动”、“专业服务”等。

解读
  • 低SMAPE行业说明预测误差相对较小,模型适应性好。

- 高SMAPE行业如“运输和公用事业”和“其他服务”误差更大,反映结构复杂和剧烈波动。
  • 该图强化了行业间模型性能差异,有助理解模型瓶颈。


联系文本:左右对比行业预测准确性,辅助调研如何针对高误差行业优化模型。
[page::3]

---

3.5 表2(第4页)——基线模型行业表现



描述:Oracle和Persistence基线模型在10个行业上的RMSE和SMAPE指标对比。

解读
  • Oracle模型各行业RMSE均远低于Persistence,预测误差优于简单持平假设。

- Persistence模型在教育健康等稳定行业RMSE较低,波动大行业SMAPE异常增高,数值高达170%以上。
  • 表中数值证实了模型对不同行业动态的适应显示明显限制。


联系文本:证明LSTNet模型优于简单基线,Oracle指标设为理想对照。
[page::4]

---

3.6 表3(第5页)——LSTNet模型行业表现



描述:LSTNet模型在10个行业上的MSE、MAE和SMAPE值。

解读
  • 教育健康服务行业表现最佳,SMAPE仅13.08%,MSE及MAE亦最低,显示预测精度优。

- 高波动行业如自然资源和制造分别对应52.94%及51.32%右侧的SMAPE,误差显著较大。
  • 指标间表现一致,验证模型对行业复杂动态的理解强弱不均。


联系文本:支持报告中“稳定行业模型表现优”的论断,指示调整模型细节针对高波行业。
[page::5]

---

3.7 表4(第6页)——SMAPE与IEHI排序对应及Spearman相关性



描述与解读
  • 财务、教育、专业服务行业SMAPE与IEHI排名高度一致,反映IEHI评分能显著预测行业稳定性。

- Spearman相关系数0.95,高统计显著性(p=2.28e-5),说明模型不仅准确预测就业趋势,也能有效区分行业健康。

联系文本:详细验证了IEHI的可解释价值,IEHI能作为行业健康及难度的有效指标被决策者使用。
[page::6]

---

3.8 图4、5、10-13(第5、6、10页)——不同行业就业实际与预测曲线


  • 图4(金融行业)显示预测与实际接近,平稳增长趋势捕获准确。

- 图5(自然资源)在2020年疫情后呈现较大误差,显示模型对非平稳剧烈变化难以精准拟合。
  • 图10-13(运输、公用事业、建筑、金融、教育)对应行业都展示一般趋势匹配,部分存在疫情影响下的滞后和误差。


这些图形直观反映模型在行业内的适应表现与局限,说明模型对行业差异和大规模冲击十分敏感。[page::5,6,10]

---

3.9 图14-16(第10、11页)——行业整体就业趋势与失业率分布


  • 图14展示自2006年以来各行业就业人数走势,2020年疫情造成大幅波动,不同行业复苏速度差异明显。

- 图15相关矩阵表明行业间就业变化的协同性,如服务类行业间相关性较强,自然资源与制造业相对独立。
  • 图16失业率箱线图揭示行业失业率分散度,建筑、休闲娱乐行业波动大,教育与金融较为稳定。


该系列图强调了划分行业个体模型的必要性,同时支撑差异化建模需求。[page::10,11]

---

4. 估值分析



报告未涉及财务估值(如公司资产估值)部分,主要聚焦于行业就业预测模型开发和性能验证,因此不适用估值分析章节。

---

5. 风险因素评估


  • 模型局限:对非平稳、结构突变事件(如疫情等宏观冲击)的预测存在较大误差。

- 时间滞后:模型响应突发走势能力有限,尤其对逆转点预测反应缓慢。
  • 数据质量与稀缺:数据稀少或噪声强的行业表现不佳。

- 指标敏感性风险:部分评价指标(如传统MAPE)在特定数据情形下不适用,需科学选择。
  • 缓解策略:未来建议拓展因果推断架构,结合空间时序模型以及增强可解释机制,提升模型的鲁棒性和透明度。


风险评估部分揭示了当前模型面临的内在挑战及合理应对思路。[page::6,7]

---

6. 审慎视角与细微差别


  • 报告整体严谨,基于实证和丰富数据支持论断,避免简单结论。

- IEHI作为主观构建指标,尽管统计上有效,但仍需进一步外部验证。
  • 分行业结果差异较大,显示模型在处理行业间非均质特征和突发事件方面仍不够完备。

- 该模型的多组件设计虽有效,但系统复杂性导致模型可调节参数众多,可能面临过拟合风险。
  • 未来引入更多可解释技术和因果推断将是必要补充,以避免黑箱风险。


整体,报告深入而客观,但部分预测不确定性尤其在高度波动行业仍需注意。[page::6,7]

---

7. 结论性综合



本研究围绕利用LSTNet深度学习多尺度时间序列模型对美国不同行业就业市场进行短期7日就业变动预测及长期行业健康评估展开。结合多源就业指标,构建了高分辨率的周度多变量数据集,解决了传统模型难以捕捉短期波动与长期趋势兼顾的问题。

模型融合卷积、GRU、跳跃连接及自回归模块,有效提取时间序列内在结构,实现了稳定行业预测精度显著优于持平基线,且7日就业预测误差普遍较低(如教育健康行业SMAPE约13%),展现良好的实际应用潜力。

IEHI指标作为行业稳定性和就业健康的可解释代理,能与预测误差高度相关,体现了模型的实际价值和多层次决策支持意义。

然而,对疫情等结构性动荡响应能力有限,部分高波动行业预测误差较大,指出未来融合因果推断、增强解释性和引入区域时空信息是必要的提升方向。

通过多维定量评估与丰富图表展示,报告充分展现了所提深度学习方法在劳动力市场预测中的优势与不足,奠定了未来研究与工业实践中的坚实基础。

---

重要图表汇总Markdown


  • Figure 1: 模型架构图

  • Figure 2: 行业平均失业率实际与预测

  • Figure 3: 各行业SMAPE误差排序

  • Figure 4: 金融行业就业预测

  • Figure 5: 自然资源行业就业预测

  • Figure 14: 行业整体就业时间序列

  • Figure 15: 行业间就业相关矩阵

  • Figure 16: 行业失业率箱线图



---

综上,该报告细致地展示了LSTNet在劳动力市场多变量时间序列建模中的创新应用,结合严谨的实验设计和丰富的实证数据,系统验证了模型的有效性和实用性,同时承认其局限并提出未来提升方向,体现了深度学习应用于劳动力市场分析的前沿水平。

[page::0,1,2,3,4,5,6,7,9,10,11]

报告