Follow the money: a startup-based measure of AI exposure across occupations, industries and regions
创建于 更新于
摘要
本报告提出基于Y Combinator风险投资支持的AI初创企业数据和O*NET职业描述的AI Startup Exposure (AISE)指数,实证分析AI在美国劳动力市场的实际渗透程度。研究发现,传统指数高估了高技能岗位被AI取代风险,而AISE显示以例行组织任务和信息处理为主的岗位,如数据科学家和办公室职员暴露度较高,而法官和外科医生等高风险伦理性岗位则暴露度较低。地理上,AI暴露集中在旧金山、西雅图等知识密集型大都会区,行业上服务业暴露显著高于农业和建筑业。报告还首次构建了机器人初创企业暴露指数(RSE),揭示AI与机器人融合驱动的自动化潜力。该方法具备实时更新和政策指导价值,拓展了对AI影响的理解视角[page::0][page::3][page::6][page::9][page::11][page::13][page::37]。
速读内容
- 报告背景及创新点 [page::0][page::3]
- 现有AI职业暴露指数多基于AI能力潜力,忽视实际应用和市场采纳,难以精准反映AI对劳动力的真实影响。
- AISE指数通过对比Y Combinator资助的AI初创企业产品描述与ONET职业核心任务,利用Meta Llama 3模型,测量实际关注和开发的AI应用对职业的影响潜力。
- 该方法避免了专利数据滞后、主观专家评估的不足,实现可重复性和实时更新。
- AISE与传统AIOE指数的对比分析 [page::6][page::7][page::8][page::9]

- AIOE基于能力与AI应用之潜在匹配,反映技术可替代性,而AISE反映市场开发活跃度和实际风险。
- 高AIOE但低AISE职业(如法官、律师、高中教师)表明伦理、技术难题和社会接受度限制了AI的实际替代。
- AISE高暴露职业多为办公文员、数据科学家、市场调研分析师,与其涉及高频且可利用AI自动化的任务高度匹配。
- 教育和培训水平高(Job Zone 5)的职业,尽管理论上受AI影响大,但AISE低,显示现实中AI应用有限。
- AISE和技能复杂度关系分析 [page::9][page::28][page::29]

- 对于固定相同理论风险(AIOE),职业所需核心技能数量越多,AISE值越低,反映初创企业布局偏好自动化复杂度低、风险小的工作任务。
- 高AISE职业对阅读理解、判决决策、社交判断等技能依赖较低。
- 地域与行业AI暴露分布 [page::11][page::12]

- AI暴露分布存在明显地域差异,旧金山湾区、西雅图、奥斯汀等技术创新聚集地暴露较高,制造业和农业集中的中西部地区暴露较低。

- 行业层面,信息技术、金融、专业技术服务行业暴露最高,农业和建筑等体力劳动行业暴露最低,教育和医疗行业暴露相对较低,反映社会伦理限制。
- 机器人初创企业暴露指数(RSE)初步探索 [page::37]

- RSE覆盖更多体力劳动岗位,与AISE一起显示AI+机器人融合带来的更广泛自动化风险。
- 高技能岗位既高AISE也高RSE,反映多为软硬件结合的智能自动化解决方案。
- 方法论概要与数据来源 [page::15][page::16][page::17]
- 职业描述来源于美国ONET数据库,包含任务摘要、技能重要度和工作准备度(Job Zones)。
- AI初创企业数据来自Y Combinator公开数据库,筛选AI或机器人相关标签的约1000家创业公司。
- 利用Meta Llama3大语言模型判断创业公司的产品描述是否替代对应职业核心任务,并进行归一化计算得到AISE和RSE。
- 结果及政策启示 [page::13][page::14]
- AISE指数显示AI自动化影响将先覆盖流程化、组织化较强的中低技能岗位,专家型高风险岗位短期内影响较小。
- 可实时动态追踪AI技术发展趋势,为劳动力市场政策制定、技能培训及区域经济规划提供科学依据。
- 建议未来结合更多多源数据,细化至企业内岗位和任务级别,深化AI与机器人融合的影响评估。
深度阅读
金融研究报告深度分析报告
——基于“Follow the money: a startup-based measure of AI exposure across occupations, industries and regions”全文剖析
---
一、元数据与报告概览
- 报告标题:Follow the money: a startup-based measure of AI exposure across occupations, industries and regions
- 作者:Enrico Maria Fenoaltea, Dario Mazzilli, Aurelio Patelli, Angelica Sbardella, Andrea Tacchella, Andrea Zaccaria, Marco Trombetti, Luciano Pietronero
- 发布机构:未特别指明,但基于多位学者及数据来源推断属于学术研究范畴
- 发布日期:2024年12月13日
- 研究主题:探讨基于初创企业数据构建的人工智能(AI)对职业、行业及地区影响的测度方法,提出了AI Startup Exposure(AISE)指数,研究AI技术对劳动市场的渗透与变革。
核心论点及研究意图:
现有的AI对职业暴露度测量普遍关注于技术可替代性,较少关注实际采用情况,缺乏对劳动力市场的实时、准确描绘。报告提出AISE指标,基于Y Combinator加速器投融资的初创企业中的AI产品,结合ONET职业描述,通过大语言模型(LLM)衡量AI技术的实际应用和对职业的影响。
研究发现与传统理论不同,高技能职业的AI暴露呈现异质分布,且AI实际应用多集中于例行性和组织性任务,司法、医疗等高风险领域受到伦理及社会制约影响较大。地域和行业上的影响也表现出明显差异,知识密集型都市与服务行业AI暴露较高。该指数不仅提供对AI科技进展的市场导向视角,也为政策制定提供动态前瞻工具。
整体上,作者强调不应简单化AI“取代人工”的恐惧,而应理性理解技术进步与社会因素交织决定的劳动市场变革节奏。 [page::0,1,2,3]
---
二、逐节深度解读
2.1 摘要与引言
- 关键论点
- AI技术集成快速推进,需要创新指标评估其对劳动力市场冲击的实际影响。
- 传统方法多基于技术可行性进行潜在暴露评估,易导致高估职业风险。
- AISE指数通过匹配AI初创企业实际开发的应用与职业核心任务,反映技术从资本市场角度的吸引度及可行性。
- 逻辑分析
- 利用创业融资数据捕获市场真实的AI应用热点,间接反映AI走向与产业实际需求。
- 通过对任务描述进行语义匹配,焦点落在“关键任务”而非所有任务,从而揭示AI替代/辅助的潜在力度。
- 数据点
- 1000多个职业和约1000个AI初创企业数据文本输入LLM进行语义判断。
- 发现一般办公室文员、数据科学家等信息处理岗位暴露度最高;法官、儿科医生等高风险职业暴露较低。
- 预测与假设
- AI渗透不是线性统一的,高技能岗位异质性强。
- 社会伦理和法律风险影响AI实际采用,非单纯技术潜力。
- 地区差异体现新经济模式与产业结构的交互影响。
- 专业词汇解析
- ONET:美国职业信息数据库,包含对职业任务、技能、训练等描述。
- LLM(Large Language Model):大规模预训练语言模型,具备处理自然语言理解与生成的能力。
- AISE指数:基于初创企业实际AI应用与职业任务间相似度计算,反映当前市场中AI对职业的暴露程度。
- 背景
- 报告补充先前基于专利、AI能力测试等的间接方法不足,提出“市场导向、实际应用”为核心的新指标体系。 [page::0-3]
---
2.2 相关文献及方法论回顾
- 研究整合前沿文献,指出传统方法主要关注技术潜能(如Frey & Osborne 2017,Felten等),依赖专家判断、群众外包或专利文本;产生主观、不可复制及滞后问题。
- AISE创新点在于通过Y Combinator投资的AI初创企业的文本数据,结合Meta Llama 3的语言理解能力,为AI应用的现阶段开发状态提供事实基础。
- 具体步骤:
1. 收集Y Combinator带AI标签的初创公司详尽描述。
2. 选取ONET职业短描述的“核心任务”。
3. 使用Llama 3模型回答“该初创公司的产品是否能替代该职业的部分关键任务”,回答为“是/否”。
4. 对所有初创公司汇总“是”的比例,归一化为职业AISE得分。
- 这种方法旨在捕捉市场经济可行性、技术实施细节和社会接受度的综合影响,避免过度依赖单一层面的潜力考量。
- 此外,附带方法能兼容机器人领域初创企业数据,探索AI与机器人融合影响。 [page::2-4,16-19]
---
2.3 结果解读——职业层面AI暴露
- 排名前列职业:办公室文员、数据科学家、信息系统管理员、市场调研分析师等,凸显信息处理与例行组织任务高度暴露。
- 低暴露职业:体育竞技者、法官、儿科医生,体现对物理能力需求强、伦理风险高的职业AI接纳度较低。
- 结合案例分析,作者指出社会认知、法律伦理、错误成本等社会因素限制AI介入部分职业,使得传统潜力较高职业实际受到保护。
- 对比Felten等人AIOE指数,发现AISE指数与其在低暴露职业上合致,而高暴露端存在显著差异,尤其是在高技能职业中,AISE呈现较低暴露,体现技术采用的现实性约束。
- 图1是AISE与AIOE的散点图,着色依据职业的教育训练等级,拟合区分三大区域,用以揭示两种指标的异同点。该图揭示:
- 低AI暴露一致,均为手工类职位。
- 高AIOE但低AISE聚集于高教育需求职业。
- AIOE与教育水平正相关,AISE则呈复杂分布。
- 图2进一步通过箱图展示了不同AIOE区间职业中,AISE值随教育层级变化的多样性,验证了“技术可行性≠实际推广”的结论。
- 重要技能分析(图3)显示,在高潜力职业中,AISE低的群组对“阅读理解”、“判断与决策”、“社会感知”等核心社会认知技能要求更高,说明这些技能复杂度是AI整合障碍。 [page::4-9]
---
2.4 结果解读——地理与行业暴露
- 基于职业占比及行业分类,将AISE加权计算至地理和行业层面。
- 地理差异:
- 知识密集型大都市区(如旧金山湾区、圣何塞、西雅图等)AI暴露显著高于中西部制造业主导地区。
- 反映技术创新生态系统对AI吸收能力和市场活跃度的决定性影响。
- 行业差异:
- 服务型、信息处理需求高的行业(如金融、信息技术、专业服务等)AI暴露度高。
- 传统农业、建筑等体力劳动行业AI暴露度低。
- 特别指出教育与医疗行业,虽教育水平高,但因高风险、专业复杂性,暴露度较其他高技能行业低。
- 图4展示了美国主要都会区AISE分布地图,颜色深浅对应暴露度,验证大都市及科技中心暴露较高特征。
- 图5则为两位NAICS产业分类的AISE指标柱状图,清晰展现行业间分布差异。 [page::10-12]
---
2.5 讨论与方法学细节
- AISE指数基于真实投资决策及市场行为,因此规避了现有基于潜力的预测模型假设过强、主观性大等弊端,展现更符合现状的AI暴露格局。
- 结果表明,AI的影响首先落在低复杂度、组织性强、信息处理为主的岗位,而高风险、需高专业判断力岗位短期内较少被AI替代。
- AI与机器人融合影响的探索显示,机器人技术主要影响手工体力工种,但高度AI结合逐步渗透至信息处理及高技能领域,提示未来职场的复杂变革。
- 指数具有高度可重复性与扩展性,基于开源LLM,可随时间更新并纳入更多数据源,成为动态政策参考工具。
- 局限性包括:Y Combinator样本存在选兆偏差,主要反映资金可达与市场经济导向的AI创新,不涵盖学术及非融资领域;职业分析忽视职位内异质性,需结合组织或岗位层面深挖。
- 方法测试通过更短描述文本及更严格Prompt显示指标稳定性强,相关系数分别达0.91和0.97。 [page::13-18,33-34]
---
三、图表深度解读
图1:AISE与AIOE散点图(页码6)
- 描述:展示各职业AISE(基于实际初创企业的AI暴露)与AIOE(基于能力潜力暴露)指数的关系。点颜色表示职业所需教育训练水平。左侧一列点为AISE有值但无AIOE的职业。
- 数据趋势:
- 低两指标(左下)为低技能岗位。
- 随着AIOE上升,AISE分布既有高又有低,反映技术潜力与实际采用的矛盾。
- 高教育岗位多聚集于高AIOE但AISE偏低区域,体现其受伦理风险抑制。
- 文本联系:此图支持报告关于潜力型指标无法全然反映现实应用的核心观点。
- 局限:无明显,但由于仅反映美国职业体系,地区局限性存在。

---
图2:不同AIOE区间内AISE与教育水平箱型图(页码8)
- 描述:三组箱型图分别描绘低、中、高AIOE分组中,AISE指数随教育水平(Job Zone分级)变化分布。右下小图示区间划分。
- 趋势解读:
- 低AIOE组aiSE整体低,无明显教育依赖(a面板)。
- 中AIOE组,教育较低岗位AISE更高(b面板)。
- 高AIOE组,AISE与教育负相关,高教育门槛岗位AISE反而较低(c面板)。
- 文本结合:此图细化说明了高技能岗位虽潜力暴露高,但市场和社会因素限制实际AI介入。
- 分析:教育门槛、任务复杂性、错误成本成为技术整合关键变量。

---
图3:技能分布对比(页码9)
- 描述:柱形图比较人工智能暴露位于高AIOE高AISE区(top-c)与高AIOE低AISE区(bottom-c)职业所需“关键技能”(技能重要度>4)的分布比例。附带两个箱型图显示关键技能数量与AISE间关系。
- 趋势解读:
- 高AISE组关键技能数量较少;低AISE高AIOE组关键技能显著更多,且多与社会、决策相关。
- 关键技能数量和AISE呈负相关,技能复杂度抑制AI实际替代意愿。
- 意义:解释为何技术潜力与经济/社会采纳存在背离,是社会接受度的量化体现。

---
图4:美国都会区AISE地图(页码11)
- 描述:色块地图展现不同美国都会区劳动者平均AISE值,颜色由浅至深表示暴露度由低至高。
- 趋势解读:
- 加利福尼亚湾区、华盛顿州、德州奥斯汀为高暴露区。
- 中西部地区普遍偏低,显示产业经济结构与技术吸纳能力的空间差异。
- 关联文本:地图直观体现了数字经济与AI暴露的地理分布不均,为区域政策提供依据。

---
图5:行业AISE分布(页码12)
- 描述:柱状图依行业分类(两位NAICS编码)展现各行业加权AISE指数。
- 趋势解读:
- 农业、采矿、建筑等传统重体力行业AISE低。
- 金融、信息技术、管理咨询等服务导向行业AISE较高。
- 医疗、教育业因社会规范和风险控制因素相对较低。
- 文本对应:支持职业层面分析延伸至行业的影响规律,显示技术扩散的产业约束。

---
图13 & 图14:模型健壮性测试(页码33、34)
- 图13展示AISE基于详细创业描述和简短创业描述的高相关性(Pearson 0.91,Kendall 0.74)。
- 图14展示更直接询问AI替代意图Prompt与原Prompt的结果高度相关(Pearson 0.97,Kendall 0.85)。
- 说明本研究所用Open-Weight LLM和方法论较为鲁棒,结果稳定。


---
图16:机器人与AI暴露对比(页码37)
- 描述:左图为职业机器人创业暴露(RSE)与AISE散点图,颜色表示教育级别;右图为不同教育层次下RSE/AISE的比值箱型图。
- 解读:
- 低技能岗位机器人暴露较高,与AISE不完全重合。
- 高教育岗位机器人与AI暴露均较低。
- 明显机器人技术对物理技能相关岗位冲击更大。
- 同时高AI暴露岗位亦有较高机器人暴露,反映出AI与机器人融合趋势,影响范围广泛。
- 意义:预示未来AI与机器人集成技术可能推动劳动市场结构性变革,带来更广泛替代风险。

---
四、估值分析
本报告为学术研究,非公司股价类金融分析报告,无传统财务估值、目标价等内容。其核心“估值”体现在“AISE指数”的构建方法学与其对AI技术渗透度的测算,是一种以市场投资行为反映技术影响的“隐性估值”。
算法层面包含:
- 利用自然语言处理模型(Llama 3)对比初创企业产品描述与职业任务描述,判断自动化替代可能性。
- 归一化处理匹配结果,体现对应职业的AI创业关注度。
本质是一个市场创新驱动的技术暴露强度估算模型,非传统现金流或倍数估值模型。
---
五、风险因素评估
虽然报告非金融资产分析类,但内含风险因素可归纳如下:
- 数据样本偏差:
- Y Combinator仅涵盖部分创业生态,存在投资偏好和地域集中带来的样本偏倚,忽视未融资AI研发和非典型AI技术。
- LLM判定风险:
- 语言模型虽先进,但仍有判断误差、歧义处理风险,可能影响AI替代判定精度。
- 职业任务同质性假设:
- AISE以ONET标准化职业描述为基,无法捕捉同一职业在不同企业、地区的异质任务分布,掩盖微观差异。
- 技术与社会动态风险:
- AI技术快速发展和社会监管政策变化可能迅速改变AI暴露格局,目前指数仅反映现阶段投资导向,缺乏动态适应机制。
- 伦理法律风险:
- 道德伦理和法律监管约束成为关键影响因素,尤其高风险领域AI开发不确定。
报告在方法部分和结论中均指出上述风险,并强调指数应作为动态跟踪工具,与实际劳动力市场政策结合加以解读。 [page::14,18]
---
六、批判性视角与细微差别
- 报告客观反映现实市场投资偏好,但未覆盖产业研发全貌,潜在的资金市场集聚效应和投资趋势波动未充分讨论。
- AISE侧重于替代视角,虽声明中立,但核心定义仍聚焦“替代任务”,对“增强/协作”性质工作影响描绘较少。
- 计量上依赖LLM判断,潜藏模型潜在偏见和语义误差风险,尤其对含糊或隐含功能的创业描述容易产生误判。
- 地区职业任务差异未细分,未来可结合详细企业级数据弥补待深入。
- 报告避免简单断言技术必然带来结构性就业变化,良好体现社会伦理属性对技术扩散的限制,呈现更理性视角。
---
七、结论性综合
本报告创新提出了基于初创企业投资活动和大语言模型的AI Startup Exposure指数(AISE),为分析AI对职业、行业和地区劳动市场影响提供了动态且更接近实际应用的视角。相比传统基于技术潜能的研究,AISE更贴近市场真实意向和社会接受度,区分了高技能岗位潜力暴露与实际采用的关键差异。
主要发现包括:
- AI实际影响主要集中于以例行信息处理和组织性任务为主的职业,如办公室文员、数据科学家等。
- 高技能行业和岗位,尤其是涉及伦理风险和社会复杂性的职业(如法官、医生)AI替代的市场兴趣较低。
- 地理分布呈现技术创新密集区与传统产业区的显著差异,反映经济结构与劳动力组成对AI渗透的调节作用。
- 服务行业、金融信息技术领域AI暴露显著高于重体力劳动行业。
- AI与机器人融合趋势预示更广泛的未来技术冲击,涵盖从低技能体力岗位至高技能信息岗位。
- AISE指数方法开放且可更新,具备政策动态监测功能,能辅助政府和企业制定劳动力培训与未来准备战略。
整体来看,报告反驳了“高技能岗位将广泛被AI替代”的灾难性预期,强调社会、伦理及市场约束对技术应用的限制,呼吁理性审视AI变革的渐进性和多维性。其基于创业投资生态构建的指数具有创新性和实践价值,是AI劳动市场影响研究的重要补充工具。
---
参考报告索引
全篇涵盖分析内容均参照以下页码:
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,33,34,37]