使用在线招聘广告对 STEM 和创意职业进行分类
Posted: Thu Feb 20, 2025 5:03 am
过去一年,通过经济统计卓越中心 (ESCoE),Nesta 利用数百万招聘广告中包含的详细信息,为英国劳动力开发了双重分类,第一是职业,第二是技能(即将发布)。通过首次及时将英国的职业和技能与雇主所说的需求联系起来,我们认为这些分类法可以带来更有针对性的劳动力发展政策。
政策制定者优先考虑 STEM 和创造力,但却难以定义它们
在我们最新的ESCoE 讨论文件中,我们展示了如何使用招聘广告数据对政策制定者最感兴趣的两个领域的职业进行分类:STEM 职业和创意职业。英国政府的工业战略已将 STEM 和创意确定为技能政策的优先领域,但确定哪些职业属于 STEM 和创意职业却非常困难。
基于手动评估标准职业分类 (SOC) 中的职业代码的方法在这方面存在问题,因为 SOC 不太适合理解技能。这是因为 SOC 在代码中将具有相似技能水平的职业归为一类,而不是将技能专业化,这意味着与赞助政府部门判定为“STEM”或“创意”的职业具有相似技能的职业可能隐藏在其他职业代码中,而判定为“STEM”或“创意”的代码可能包括“非 STEM”或“非创意”职业。
我们使用机器学习方法和招聘广告中指定的技能来对职业进行分类
在我们的论文中,我们使用监督式机器学习方法,根据雇主在招聘广告中指定的技能和其他要求列表,将工作分为“STEM”或“非 STEM”以及“创意”或“非创意”,我们还为每个职位分配了 SOC 代码。初步步 饭团数据 骤是根据技能构成对 SOC 中的每个职业进行描述:这使我们能够将每个职业描述为可以与职业进行比较的数学对象。
我们通过根据数字、文化、媒体和体育部官方统计中被视为创意的 SOC 代码列表为数据库中的所有招聘广告分配“创意”或“非创意”标签来训练分类器,并根据政府中也使用的定义分配“STEM”或“非 STEM”标签。也就是说,属于“创意”SOC 代码的招聘广告会自动标记为“创意”,以用于模型训练,而不管其技能内容如何,如果招聘广告属于“STEM”职业,则会被标记为“STEM”,与其技能内容无关。然后,这些标记的招聘广告将作为“基本事实”来训练两个分类器,这两个分类器独立决定该职位是否属于创意/STEM。换句话说,分类器根据职位的技能内容而不是其 SOC 代码来标记标签。
我们的论文进一步证明,在线招聘广告可以为政策制定者提供及时且丰富的职业要求(在这里指的是 STEM 和创造力)信息来源。
政策制定者优先考虑 STEM 和创造力,但却难以定义它们
在我们最新的ESCoE 讨论文件中,我们展示了如何使用招聘广告数据对政策制定者最感兴趣的两个领域的职业进行分类:STEM 职业和创意职业。英国政府的工业战略已将 STEM 和创意确定为技能政策的优先领域,但确定哪些职业属于 STEM 和创意职业却非常困难。
基于手动评估标准职业分类 (SOC) 中的职业代码的方法在这方面存在问题,因为 SOC 不太适合理解技能。这是因为 SOC 在代码中将具有相似技能水平的职业归为一类,而不是将技能专业化,这意味着与赞助政府部门判定为“STEM”或“创意”的职业具有相似技能的职业可能隐藏在其他职业代码中,而判定为“STEM”或“创意”的代码可能包括“非 STEM”或“非创意”职业。
我们使用机器学习方法和招聘广告中指定的技能来对职业进行分类
在我们的论文中,我们使用监督式机器学习方法,根据雇主在招聘广告中指定的技能和其他要求列表,将工作分为“STEM”或“非 STEM”以及“创意”或“非创意”,我们还为每个职位分配了 SOC 代码。初步步 饭团数据 骤是根据技能构成对 SOC 中的每个职业进行描述:这使我们能够将每个职业描述为可以与职业进行比较的数学对象。
我们通过根据数字、文化、媒体和体育部官方统计中被视为创意的 SOC 代码列表为数据库中的所有招聘广告分配“创意”或“非创意”标签来训练分类器,并根据政府中也使用的定义分配“STEM”或“非 STEM”标签。也就是说,属于“创意”SOC 代码的招聘广告会自动标记为“创意”,以用于模型训练,而不管其技能内容如何,如果招聘广告属于“STEM”职业,则会被标记为“STEM”,与其技能内容无关。然后,这些标记的招聘广告将作为“基本事实”来训练两个分类器,这两个分类器独立决定该职位是否属于创意/STEM。换句话说,分类器根据职位的技能内容而不是其 SOC 代码来标记标签。
我们的论文进一步证明,在线招聘广告可以为政策制定者提供及时且丰富的职业要求(在这里指的是 STEM 和创造力)信息来源。