Revision history and IPFS entry, back to latest

IPFS What is this

OpenAI重磅研究：ChatGPT可能影响80%工作岗位

Mar 21, 2023

ChatGPT 是一款基于 GPT-3.5 架构的大型语言模型，其影响范围涵盖所有收入阶层。尽管ChatGPT为人们带来了许多便利，但高收入工作却面临着更大的风险。

ChatGPT 是一款基于 GPT-3.5 架构的大型语言模型，其影响范围涵盖所有收入阶层。尽管ChatGPT为人们带来了许多便利，但高收入工作却面临着更大的风险。最近，GPT-4的发布引起了广泛关注，ChatGPT 也在第一时间更新了其新版本。 OpenAI首席执行官Sam Altman表示，他对这种技术有些担心。像许多其他专家一样，Altman 担心人工智能技术的强大能力会制造过多虚假信息。此外，新技术还将改变经济、劳动力和教育环境，因此我们需要对这些变化保持警觉。

有人曾戏称，OpenAI首席执行官 Sam Altman 每天背着同一个包，里面装着一个紧急关停AI的红色按钮。 AI技术的快速发展已经让许多行业开始担忧自己的工作是否会被取代。最近，OpenAI研究人员提交的一份报告引起了广泛关注。研究人员估计，ChatGPT及其未来应用可能会影响美国约19%的工作岗位和至少50%的工作任务。同时，80%的美国劳动力至少有10%的工作任务将在某种程度上受到ChatGPT的影响。该研究分析表明，像GPT-4这样的大型语言模型的影响可能是无处不在的。此外，工资较高的工作——可能需要执行许多基于软件的任务——将面临更多来自人工智能聊天机器人的潜在影响。对于职业影响方面，受影响最大的职业包括翻译工作者、作家、记者、数学家、财务工作者和区块链工程师等。

这份研究还进一步细分了ChatGPT对各行业的影响。据称，数据处理托管、出版业等行业最有可能受到影响。相比之下，体力劳动占比较高的行业，如食品、林业、社会援助等，则可能受到的潜在影响较小。

OpenAI进行了一项研究，对1000多个职业进行了分类，并为每个职业贴上了执行所需任务的各种标签。然后，研究人员使用人工注释器和GPT-4模型来评估使用ChatGPT驱动的系统是否会将人类完成特定任务所需的时间缩短至少50%。

论文地址：

https://arxiv.org/pdf/2303.10130v1.pdf

研究介绍

OpenAI针对GPT模型及其相关技术对美国劳动力市场的潜在影响进行了调查。他们根据人员职业与GPT能力的对应程度进行评估，发现约80%的美国劳动力至少有10%的工作任务会受到GPT引入的影响，约19%的员工可能会看到至少50%的工作任务受到影响，这种影响涵盖所有工资水平，高收入工作可能面临更大的风险。值得注意的是，这种影响不仅限于近期生产率增长较高的行业。

该研究还发现，像GPT-4这样的大型语言模型带来的影响可能是普遍的。随着时间的推移，LLM的能力不断提高，即使现在研究人员停止对新模型能力的开发，但它们带来日益增长的经济效应也会持续增长。此外，如果考虑到互补技术的发展，LLM的潜在影响将显著扩大。因此，GPT正在变得越来越通用。

为了分析，该研究还提出了一个新的标准来理解LLM的能力及其对工作潜在影响，该标准用来衡量关于GPT任务的总暴露数。研究使用了O*NET 27.2数据集，该数据集包含1016个职业信息，表1提供了数据集示例，包含任务ID、职位等。

除此之外，该数据集还包括美国劳工统计局在2020年至2021年期间所获得的员工就业和工资数据，其中包括职业头衔和每个职业的工人数量等信息。在方法方面，该研究使用了“暴露量评估表”来展示结果。暴露量评估表是指，通过访问由GPT或GPT驱动的系统，是否能将人类执行特定的详细工作活动（DWA）或完成任务所需的时间减少至少50%来进行评估。（注：详细工作活动（DWA）指完成任务所需的具体行动，例如在表1中，计算机系统工程师的DWA包括监控电脑系统性能以确保正常运行。）

为了获得对每个 ONET数据集的 DWA 和所有 ONET 任务子集的人工注释，该研究汇总了任务和职业级别的 DWA 和任务得分。为确保注释的质量，该研究人员亲自标记了大量任务和 DWA 样本，并聘请了经验丰富的人工注释者，在 OpenAI 的对齐工作中广泛审查了 GPT 输出。该研究还提供了模型与人一致性的比较结果，并使用皮尔逊相关系数来评估一致性分数。在此研究中，GPT-4 和 Rubric 1 被用于评估。

该研究为感兴趣的因变量构建了三个主要度量：（i）对应于前面描述的暴露量规中的E1，（ii）是E1和0.5 * E2的总和，以及（iii），这是E1和E2的总和。该研究总结了注释组与表2中措施之间的一致性。

OpenAI研究假设GPT语言模型对经济具有普遍影响，以下是具体的研究结果。表 3 显示了人类和 GPT-4 模型的总体暴露数据。来自人类和 GPT-4 的数据表明，平均职业级别值在 0.14 到 0.15 之间，这表明大约中级职业15% 的任务直接受到GPT 的影响。对于，此数字增加到 30% 以上，对于，它超过 50%。

据度量值，该研究估计有80%的人从事的职业中至少有一项工作任务会受到GPT的影响，而有19%的人所从事的职业中超过一半的工作任务都被标记为受到GPT的影响。

工资和就业

下图 3 描绘了 GPT 模型对经济的整体影响。

下图 4 描绘了工作薪资与对 GPT 等语言模型接触使用情况的关系。

该研究还对 GPT 模型在不同职业分类中的影响进行了研究，其中包括 ONET 数据库中的 5 个职业分级。这些职业分级按照职业入门门槛的不同进行划分，Job Zone 1 要求最低，而 Job Zone 5 要求最高。

总体而言，OpenAI的这项研究发现，科学方法和批判性思维对工作的依赖程度与LLM的使用呈负相关，而编程和写作技能与LLM的使用呈正相关。然而，该研究也承认，试图通过简单的标签来描述工作任务并代表每个职业的方法本身存在固有偏见，并可能忽略一些特定的技能或任务。当然，GPT模型目前仍存在许多缺陷，包括编造虚假信息，这使得人工监督工作成为必要。虽然广泛应用大型模型可能导致许多人失去工作，但OpenAI首席执行官Sam Altman认为，这也将是寻找更好工作机会的机遇：“我们可以拥有更高的生活质量。同时，人们需要时间来适应、做出反应并习惯这项新技术。"参考内容：

https://www.cnbc.com/2023/03/20/openai-ceo-sam-altman-says-hes-a-little-bit-scared-of-ai.html

https://www.pcmag.com/news/openai-chatgpt-could-disrupt-19-of-us-jobs-is-yours-on-the-list

CC BY-NC-ND 2.0