yagibrary

あだ名のやぎと図書館のlibraryを組み合わせてyagibraryです。本から学んだことをみなさんに紹介します。

【論文和訳】Tyna Eloundou, Sam Manning, Pamela Mishkin, Daniel Rock【GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models】1 Introduction2

arxiv.org

目次

1 導入

このような経過を説明し、テクノロジーの労働影響予測を補完するために、我々はLLMの能力とその潜在的な雇用への影響を理解するための新しい基準を提案する。この評価基準(A.1)は、機械学習への影響の定量化に関する先行研究(Brynjolfsson et al, 2018; Felten et al, 2018; Webb, 2020)の精神に従って、GPTへのタスクの全体的な影響を測定する。労働増強効果か労働代替効果かを区別することなく、潜在的な経済効果の代理としてエクスポージャーを定義している。この評価指標を、人間の評価者とGPT-4自身を分類器として用い、主にO*NETデータベースから入手した米国経済の職業データに適用した。


このデータセットを構築するために、著者からのラベルのサンプルと一致するように調整されたプロンプトを使用して、人間の評価とGPT-4分類の両方を収集した。タスクレベルに集約した場合、GPT-4の回答や、人間と機械による評価の間に、同様の一致レベルが観察される。この指標は、人間の労働をより効率的にするための技術的能力の推定値を反映している。しかし、社会的、経済的、規制的、またはその他の決定要因は、技術的実現可能性が労働生産性や自動化の成果を保証するものではないことを意味する。私たちの分析によると、現在のモデル機能とその上に構築される予想されるツールの両方を考慮すると、約19%の仕事が少なくとも50%のタスクが晒されていることがわかる。人間による評価では、ソフトウェアやモダリティを追加せずに、既存の言語やコードの能力を考慮した場合、米国の労働者のうち、GPTにさらされるタスクが半分以上あるのはわずか3%であることが示されている。他の生成モデルや補完的な技術を考慮すると、我々の人間による推定では、最大で49%の労働者が、その作業の半分以上がLLMにさらされる可能性があることがわかる。