日常業務で人工知能を実験してみたアメリカの会社員の割合がますます増えてきて、長期的な職業安定性についてしばらく疑問を抱いた可能性が高いです。
しかし、MITが最近発表したデータによると、ここ数年でAIがいくら発展してきたのか、この技術は依然として特定の職場作業でのみ低レベルに達することができるという。それにもかかわらず、まだ大きなミスを犯している可能性があります。
自分がすぐにAIに置き換えられる可能性があると懸念している労働者は、MITからの新しい研究に安心しています。今回の研究では、AIを中心とした仕事の掌握物語を、速いスピードのアクション映画というよりは遅いスピードの思考作品のように構成しています。
木曜日に発表された予備研究の結果によれば、AIはさまざまな職業にわたってさまざまなタスクを実行する上で徐々に改善されています。しかし、ほとんどの場合、現在利用可能なモデルのパフォーマンスは幻滅を感じたインターンのパフォーマンスと似ています。つまり、最低限のベンチマークを達成しましたが、結果を改善するために人の手を必要とせずに高品質の作業を作成するのは全体的に困難です。
バーをクリア
MITの研究者たちは、Claude、Gemini、およびChatGPTのバージョンを含む41の異なるLLMを使用して、労働省がリストしたさまざまな職務の役割に関する11,000を超える主にテキストベースの作業のパフォーマンスを分析しました。その後、その分野で実際の現場経験を持つ人が結果を採点しました。目標は、AIワーカーの交換が人の編集なしで管理者が受け入れることができる出力をどのくらい頻繁に生成できるかを確認し、その品質を評価することでした。
研究者たちは、AIが長年にわたってさまざまな種類の作業でより信頼できるようになりましたが、利害関係や標準が高まるたびにまだ不足していることを発見しました。 MITの研究では、AIのパフォーマンスを判断するために1〜9ポイントの尺度を使用しました。つまり、タスクはそのまま有用で編集は不要です。 2025年末現在、AIモデルは作業の約65%で7点を獲得しました。
人材パッチをAIに置き換えようとしている企業にとって最も重要なのは、MITデータがAIがより複雑な作業を実行するのに苦労していることを示唆していることです。 AIモデルが作業を完了するのにどれくらいの時間がかかったかに関係なく、9点または「優れた」品質スコアに基づいて評価した場合、成功確率は50%を超えませんでした。つまり、タスクに複数のステップ、創造性、または精度が必要な場合、AI置換は成功するのではなく失敗する可能性が高くなります。
この研究は、米国企業の現在のAI採用ストーリーのいくつかの側面と一致しています。 AIを使用する企業は、新入社員に任せられると、日々の作業や役割を自動化する可能性が高く、一部の高度な技術技術、特にデジタル技術は実際に賃金プレミアムに関連しています。
これは MIT のデータに反映され、法律と IT 職務の経験豊富な役割の平均成功率が低く、AI モデルは一般に建設および保守職業に関連するテキストベースの作業を処理するのに時間がかかりました。
ワークロードの特定の部分を完全に自動化する実験を行った企業は、激しい苦痛を経験しました。昨年、デロイトはオーストラリアとカナダの政府の顧客を対象に2つの報告書を作成しました。 CNET、Sports Illustratedなど、メディアも人工知能を使って偽の記事を作成し、不正確な記事を生成したという事実が摘発されました。弁護士はまた説明会を準備するためにAIに頼っており、1つの法律事務所は昨年、AIによって生成された偽の引用が事件の1つで破産申請に寄与したことが判明した後、公に謝罪しました。
逸話的な証拠とMITのデータによると、AIは技術がまだ急速に発展していますが、その利点を最大化するにはまだ人間の手が必要です。 MITの研究者らは、分析された作業におけるAIの成功率がより多くの能力を持つモデルのため、毎年最大11%ポイント増加したと推定しました。
著者は、2029年までにほとんどのAIモデルが最小限のベンチマークでテキストベースの作業の80〜95%を実行できると推定しています。
AIが優れているのか、完璧なパフォーマンスに向かって拡張できるのかはまだわかっていません。
研究者たちは、「特に、誤りに対する許容レベルが低い領域で自動化が広範囲に行われるにはまだ遠いかもしれません」と書いた。


