
人間のエンジニアのチームが作成した Web ブラウザが適切に動作しなかったら、人々は言葉を失うでしょう。しかし、コーディングスタートアップ Cursor の CEO、Michael Truell 氏が次のように投稿したとき、
なぜバズなのか?大きな理由は 2 つあります。まず、AI の注意持続時間は歴史的に短いです。 ChatGPT の初期の頃、モデルは数秒間しか動作し続けることができませんでした。より優れたモデルでは、範囲が数分から数時間に増加しました。 Cursor プロジェクトは、AI システムが人間の指導なしで複雑なオープン ソフトウェア プロジェクトを丸 1 週間維持した最初のプロジェクトの 1 つであると主張しています。
さらに、単一の AI エージェントは、集中的な小さなタスクに限定されます。しかし、大規模なプロジェクトで何百人ものエージェントを調整するのはまだ未来的なように思えました。だからこそ、Cursor 氏は AI エージェントの「オーケストラ」を組んで、人間のチームでは数か月かかる可能性があるプロジェクトで自律的なコーディングをどこまで推進できるかを確認したいと考えたのです。 AI システムは、コードをナビゲートし、タスクを部分に分割し、独自にデバッグし、目の前のタスクから逸脱することなく何日も前進し続けるために、一貫して十分に連携できるでしょうか?
AIエージェント「オーケストラ」
研究者らは、答えはほぼ「イエス」であることを発見しました。カーソル氏の実験では、数百人のエージェントがソフトウェアチームのような組織に組織化された。何百万行ものコードを調整する「プランナー」、「作業者」、「審査員」がいました。これは、近い将来、AI が従業員をサポートするだけでなく、プロジェクト全体を引き継ぐようになるだろうと、Cursor 氏と OpenAI 氏は述べています。これにより、最初はソフトウェア開発、次に他の職業において、複雑なタスクの実行方法が根本的に変わります。
AI の群れの実験は数年前から行われてきました。しかし、今日のモデルはよりスマートであり、はるかに長期間にわたって一貫性を維持できるとカーソル氏は言います。モデルは、何百ものエージェントを調整し、混乱を防ぐカスタム レイヤーを使用して、はるかに大規模に実行できます。
Cursor社のエンジニアで長期稼働のAIエージェントを研究しているJonas Nelle氏はフォーチュンに対し、AIモデルが改良され続けるにつれ、エンジニアや研究者はAIモデルが何ができるかについての想定を数カ月ごとに再検討する必要があると語った。同氏は「今日はChromeをダウンロードしたり削除したりするつもりはない」と認めたが、このブラウザプロジェクトは「前任者が達成できたものを間違いなく超えた」と語った。
OpenAI のエンジニアで、同社のモデルの実際の動作をストレス テストして評価している Bill Chen 氏は、これらの長期にわたって実行されているエージェントは重要な先駆者であると付け加えました。タスクの長さと、AI システムが自律的かつ一貫してタスクを実行できるという事実は、「システムがどれほどインテリジェントで汎用性があるかを示す非常に良い指標」であると同氏は述べた。 OpenAI の GPT-5.2 に基づく Cursor プロジェクトは、「モデルの機能の限界を押し広げ続けた直接の結果」です。同氏は、将来的にはさらに長い期間のテストが行われるだろうと述べた。
AI エージェントの群れはまだビジネスで使用する準備ができていません。
ただし、これは本番環境に対応したシステムではありません。これらはバグが多く不完全であるだけでなく、多数のエージェントを数日または数週間にわたって実行するプロジェクトにとってはコストがかかります。過去 1 年間で価格は大幅に低下しましたが、数百の AI エージェントが関与する長期的な運用では依然としてコストが発生する可能性があります。
セキュリティの問題もあります。自律システムは脆弱性、データ漏洩などに関する懸念を引き起こし、多くの新しい制御層と監査を必要とします。
しかしチェン氏は、近い将来、このような製品が「法外なコストをかけずに広く消費できるようになるかもしれない」と予想していると語った。同氏は、これまでに進展が見られ、あらゆる段階で重要なロック解除が達成されたと述べた。同氏は、これが「学術的および公的評価やベンチマークでのパフォーマンスと比較した」モデルの機能の実際の実用的な例であるという事実に興奮していると述べた。
こうした変化は長年AIを観察してきた人たちさえも驚かせました。独立研究者のサイモン・ウィリソン氏は最近の投稿で、2029 年までに誰かが主に AI を使用して本格的な Web ブラウザを構築すると予測しましたが、それは驚くべきことではありません。 「新しい Web ブラウザのリリースは、私が想像できる中で最も複雑なソフトウェア プロジェクトの 1 つです」と彼は書いています。カーソルによってタイムラインが早まった可能性があります。 「おそらく3年ほど休暇を取ったと思います」とウィソンは語った。 「この能力がこれほど早く発現するのを見て非常に驚いたことを認めなければなりません。」
これは、OpenAI などが「機能の過負荷」と呼んでいることを物語っています。これは、最も洗練された AI モデルは、公的に展開されているものよりもはるかに多くの機能を実行できますが、ツール、製品設計、コスト削減を適切に組み合わせれば、突然大規模に利用できるようになるという考えです。つまり、カーソル ブラウザのようなツールはまだ全盛期に向けた準備が整っていませんが、今後の道筋は明らかです。
この記事はもともと Fortune.com に掲載されました。


