10.9 C
Tokyo
Tuesday, March 17, 2026
ホームタグ誰もがAndrej

Tag: 誰もがAndrej

spot_imgspot_img

誰もがAndrej Karpathyの自律AI研究エージェントについて話す理由幸運

今月初め、OpenAIの創立スタッフの一人であり、後にテスラのAIを率いた有名なAI研究者Andrej KarpathyがXで口コミを出しました。これだけでもそれほど珍しいことではありません。現在独立したAI研究者として働いており、AI時代のための新しい種類の学校を作っていると言うEureka Labsの創設者でもあるKarpathyはXに190万人のフォロワーを持っており、彼の評判は彼がAIについて語るほとんどすべてが福音や予言として扱われるほど有名です。 しかし、この記事は、小さな言語モデルのトレーニングを改善する方法を理解するために、AIコーディングエージェントを使用して一連の実験を実行する実験に関するものでした。彼は2日間AIエージェントを実行し続け、その間にAIエージェントは700の異なる実験を行いました。これらの実験の過程で、トレーニング時間を改善する20の最適化が見つかりました。 Karpathyは、大きくてもまだかなり小さい言語モデルに同じ20の調整を適用すると、モデルのトレーニングにかかる​​時間が11%向上することがわかりました。 Karpathyは、この実験を実行するために構築したシステムを「自動研究」と呼びました。 Shopifyの共同創設者でありCEOであるTobias Lütkeは、社内データのAIモデルを最適化するために自動調査を試み、エージェントにモデルの品質と速度を改善するためのガイドラインを提供したとXに投稿しました。 Lütkeは、一晩の自動調査を行った後、37回の実験を実行し、19%の性能向上を達成したと報告しました。多くの人々の注目を集めたのは、自己研究がもともとサイエンスフィクションで取り上げられていた自己改善AIシステムのアイデアに近く、AI研究者の中には心から願い、一部に深い恐れがあるということです。懸念されるのは、AIが一種のループで独自のコードとトレーニングを継続的に最適化する「再帰的自己改善」が、AI安全研究者が時々「ハード離陸」または「インテリジェント爆発」と呼ぶ現象につながる可能性があることです。このようなシナリオでは、AIシステムは独自のパフォーマンスを急速に向上させ、人間の認知能力を超えて人間のコントロールから抜け出すことができます。 Karpathyの実験はこれではありませんでした。自動研究設定の中心となるAIエージェントは、独自のトレーニング設定を改善するのではなく、はるかに小さく、あまり洗練されていない他のAIモデルのトレーニングコードと初期ニューラルネットワーク設定を調整することです。しかし、Karpathyは彼の実験がAI研究所が将来の研究を行う方法に大きな影響を与え、それが進行を加速する可能性があることを正しく指摘しました。KarpathyはXについて「すべてのLLMフロンティア研究所でこれを行います。これは最後のボスの戦いです」とKarpathyはXに書いています。彼は「もちろん、規模がはるかに複雑である」と認めた。彼の自動研究者は、630行のPythonコードに含まれているモデルとトレーニングプロセスの調整について心配するだけでしたが、フロンティアAIモデルのトレーニングコードベースははるかに大きいからです。 「しかし、そうすることは「ただエンジニアリング」に過ぎず、効果があるでしょう。」と彼は続けました。 「エージェントの群れを稼働させ、コラボレーションして、より小さなモデルを調整し、最も有望なアイデアをますます大きな規模で推進し、人間は(オプションで)エッジに貢献します。」彼は現在、独自の自動研究システムが単一のエージェントが単一のパスに沿ってコードの断片を継続的に改善するように設計されていますが、今後は複数のAIエージェントがさまざまな最適化とさまざまな実験を同時にナビゲートできると想像しています。 「自動研究の次のステップは、エージェントのために非同期で大規模なコラボレーションを実行する必要があることです」と彼は書いた。 「目標は、一人の博士課程の学生を模倣するのではなく、彼らの研究コミュニティを模倣することです」。Karpathyはまた、多くの人々を興奮させた自動研究について別の話をしました。 「評価するのに合理的に効率的な(または小規模なネットワークトレーニングなど、より効率的なプロキシ指標がある)興味のある*すべての指標は、エージェントのグループによって自動的に調査される可能性があります」と彼は書いた。 「あなたの問題もこのバケットに属しているかどうかを考える価値があります。」いくつかの評論家は、自動研究の基本的なコンポーネントがプロセスを最適化するために他の多くのエージェントシステムで使用できることを指摘しています。 Janakiram & AssociatesのシニアアナリストであるJanakiram MSVは、技術出版物The New Stackでこれを「Karpathy Loop」と呼びました。これには3つのコンポーネントがあります。変更可能な単一ファイルにアクセスできるエージェント。エージェントが最適化できる客観的にテスト可能な単一の指標各実験を実行できる期間には一定の時間制限があります。彼はまた、Karpathyが自動研究でAIエージェントに提供した指示がAIエージェントと対話するすべての人にとって良いモデルであることを強調しました。 Karpathyが使用するプレーンテキストファイルには、エージェントが実行する必要があるアクション、制約、エージェントに実行または変更しないでください。しかし、一部の批評家は、Karpathyは、Google、Microsoft、およびその他のAI研究所の研究者がすでに長年にわたって使用してきたAutoMLというプロセスの一部を再発見した以上を実行していないと述べています。 AutoMLはまた、最適化ループと一連の実験を使用して、AIで使用するための最良のデータ、使用するための最良のモデルアーキテクチャを見つけ、そのモデルアーキテクチャを調整します。ただし、AI研究論文を読んで改善を必要とする仮説を開発できるAIエージェントは使用しません。 AutoMLシステムは、どのような変更を試みるかを決定するために、ランダムな変形やさまざまな進化アルゴリズムに依存する傾向があります。 Karpathyは、これらの意見のいくつかについてAIモデルの設計を最適化する自動化された方法である神経アーキテクチャ検索など、一部のAutoML法は彼の自動研究ほど強力ではないと答えました。...

必読

spot_img