
パルクールや宙返りを行うロボットの動画がソーシャルメディアのフィードを席巻する一方で、業界関係者らは、そのようなアクロバティックな技は進歩の誤解を招く指標であると主張している。 12月初旬にサンフランシスコで開催されたフォーチュン・ブレインストーミングAIカンファレンスで、業界幹部らは、ロボット工学における真の革命は物理的な敏捷性ではなく、ロボットが自ら「考える」能力であると主張した。この能力により、ドアを開けたり、階段を上ったりするという、ありふれていても信じられないほど難しい作業の克服に最終的に近づくことができます。
過去 70 年間、ロボット工学は特定のパラダイムに依存してきました。つまり、知的な人間が複雑な数学を使用して機械を事前にプログラムし、特定のタスクを実行します。 Sequoia Capital のパートナーである Stephanie Zhan 氏と Skild AI CEO の Deepak Pathak 氏は、Fortune の Allie Garfinkle との会話の中で、このアプローチは現在では時代遅れであると主張しました。業界は大規模な変化を経験しており、ChatGPT などのツールの背後にある大規模言語モデル (LLM) などのロボットが、厳密なコードに従うのではなく、データと経験から直接学習します。
「変化は、ロボット工学の物事がより人間の知性によって動かされるようになったということです」とパタック氏は述べ、新しい波は一般化して学習できるモデルによって定義されると指摘した。 「今までと違うのは、これらのモデルやロボットがデータから学習できるようになったことです。」
2024年7月、ザン氏はセコイアのブログに、宇宙分野におけるパタック氏の高い実績と、ロボティクスCEOとしての彼の特徴であるコンピュータビジョンとディープラーニング技術について書いた。これに対し、従来のロボット工学は、特定のデータを収集して、特定のタスクのためにロボットを訓練することに重点を置いています。 Pathak 氏と彼のパートナーである Abhinav Gupta 氏は、大量のデータを活用して基礎モデルを構築しました。インドの小さな町出身のパタクさんは、田舎の故郷を離れることなくインド工科大学カンプール校に入学が認められ、全国的な見出しになったとザン氏は書いている。彼は自宅でコードを手書きし、地元のカフェで限られた時間プログラムを実行することでプログラミングを学びました。彼は後に博士号を取得しました。バークレーで AI を専攻している間、Facebook AI Research に入社し、Skild を共同設立中です。
ガーフィンクル氏とザン氏、パタック氏との会話では、モラベックのパラドックスとして知られる人工知能のパラドックスについて言及した。難しそうに見えるものは簡単なことも多く、簡単そうに見えるものは非常に難しいものです。
バク転がドアより簡単な理由
宙返りするロボットは基本的に自由空間でその体を制御する必要があり、これはコンピューターが数十年にわたって得意としてきた物理学問題です。 「実際には、ロボットに階段を上らせるよりも、後ろ向きに宙返りするようにロボットをプログラムするほうがはるかに簡単です」とガーフィンクル氏は指摘し、両パネリストの意見に同意した。
「物理的知性」の本当の課題であり、究極の目標は、混沌とした現実世界との相互作用にあります。階段を登ったり、ガラスを拾ったりする場合、ロボットは環境の変化に応じて動作を修正するために常に視覚を使用する必要があります。この「感覚運動の常識」は人間の一般的な知性の根源であり、新しい「脳」ソフトウェアが打ち破ろうとしている障壁です。
投資家や経営陣は、これを最近の生成 AI の爆発的な成長に匹敵する市場機会と見ています。ザン氏は、OpenAIがデジタル知識労働の市場を開拓したのと同じように、Pathak’s Skildのような企業はあらゆる肉体労働の市場を開拓することを目指していると指摘した。目標は、あらゆるロボット ハードウェアの頭脳として機能し、コストを桁違いに削減できる「一般的にインテリジェントなソフトウェア」を作成することです。
しかし、ソフトウェアの世界とは異なり、ロボット工学はデータ不足という特有の障害に直面しています。 LLM はインターネットを通じて教えられてきましたが、ロボットの物理的な相互作用に相当するデータベースはありません。パタック氏は、フィールドロボットがシステムをよりスマートにするために必要なデータを生成する「データフライホイール」を構築し、最初に導入した企業が勝つだろうと主張した。
いつロボットが洗濯をしてくれるのか気になる消費者のために、事前にタイムラインを用意しています。パタック氏とザン氏は、ロボットはまずホテルや病院などの産業環境や「半構造化」環境で普及し、その後個人宅などのより混沌とした環境に普及すると予測した。
彼らは、雇用喪失の懸念にもかかわらず、安全、不足、社会開発という将来の「3S」に対処するためにテクノロジーが必要であると主張した。現在、人間を生命や健康の危険にさらしている仕事をロボットが引き継ぐ準備ができています。さらに、人手不足により現在何百万もの仕事が埋まっていないため、ロボットは不可欠なブルーカラーの仕事の穴を埋めることができる。最終的には、危険な仕事や困難な仕事がオプションとなり、人間が好きな仕事に集中できるようになる社会変革が期待されています。


