「AI企業は、誤ってダース・ベイダーを表示しないようにユーザーのプロンプトを積極的にフィルタリングして出力をモデル化するか、ダース・ベイダーのビデオや画像を作成する許可を得るために権利所有者と契約を結ぶ必要がある立場にある」とサグ氏はフォーチュンに語った。 「ライセンス戦略は、はるかに双方にとって有利なものです。」
この 3 年間の契約により、OpenAI には、ディズニーが所有する何百ものキャラクターを Sora および ChatGPT 画像に集約する権利が付与されます。 Disney はまた、社内で ChatGPT を導入しながら、株式保証も受けて OpenAI の主要顧客になる予定です。
サグ氏は、この取引自体が「収益分配」の一形態になると述べた。
「OpenAIは収益モデルをまだ理解していない」とサグ氏は語った。 「したがって、これを単純な投資取引にすることで、ある意味で簡素化できると思います。ディズニーにとって…(OpenAI)はいつかこれを収益化する方法を見つけ出し、(ディズニーは)その一部を得るでしょう。」
なぜこの取引が重要なのか:「スヌーピー問題」
サグ氏は、AI企業がライセンスのないコンテンツを使ってモデルをトレーニングしている可能性が「非常に強い」ためだと述べた。 Anthropic と Meta に関する最近の 2 つの裁判所の判決により、この議論はさらに強化されました。
サグ氏は、本当のつまずきはトレーニングではなく常にアウトプットにあると語った。モデルが誤ってダース・ベイダー、ホーマー・シンプソン、スヌーピー、エルサにあまりにも似たフレームを作成する可能性がある場合、フェアユースの防御は弱まり始めます。
「暗記しすぎると、その暗記が結果としてフェアユースケースが崩れ始めます」とサグ氏は言う。
LLM を教えるのに十分なテキスト ライセンスを確保することは不可能ですが (サグ氏によると、それには 10 億回のトランザクションが必要になる)、適切なパートナーがいれば、ライセンスされたデータから完全に画像またはビデオ モデルを構築することは可能です。だからこそ、ディズニーのようなセールが重要なのです。コース自体がフェアユースに該当するかどうかに関係なく、以前は違法だった成果物を合法的な成果物に変換する。
「制限原理は基本的に、日常のタスクにおいて、これらのモデルがトレーニング データ内のタスクのかなりの部分を再現するかどうかに関するものです」とサグ氏は述べています。
これは AI データの将来の兆しでもあります。
サグ氏はブログ投稿で次のように書いています。
「公共のインターネットという簡単に実現できる成果がもぎ取られた」と彼は書いている。 「OpenAIのような企業は、より良くなるために、他の誰も持っていないデータにアクセスする必要があります。GoogleにはYouTubeがあり、OpenAIには今ではMagic Kingdomがあります。」
これは、彼が「データ不足理論」と呼ぶものの核心です。OpenAI のモデル品質を向上するには、スクレイピングを増やすのではなく、独占的なコンテンツ パートナーシップが必要になる場合があります。
「OpenAIは、世界有数の知財保有者と絡むことで破壊の危機に瀕している業界にとって、不可欠なものとなっている」とサグ氏は書いた。
AI とハリウッドは、トレーニング データ、肖像権、侵害をめぐって 3 年間冷戦を続けてきました。ディズニーの10億ドルの投資はその時代の終わりを意味するようだ。
「これは将来のテンプレートです」とサグ氏は書いた。 「私たちはAIとコンテンツの全面戦争から脱却し、交渉による世界の分断に向かっている。」


