ソラに関する3つの大きな未解決の疑問を徹底分析し今後の展望を詳しく解説

MITの報告によれば、先週 OpenAI は Sora(ソラ)を公開した。TikTok風のアプリで、AI が生成した動画だけを無限に表示するフィードを提供し、各動画は最大で10秒だ。

このアプリでは、自分自身の「cameo」(外見と声を模倣する超リアルなアバター)を作成し、相手が設定した権限次第で他人の cameos を自分の動画に挿入することもできる。MITはこの点について、権限設定が運用の鍵になると見ている。

OpenAI の約束が人類全体の利益につながるAIの開発だと信じる人々にとって、Sora は「パンチライン」と捉えられている。元 OpenAI の研究者で、AI を科学の分野に活用するスタートアップを立ち上げた人物は、Sora を「無限のAI TikTok のスロップ機械」と呼んだとされる。MITはこの評価を伝える。

にもかかわらず、Sora は Apple の米国 App Store でトップに跳ね上がっている。筆者がアプリをダウンロードした後、現時点でどんな動画が支持を集めているかをすぐに読み解くことができた。ボディーカム風に警察がペットを止める場面や、スポンジ・ボブ(SpongeBob)やスクービー・ドゥー(Scooby-Doo)などの商標キャラクターを用いた動画、マーティン・ルーサー・キング・ジュニアが Xbox について語るディープフェイク・ミーム、現代社会を舞台にしたイエス・キリストの無限のバリエーションといった内容が目立つ。

同時に、Sora の今後がどう展開するのかについて多くの疑問が浮かぶ。MITの見解を交えつつ、現時点で分かっている点を整理する。

OpenAI は、現象としての「大量の人が、偽情報かどうかを気にせずにAI生成のストリームを楽しめる」アプリに需要があると見込んでいる。あるレビュアーは「スクロールしているものが現実かどうかの推測を必要としない点が安心感につながる。ここでは常にAI だ」と述べたが、MITはこの見方を注視している。

この考え方には賛否がある。だがSora の人気ぶりを見れば、多くの人がそれを求めていることは確かだ。二つの説明が挙がる。第一は、Sora が瞬発的な見世物的 gimmick であり、最先端のAI が今何を生み出せるかを人々がただ眺めるだけの現象に過ぎないという見解だ。著者の体験では、これは約五分程度の興味にとどまるとされる。第二は、OpenAI が賭けるとおり、Sora によって視聴者を引きつける新たな定性的なコンテンツの形が生まれ、他のアプリにはない“幻想的な創造性”を提供するためユーザーが長期にわたりとどまる、という点だ。MITは後者の可能性に注目している。

この先を形作る決定は幾つかある。OpenAI が広告をどう実装するか、著作権で保護されたコンテンツに対してどのような制限を設けるか(下記参照)、そしてどのアルゴリズムを用いて誰が何を閲覧できるかを決めるか、が焦点となる。

OpenAI は黒字企業とは言えないが、シリコンバレーの運用慣行からすれば特に異例とはいえない。しかし、映像生成というエネルギー集約的でコストの高いAIのプラットフォームへ投資している点は特異だ。映像を生成するには、画像生成やテキスト回答を作成するよりもはるかに多くのエネルギーを要する。MITはこれを受け、「Sora は無料・無制限で動画を生成できる現在の状況を踏まえると、企業のコストはより高くつく可能性がある」と指摘する。

この事態はOpenAI にとって新しい話ではなく、同社はデータセンターや新設の発電所を含む5,000億ドル規模のプロジェクトへと踏み込んでいる。しかし Sora は現在、限界なく無料で動画を生成可能な状態で提供されており、芸術的自由度の高さを狙い撃ちにする格好となり、コスト圧力は高まっている。MITは、今後の費用がどの程度膨らむのかを注視している。

映像生成ツールがこれまで以上に多くの人々に行き渡る状況を踏まえ、Sora の仕組みを改めて見ていく。OpenAI は収益化への動きを強めつつある。例えば ChatGPT 内で直接製品を購入できる機能などだ。10月3日、CEO の Sam Altman はブログで「動画生成の収益化をどう実現するか」を述べたが、具体的な方法には踏み込まなかった。個別の広告やアプリ内課金の拡張などが想定される。

それでも、Sora が人気を博すときの排出量問題は避けられないとの懸念がある。Altman は ChatGPT への1回のクエリの排出量を「想像を絶するほど小さい」と正確に述べているが、Sora が生成する10秒動画の排出量は定量化されていない点が未解明だ。AIと気候研究者がこの数値を求め始めるのも時間の問題だ。

Sora は著作権や商標のキャラクターが氾濫しており、故人の著名人のディープフェイクも容易だ。動画には著作権で保護された音楽が使われている。MITは、先週のウォール・ストリート・ジャーナルの報道を引用する形で、OpenAI が著作権者に対して「オプトアウトしなければSora に素材を含めることになる」ことを通知したと伝えられている点に留意する。これが通常の取り扱いかは疑問で、著作権物の扱いを巡る法的整備はまだ確定しておらず、訴訟の可能性が現実的に取り沙汰されるだろう。

直近のブログ投稿で Altman は、OpenAI が「多くの権利者から、Sora での自分のキャラクターの使われ方をより厳密に制御したいとの声を受けている」と記し、同社がキャラクターに対してより「粒度の高い制御」を提供する方針を示したとした。一方で「それを回避できない生成の事例もあるかもしれない」とも付言している。

ただ、現実の人物のcameo を使うことの容易さは別の問題だ。本人は cameo の使用を制限できるが、Sora の動画で cameo がどのように使われるべきかについては、どの程度の制限が設けられるのかが焦点となる。

この点はすでに OpenAI に対応を迫っている。Sora の責任者 Bill Peebles は10月5日に、ユーザーが自分の cameo の利用を制限できるようになったと報告した。たとえば政治的な動画への出演を避ける、特定の語を用いないようにする、といった設定だ。実際にこの機能がどれほど機能するかは未知数で、誰かの cameo がネガティブな用途に使われることで OpenAI の責任を問う訴訟が起きる日も遠くないのかもしれない。

総じて、Sora の本格稼働版はまだ見ていない(OpenAI は招待コードでの提供を継続している)。実用版が整えば、それは「現実の動画」を視聴の中心に据える従来の動画と競合可能なほど、無限のエンゲージメントを生み出す AI の力を示す厳格な試験になるだろう。結局のところ、Sora は OpenAI の技術を試すだけでなく、それを超えて私たち自身が無限スクロールのシミュレーションと自分たちの現実のどれだけを交換する覚悟があるのかを問う、重大な実験でもある。

\ 最新情報をチェック /

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です