OpenAI、APIでより強力なモデルを提供し開発者支援を強化

OpenAIは月曜日のDev Dayで、新たなAPI更新として最新の言語モデルGPT-5 Pro、動画生成モデルSora 2、そして小型で安価な音声モデルを発表した。
これらの更新は、エージェント構築ツールの立ち上げやChatGPT上でのアプリ開発機能の提供を含む、開発者をOpenAIのエコシステムへ引き込むことを狙った一連の発表の一部だ。
GPT-5 Proの追加は、金融・法務・医療といった“高い正確性と深い推論”が求められる分野のアプリ開発に訴求する可能性があると、OpenAIのCEO Sam Altmanは指摘した。
アルトマンはまた、音声機能は将来必須となり、AIと対話する主要な手段のひとつになると述べた。
この方針を踏まえ、OpenAIはAPI経由で低遅延の音声ストリーミング対話をサポートする小型・低価格の音声モデル「gpt-realtime mini」を提供開始する。
新モデルは従来の高度音声モデルより70%安い一方、同等の音声品質と表現力を約束する。
最後に、OpenAIの開発者エコシステムに関わるクリエイターは、現在APIのプレビュー版としてSora 2にアクセスできる。
OpenAIは先週、Sora 2とともに、TikTokの競合アプリ「Sora app」をリリースした。
Sora appはプロンプトに基づき、自分自身や友人、あるいは任意の対象の動画を生成し、TikTok風のアルゴリズム式フィードで共有できる。
アルトマンは「開発者は今や、Sora 2の卓越した動画出力を支える同じモデルを自分のアプリ内で直接利用できる」と語った。
Sora 2は前世代を踏まえ、より現実的で物理的に整合したシーンと同期した音、細かなカメラ指示から生まれるスタイリッシュな映像を強化している。
「例えば、iPhoneの視点を取り、それをSoraに指示して、広大な映画的ワイドショットへと展開させることができる」とアルトマンは述べた。
「音声だけでなく、豊かなサウンドスケープ、環境音、視覚と連動する効果音を組み合わせ、見ているものに根ざした表現を生み出す」—これが新モデルの音と映像の組み合わせの注目点だとアルトマンは付け加えた。
Sora 2は概念開発のツールとして位置づけられ、製品の雰囲気を基にした広告のビジュアル出発点や、Mattel社のデザイナーがスケッチを玩具のコンセプトへ落とし込む用途に使われると説明されている。Dev Dayでの説明では、OpenAIとBarbieメーカーのMattel社が生成AIを玩具製造のパイプラインに導入する取り組みの一例として示された。

\ 最新情報をチェック /

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です