2024年2月に最新動画生成AIモデル「Sora」を発表してから約10ヶ月、OpenAI社はついにSoraの一般提供を開始しました。12月9日(現地時間)に正式リリースされて以降、早くも世界中のAIユーザーを驚かせています。動画生成AIと称されるツールはすでに存在していますが、Soraは一線を画すものだといいます。一体どういうことなのでしょうか。
本記事では、Soraの特徴やサービス概要、そして料金体系や利用時の注意点にも言及します。最新技術を搭載したSoraで何ができるのか見ていきましょう。
Soraはどんなサービス?概要を解説
OpenAI社はSoraの一般ユーザー向け公開にあたり、公式レポートに次のような文章を掲載しました。「我々の結果は、ビデオ生成モデルが、物理世界の汎用シミュレータを構築するための前途有望な道であることを提示している」「大規模なトレーニングにより、多くの興味深い新たな機能を示すことがわかった」
Soraはただの動画生成ツールにとどまらず、物理世界をシミュレーションするものだと語っています。被写体と背景を正確に理解して動画に反映する技術は、OpenAI社の研究開発の蓄積から生み出されたものです。Sora自体がゼロから生まれた新しい技術というわけではありません。視覚データを“パッチ”という小さなデータ単位に分解し、拡散モデルとトランスフォーマーアーキテクチャの組み合わせで処理を行い、画像や動画を構築する仕組みだそうです。
少し専門的な内容に派生しましたが、Soraを利用してユーザーができることを、簡潔にまとめています。
①テキストから動画を生成
②画像(静止画)から動画を生成
③動画から新しい動画を生成
④画像を生成
⑤ゲーム(デジタル空間)のシミュレーション
●テキストから動画を生成(Text-to-Video)
Soraの主要な機能であり、テキストでプロンプトを入力すると、それに基づいて最大20秒の動画を作成します。このような機能は他にも存在しますが、Soraのクオリティは群を抜いています。キャラクターの動きを自然に表現し、感情を描写する能力も優れ、実際に撮影したのかと思うほどです。Soraは“対話型AI”ですので、何度も修正を行いながら動画を仕上げていくことが可能です。
●画像や動画から新たな動画を作成(Image-toVideo, Video-to-Video)
テキストプロンプトに限らず、画像や動画をアップロードしてテキストで指示を出すと、静止画が動き出す、あるいは動画の前後を拡張したりできます。2つ以上の動画を編集して結合させて1つの新しい動画を生み出す技術もあります。動画同士をシームレスに繋ぐ機能など、映像制作に変革を起こすポテンシャルを持っているのです。
●シミュレーション
ゲーム空間など人工的な世界をシミュレートすることも可能です。なんと、テキストプロンプトを入力するだけでゲームの世界を再現し、私たちがゲームをプレイしているかのような映像を作り出します。一人称視点できちんと再現されており、違和感を覚えません。
料金体系についても調べてみた
Soraは、一般の無料ユーザーは使用することができません。利用するためには、ChatGPT PlusもしくはChatGPT Proプランに加入する必要があります。
●chatGPT Plus
月額料金は20ドル(約3,000円)です。1ヶ月あたりの動画生成本数は上限50本(1,000クレジット)となります。動画最大解像度は最大720p、動画の長さは最大5秒です。同時生成数は1本のみ、動画にはウォーターマークが表示されます。
●chatGPT Pro
月額料金は200ドル(約30,000円)です。chatGPTの新プランで、Sora以外のGPT-4oやo1モデルにも無制限にアクセスできる最上位プランです。1ヶ月あたりの動画生成本数は上限500本(10,000クレジット)となっています。動画最大解像度は最大1080p、動画の長さは最大20秒です。同時生成数は5本まで可能なため、同一プロンプトから複数の動画を生成して比較することもできます。動画をダウンロードする際のウォーターマークはありません。
chatGPT Plusプランでも動画生成はできるものの、様々な制限がかけられています。ビジネス用途で導入する場合、ウォーターマークが表示されず、たくさんの本数を生成できるchatGPT proプランを選択すべきでしょう。ただし料金が月200ドルと非常に高額なため、コストに見合うか検討してください。
利用する際の注意点や活用方法を解説
注意点について、まず商用利用に関しては、現時点で明確なポリシーは明記されていません。OpenAI社が提供する他のサービスでは、商用でも活用可能なケースが多く、Soraもユーザーが生成物の権利を保持するものと考えられます。今後利用規約がアップデートされるか、確認するようにしましょう。
また、悪質な不正使用に対して厳しく制限しています。
●児童性的虐待の素材や性的ディープフェイクをブロック
●特定人物を含む動画の作成は不可
●ヌードを含むコンテンツはブロック
動画や画像を不正使用した場合、アカウントの停止につながる可能性があり、プランの返金対応も受けられません。ユーザーは、アップロードするコンテンツについて、正当な権利を有することが必要です。18歳未満は全世界で利用不可とし、イギリス、スイス、EU諸国からは2024年12月時点で利用不可となっています。
まとめ
Soraが一般ユーザーに公開されたことで、プロフェッショナルなクリエイターでなくとも簡単に動画生成できる環境が整いました。アメリカでは、大手企業の「トイザラス」が広告映像をSoraで制作するなど、企業にも取り入れられています。この映像はVFX技術を併用して非常に芸術的な作品になっており、動画生成AIと他の技術の融合で映像分野はさらなる進化を遂げるでしょう。利用にあたって規約を遵守し、ディープフェイクや性的・暴力的な動画の拡散に悪用してはいけません。2025年には新価格プランの発表なども予定されています。そちらも注視したいところです。