Soraとは
Soraとは、OpenAIが発表した新しい動画生成AIです。動画生成AIとは、機械学習と深層学習技術を活用して、テキスト、画像、音声、動画のデータから新しい動画を自動的に生成する技術です。このSoraはテキストのプロンプト(指示文)を入力するだけで、最長1分の動画を生成できます。背景を含め、シーンすべてをAIが作成します。
Soraは2024年2月時点で一般公開は発表されていません。技術面において開発中であり、またコンテンツの悪用問題の対策を進めています。公開に向けたスケジュールや利用条件など詳細は未定となっています。
参考サイト: Sora 公式サイト
Soraでできること
テキストから動画を作成
Soraのメインとなる機能で、テキストのプロンプト(指示文)から動画を生成できます。
画像・動画から動画を作成
テキストのプロンプトだけではなく、画像や動画の指示にも対応しています。テキストと画像のプロンプトを合わせることでより高精度な動画を生成できます。
動画の拡張・編集
OpenAI社の公式サイトで紹介されているのは、生成された動画のセグメントから時間を逆方向に拡張したものです。前後に動画を拡張することでループ動画を生成することもできます。
画像の生成
動画だけでなく画像の生成も可能で、最大2048×2048の解像度までさまざまなサイズに対応しています。
高度なシミュレーション
従来の動画生成AIにはなかったシミュレーション能力を備えています。たとえば、カメラが移動したり回転したりすると、人物やシーンの要素が3次元空間内を一貫して移動する動画を生成できます。
Soraのプロンプト例
Soraの公式サイトでは実際にSoraが生成した動画を掲載しています。
さらに、OpenAIのCEOであるサム・アルトマン氏は自身のX(旧Twitter)アカウントでユーザーからプロンプトを募集し、Soraの高精度な動画生成を公開しています。
プロンプト:a futuristic drone race at sunset on the planet mars
(火星の夕暮れ時の未来的なドローンレース)
https://twitter.com/sama/status/1758218059716939853
プロンプト:Two golden retrievers podcasting on top of a mountain
(山の頂上でポッドキャストをする2匹のゴールデンレトリバー)
https://twitter.com/sama/status/1758218820542763012
プロンプト:A instructional cooking session for homemade gnocchi hosted by a grandmother social media influencer set in a rustic Tuscan country kitchen with cinematic lighting
(映画のような照明のある素朴なトスカーナの田舎のキッチンで、ソーシャルメディア・インフルエンサーのおばあちゃんが主催する自家製ニョッキの調理指導セッション)
https://twitter.com/sama/status/1758219575882301608
Soraの安全性
こうした高度な動画生成AIの発展に伴い課題となるのが、フェイク動画や誤情報の拡散、プライバシーの侵害、著作権の問題です。OpenAIではこのような倫理的、社会的な課題に重要な安全措置を講じる予定です。
Soraによって動画がいつ生成されたかを知ることができる検出分類子(C2PAメタデータ)など、誤解を招くコンテンツの検出に役立つツールも構築しています。またOpenAIサービスでは、暴力的、性的などの有害な内容や、有名人の肖像、知的財産を侵害する内容などはプロンプトの時点でブロックされます。政策立案者、教育者、アーティストとの協力を進め、新しいテクノロジーの前向きな使用を促進しています。
まとめ
いかがでしたでしょうか。誰でも簡単に高精度な動画を作ることができる「Sora」は、革命的で無限の可能性を秘めています。クリエイターだけでなく、企業の広告や一般ユーザーのSNSなどさまざまな場面で活躍する未来が期待できます。これからもSoraの最新情報から目が離せません。