AI

高品質な動画生成AIモデルSora 2で高まるディープフェイクのリスク

盛 堃

2024年2月にOpenAIが公開した初代Soraモデルは、動画分野における「GPT-1」とも言える重要な出来事でした。これは、「実用に足る」といえる初の動画生成モデルでした。

そして、2025年9月末、同社はSora 2を正式に公開。肖像権の扱いで物議を醸していますが、動画生成技術は言語分野に比べてまだ黎明期にあると言えるでしょう。この記事では、Sora 2について解説します。

Sora 2により、AI動画は物理法則を尊重し始めた

Sora 2の最大の進歩は、物理法則の世界を尊重し始めた点です。OpenAIは、Sora 2によって動画分野における「GPT-3.5」に一気に踏み込んだと述べています。

Sora 2は、従来の動画生成モデルにとって極めて困難、場合によっては全く不可能だった事柄を実現しています。例えば、オリンピックの体操演技の表現や、パドルボード上でのバックフリップ、さらには浮力や剛性の動的変化を精密にシミュレートすることが可能です。以下は、Sora 2によって生成されたビデオの例です。さらに多くの例が、公式Webサイトで公開されています。

▼出典:Sora 2 が公開 | OpenAI
https://openai.com/ja-JP/index/Sora 2/

Sora 2で生成された「体操演技」
出典:OpenAI
Sora 2で生成された「ビーチバレー」
出典:OpenAI

従来の動画モデルは過度に楽観的で、テキストの指示を満たすために物体を歪めたり、現実を改変してしまうことがありました。例えば、バスケットボール選手がシュートを外しても、ボールが自発的にリングへ瞬間移動してしまっていました。

しかし、Sora 2では、選手がシュートを外した場合、ボールはバックボードに当たって跳ね返ります。これは非常に重要な能力であり、成功だけでなく失敗もシミュレートできなければなりません。

さらに、Sora 2では制御性の面でも大きく飛躍しています。複雑なマルチアングルのショットの指示に従いつつ、環境の状態を正確に保てるため、映像がよりリアルになりました。

オーディオも完璧に生成するSora 2

Sora 2はもう「無口」ではありません。これは、Sora 2における最も破壊的なアップグレードと言えます。汎用の映像・音声生成システムとして、複雑な環境音や音声、効果音を、高度なリアリティーで生成することが可能です。

Sora 2は会話や効果音、BGMを同期生成し、映像と音を完全に一致させます。例えば、「花火のアニメシーン」を指示すると、Sora 2は、人物の声や背景の人声、さらには花火の音まで生成し、映像と正確に重ねることができます。

Sora 2で生成した「花火シーン」のアニメーション
出典:OpenAI

新しいコミュニケーションの可能性を広げるSoraアプリ

新しいSora 2映像モデルを採用したSoraアプリを使えば、プロでなくても超現実的なシーンや、ファンタジー的な内容を含む複雑なビデオをより簡単に制作できます。OpenAIによれば、数ヶ月前にSoraチームが初めて「自分をアップロード」機能を試したところ、皆とても楽しんだとのことです。これは、テキストメッセージから絵文字、ボイスメッセージへ、そして現在の形へと、自然に進化したコミュニケーションの延長のように感じられたようです。

そこで同社は、Sora 2を搭載した全く新しいiOSのソーシャルアプリ「Sora」を発表しました。このアプリでは、作品の創作だけでなく、他者の作品を元にした二次創作ができます。さらに「カメオ(cameos)」機能で、自分や友人が出演することも可能です。「カメオ」では、アプリ内で短い動画と音声を録画して本人確認と外見をキャプチャーすると、極めて高いリアリティーで、あらゆるSoraのシーンに直接溶け込めるようになります。

俳優ロビン・ウィリアムズを消費するディープフェイク

その一方で、高度なAIビデオの登場により、低品質な「AIゴミ」が氾濫する懸念が高まっています。現実と見分けがつかない、ディープフェイクを含むコンテンツがその一例です。OpenAIは、Sora 2による潜在的に有害なコンテンツの生成を抑制し、AIコンテンツを見分けやすくするための対策の一部を詳述しています。

▼Sora 2安全性ドキュメント
https://openai.com/index/launching-sora-responsibly

Sora 2の登場以前から、AIによるディープフェイクは至るところに拡散し、肖像権の問題が改めて焦点となっています。注目や話題づくりのために、故人の映像までも生成する人々がいるからです。

ロビン・ウィリアムズ(1951-2014)はアメリカを代表する俳優でありコメディアンで、即興芸と多様な映像作品での数々の名演で知られ、史上屈指の喜劇俳優の一人です。代表作には、『いまを生きる』(1989年 原題: Dead Poets Society)や、『グッド・ウィル・ハンティング/旅立ち』(1997年 原題: Good Will Hunting)などがあり、アメリカでは誰もが知る存在です。2014年8月11日、彼はカリフォルニアの自宅で自ら命を絶ち、晩年には深刻なうつ病と闘い続けていました。

それから11年、ロビンが再び世間の注目を集めたのは、映画界での功績ではなく、AI生成の動画をめぐる議論によってでした。故人である彼の姿を使い、TikTok風のビデオを生成したり、それを見て笑って済ませる人がいました。その一方で、遺族にとっては、AIによる「再現」が記憶を刺激すると同時に、深い不快感と衝撃をもたらしました。それどころか、わざとそれらのビデオを遺族に送りつける者まで登場しました。

これに対し、ロビンの娘であり俳優でもあるゼルダ・ウィリアムズは、強い不満を公に表明しました。

『私が見たいとか、理解できるはずだとか思わないで。私は望まないし、理解もしない。もし私をからかいたいだけなら、もっと悪質な手口は見てきたわ。私はブロックして、自分の人生を進むだけ』

『実在の人間の伝説的な人生が、「なんとなく見た目も声も本人っぽいからそれで良い」という程度に矮小化され、他人が操り人形のように彼らを弄んで、ひどいコンテンツを量産する—こんなの正気の沙汰じゃない』

『あなたたちは芸術を創っているのではなく、人の人生、芸術、音楽の歴史を、気味が悪く過度に加工した「ホットドッグ」に変え、それを他人に無理やり押しつけ、「いいね」をもらって好きになってほしいと願っているだけ』

技術革新と法規制の間で

OpenAIのSoraチームは、より高度な世界シミュレーション能力を備えたモデルの訓練に専念してきました。その結果、Sora 2のようなAIモデルが、物理世界を深く理解することができるようになりました。

また、AIモデルを利用するユーザーにとっても、大きな技術的進歩です。AIの利用はもはやチャットに留まらず、ユーザーの意図を先取りしながら、一本の映像を丸ごと生成することすら可能となりました。

しかし筆者は、現在の人工知能の急速な進歩に感嘆する一方で、ディープフェイクという現象に対しても懸念を抱いています。急速に発展するAIの時代において、著作権法は確かにアップデートされるべきです。人工知能の発展を理由に、誰かの権利が軽視されることがあってはなりません。


本来、テクノロジーの進化は、人間の幸福に寄与すべきはずですが、現実は必ずしもそうなっていません。民主主義や倫理、社会正義などが犠牲になっている例もある一方で、新しいチャレンジも不可欠です。

非常に難しい永遠のテーマともいえますが、皆さんはどう考えていますか?ぜひ、コメントやソーシャルメディアの投稿で、ご意見・ご感想をお聞かせください。

Index: 328

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

ABOUT ME
盛 堃
盛 堃
研究員(専門分野:脳グラフネットワーク・深層学習)
2023年株式会社BlueMemeに入社、アプリ開発及びAPI開発プロジェクトに参画、2024年からグラフネットワークについて研究活動を開始する
盛 堃の記事一覧

記事URLをコピーしました