Google Gemini Omniで動画生成してみた 2

一発勝負の「ガチャ動画」はもう古い。AIと対話しながら映像を編集する時代がやってきた。

前回はGemini Omniの基本性能を検証したが、今回はさらに難易度を上げ、「ガラスの透過」「炭酸の泡」「光の屈折」という、AIが最も苦手とする「質感と物理の境界線」を試した。

1. 検証1:ベース動画生成(質感と光のシミュレーション)

■ 入力プロンプト:
「結露した透明な高級ガラスグラスに、並々と注がれた透明な炭酸水。グラスの中には、輪切りのみずみずしいフレッシュレモンと、数粒の真っ赤なラズベリーが沈んでいる。炭酸の細かい泡が、フルーツの表面やグラスの側面にびっしりと付着し、次々と水面へ向かって勢いよく立ち上っている。背景は明るいリゾート地の昼下がりのプールサイドで、美しくボケている。太陽の強い光がグラスを透過し、テーブルの上にキラキラとした光の屈折(コースティクス)を生み出している。高画質、8k、シネマティック、ウルトラリアルな質感。」

■ 結果:
グラス表面の結露、炭酸の細かな気泡が果実に付着しては弾ける様子など、複雑な流体シミュレーションが見事に成立している。太陽光がグラスを透過してテーブルに描き出す光の模様(コースティクス)の美しさは圧巻。さらに、環境音まで生成されており、空間そのものがシミュレートされている感覚を覚える。

2. 検証2:AIが描く「物理法則」

■ 追加指示:
「グラスの真上から、大きめの四角い氷を一つ落としてください。氷が水面に落ちた瞬間の水しぶきと、グラスの中のフルーツや泡が波立って揺れる様子をリアルに表現して。」

■ 結果:
グラスの形状が変わり、プラスチック感のある氷が落ちてきた。沈み込んでからの浮き上がりが氷より浮力のある物体に見え、音はもっと大きい物体が水に落ちたような音だった。

3. 検証を終えての感想

Gemini Omniの「空間を丸ごと生成する画動力」と「物理シミュレーション能力」は高いと感じたが、氷のディテールはまだまだのようです。

今後、このAIが物理法則をどこまで精密に学習していくのか、その進化を見守るのがますます楽しみです。