Google Gemini Omniで動画生成してみた 1

一発勝負の「ガチャ動画」はもう古い。AIと対話しながら映像を編集する時代がやってきた。

先日発表されたGoogleの「Omni」。単なる映像生成にとどまらず、物理法則を伴った「世界のシミュレーション」が可能になったという。その実力を測るべく、非エンジニアのビジネスパーソン視点で検証をいました。

■ 入力プロンプト：
「木目のデスクの上に置かれた、白い陶器のマグカップ。中にはブラックコーヒーが入っており、湯気がゆっくりと立ち上っている。窓からの自然光がカップの側面に柔らかく当たっている。高画質、シネマティック、リアルな質感」

■ 結果：
指示通り、木目のデスクや陶器の質感、窓から差し込む自然光が反映された映像が出力された。コーヒーから立ち上る湯気の揺らぎや、水面に映る窓枠のシルエットも再現されている。さらに、背後では鳥のさえずりや時計の秒針のような環境音も生成された。だが、湯気がAIっぽくリアルさがなかった。

■ 追加指示：
「このコーヒーの真上から、角砂糖を一つ落としてください。コーヒーの波紋と液体の跳ね返りをリアルに表現して」

■ 結果：
角砂糖が落ち、コーヒーが跳ね返る飛沫と波紋が映像として生成された。

テキストから一発でシネマティックな空間を作り出す画動力と、重力や液体の跳ね返りを計算する物理シミュレーションは高いです。

Omniは、これまでの「出力結果を祈って待つ」ツールから、共に試行錯誤しながら映像を作り上げる「対話型の編集エディター」へと確実に進化しています。ビジネスにおける直感的なアイデアの視覚化にも、大いに役立つツールだと実感しました。