一発勝負の「ガチャ動画」はもう古い。AIと対話しながら映像を編集する時代がやってきた。
先日発表されたGoogleの「Omni」。単なる映像生成にとどまらず、物理法則を伴った「世界のシミュレーション」が可能になったという。その実力を測るべく、非エンジニアのビジネスパーソン視点で検証を行った。
1. 検証1:テキストからのベース動画生成
■ 入力プロンプト:
「木目のデスクの上に置かれた、白い陶器のマグカップ。中にはブラックコーヒーが入っており、湯気がゆっくりと立ち上っている。窓からの自然光がカップの側面に柔らかく当たっている。高画質、シネマティック、リアルな質感」
■ 結果:
指示通り、木目のデスクや陶器の質感、窓から差し込む自然光が反映された映像が出力された。コーヒーから立ち上る湯気の揺らぎや、水面に映る窓枠のシルエットも再現されている。さらに、背後では鳥のさえずりや時計の秒針のような環境音も生成された。だが、湯気がAIっぽくリアルさがなかった。
2. 検証2:対話による物理シミュレーションの追加
■ 追加指示:
「このコーヒーの真上から、角砂糖を一つ落としてください。コーヒーの波紋と液体の跳ね返りをリアルに表現して」
■ 結果:
角砂糖が落ち、コーヒーが跳ね返る飛沫と波紋が映像として生成された。
3. 検証を終えての感想
テキストから一発でシネマティックな空間を作り出す画動力と、重力や液体の跳ね返りを計算する物理シミュレーションは高いです。
Omniは、これまでの「出力結果を祈って待つ」ツールから、共に試行錯誤しながら映像を作り上げる「対話型の編集エディター」へと確実に進化しています。ビジネスにおける直感的なアイデアの視覚化にも、大いに役立つツールだと実感しました。

