動画生成AI
概要
動画生成AIは、テキストや画像から 動画・インタラクティブな世界を生成 する 生成AI の一分野です。拡散モデル を時間方向へ拡張する手法が中心で、近年は単なる映像生成にとどまらず、操作可能なゲーム世界を生成する ニューラルゲームエンジン へと広がっています。
主なアプローチ
- 拡散ベースの動画生成 — フレーム列を時間的に一貫させて生成(拡散モデル)
- ニューラルゲームエンジン/拡散ゲームエンジン — プレイ可能・編集可能な世界をモデルが生成
- アクションバインディング — 複数主体の動作を指定通りに生成する制御
課題
- 時間的一貫性 — フレーム間で物体・人物がぶれない
- 制御性 — 意図した動き・構図を指定できるか
- 計算コスト — 動画は画像より遥かに重い
- 倫理(ディープフェイク等)— AIの倫理
研究テーマ(Daily フィード)
- “MultiGen: Level-Design for Editable Multiplayer Worlds in Diffusion Game Engines”
- “Multiverse: Language-Conditioned Multi-Game Level Blending via Shared Representation”
- “ActionParty: Multi-Subject Action Binding in Generative Video Games”