AIの進歩が早すぎる。
しかし、実際は、なかなか思ったような動画がプロンプトで生成できないというのが悩ましいところだ。
しかも、通常のサブスクリプションでは数回しか試せない。これでは、コツというものが掴めない。2秒などのプレビューについては、もっと自由に試せるようにしてもらいたいものだ。これは、動画に限らず、絵についてもそうだ。低解像度でいいから何を生成しようとしているのかが知りたいのはみんな同じだろう。
Yahoo!より、
グーグル、動画生成AI最新版「Veo 3.1」 動画編集「Flow」を強化
10/16(木) 12:23配信Impress Watch

記事より、
Googleは15日(米国時間)、AI映像制作ツール「Flow」を強化し、動画生成AI「Veo」の最新バージョン「Veo 3.1」も提供開始した。Veo 3.1はGeminiアプリやGemini API、Vertex AIで利用可能になる。 VeoはGoogleによる動画生成AIモデルで、5月にVeo 3を提供開始し、音声付きの動画を生成可能としていた。Ver 3.1では、クリップを編集するため新たなクリエイティブ機能を導入し、シーンをより細かく制御できるようにしたほか、オーディオ対応を強化した。また、画像から動画を生成する際のプロンプトをより正確に反映し、品質の向上も実現している。
Google Veo 3.1 徹底解説:プロンプトの壁を破る「コントロール性」強化の衝撃とAI動画生成TIPS
#Veo3_1 #GoogleAI #動画生成AI #プロンプトの極意 #Flow #Gemini
導入:AI動画生成の「早すぎる進化」と「もどかしい現実」
AI技術の進化は目覚ましいものがありますが、テキストからイメージ通りの動画を生成するのは、いまだに多くのクリエイターの悩みです。「プロンプト(呪文)を工夫しても、なぜかイメージと違う」「数回しか試せないサブスクでは、コツが掴めない」という声は少なくありません。特に短いプレビューや低解像度でも、**「何が生成されるか」**を知りたいというニーズは、全てのAIユーザーに共通する課題です。
こうしたユーザーの悩みに応えるべく、GoogleはAI映像制作ツール「Flow」を大幅に強化し、動画生成AIモデルの最新版**「Veo 3.1」**を発表しました。
1. Veo 3.1 が「コントロール性」を強化した3つの新機能
Veo 3.1の最大の特徴は、従来の「テキストを渡したらAI任せ」というスタイルから脱却し、ユーザーが動画のストーリーやキャラクターをより細かく制御できるように設計された点です。
Veo 3.1の導入と同時に、Flowに以下の革新的な機能が追加されました。
① フレーム・トゥ・ビデオ(Frames to Video):物語の始まりと終わりを指定
- これは、開始画像と終了画像をユーザーが指定し、その間をVeoがシームレス(継ぎ目なく滑らかに)な動画として自動生成する機能です。
- 「壮大なトランジション(場面転換)に最適」とされており、動画の**「流れ」**に対するコントロール性が劇的に向上しました。
② イングリディエンツ・トゥ・ビデオ(Ingredients to Video):キャラクターやスタイルの固定
- 複数の参照画像(最大3枚)を読み込ませることで、生成される動画のキャラクターのスタイルや構図を一貫させることができます。
- これにより、シリーズものや短編ストーリーで**「同一キャラクターの一貫性」**を保つという、従来のAI動画生成で最も難しかった課題が解決されます。
③ エクステンド(Extend):長尺動画のシームレスな拡張
- 生成した動画の続きを自動で作成し、元のクリップのアクションを継続する形で、1分以上の長尺動画を作成できるようになりました。
2. Veo 3.1 が実現する高度な編集と利用プラットフォーム
新機能以外にも、Veo 3.1は以下の点で進化しています。
- Flow内での直接編集機能の追加: シーンに追加要素をインサート(挿入)する機能や、不要なオブジェクトやキャラクターを除去する機能が導入され、Flow内で直接編集できるため、シーンの完成度を高められます。
- プロンプト追従性と品質の向上: 画像から動画を生成する際のプロンプト反映度が向上し、オーディオ対応も強化されています。
- 提供プラットフォーム: Veo 3.1は、一般向けのGeminiアプリ、開発者向けのGemini API、そして法人向けのVertex AIといったGoogleのエコシステム全体で利用可能となります。Geminiアプリでは短尺(8秒)での利用が可能です。
3. 【Tips】プロンプトの壁を破るための実践的解決策
ユーザーの悩む「試行回数の少なさ」や「低解像度プレビューの必要性」は、AI生成のコスト構造上、避けて通れない部分です。しかし、Veo 3.1の新機能を活用し、効率的に高品質な動画を得るための対策があります。
Tip 1: 静止画(Frames)を最大限に活用する
- 低コストでの試行: まずは通常の画像生成AI(静止画)や、Veo 3.1の「Frames to Video」機能 のために、低コストな静止画で構図やスタイルを徹底的に試します。
- プロンプトの精度向上: 試行錯誤で最もイメージに近い静止画(キャラクター、背景、スタイル)を作成し、それをVeo 3.1の参照画像として使用します。これにより、少ない試行回数でもプロンプトの曖昧さを排除できます。
Tip 2: 5W1Hと感情をプロンプトに加える
- プロンプトの基本である5W1H(いつ、どこで、誰が、何を、なぜ、どのように) を意識し、情景が目に浮かぶように具体的に記述します。
- さらに、「エモーショナルな要素」(例:感動的な、恐ろしい、ユーモラスな)を加えることで、AIが動画のトーンを正確に把握しやすくなります。
Tip 3: 「生成→プレビュー→修正」のサイクルを回す
- 生成された動画(または画像)でイメージと違う部分があれば、その原因を分析し、プロンプトを少しずつ修正します。**「失敗を恐れずに修正を加える」**ことが、最終的な品質向上の最も効果的な方法です。


コメント