Gemini Omni入門2026|料金・使い方・Veoとの違い
目次
2026年5月のGoogle I/O、最も歓声が上がった瞬間はGemini Omniのデモだった。テキストを打ち込むと10秒の動画が生成され、「背景を夕焼けに変えて」と追加指示するだけで即座にリテイクされる。従来の動画生成AIにあった「一発勝負でガチャを引く」ストレスが消えた。
ただし料金体系はやや複雑で、無料経路と有料プランが混在している。Veo 3.1との棲み分けも公式説明だけでは掴みにくい。この記事ではGemini Omniの機能・料金・使い方を整理し、Veo 3.1やSora 2との実力差まで踏み込む。
Gemini Omniとは — Google I/O 2026の目玉モデル
Gemini OmniはGoogle DeepMindが開発した「any-to-any」マルチモーダル動画生成モデルだ。2026年5月19日のGoogle I/O 2026で発表され、同日にGemini Omni Flash(軽量版)が全世界で利用可能になった。
既存のVeo 3.1が「テキスト→動画」の一方向生成に特化していたのに対し、Gemini Omniはテキスト・画像・音声・動画・スケッチの任意の組み合わせを入力に取り、自然言語で会話しながら動画を編集できる。Googleはこれを「世界モデル」と呼んでいる。
Gemini Omniの位置づけ
Veo = 映像専門の職人。Gemini Omni = テキスト・画像・音声・動画すべてを扱える総合プロデューサー。最終的なVeo統合ロードマップが示されており、将来的にはGemini Omni一本に収束する可能性が高い。
現時点ではGemini Omni FlashとGemini Omni Proの2バリアントが存在する。Flashは速度重視・10秒制限、Proはより高画質・長尺対応で近日公開予定。Gemini 3.5 Flashと同時に発表されたが、モデルとしては別系統になる。
従来の動画生成AIとの根本的な違い
Sora、Runway、Veoといった既存モデルは「プロンプト→出力→気に入らなければ最初からやり直し」というワークフローだった。Gemini Omniは生成した動画に対して「この人物の服を青に」「カメラアングルを低くして」と追加指示を重ねられる。
編集を重ねてもキャラクターや背景の一貫性が維持される点が技術的に新しい。複数回のリテイクを前提に設計された最初の動画生成AIと言える。
Gemini Omniの主要機能5つ
Flash版で今すぐ触れる機能から見ていく。
1. テキスト→動画生成(Text-to-Video)
テキストプロンプトから最大10秒・1080p解像度の動画を吐き出す。環境音やBGMもネイティブ生成で、別途音声合成ツールを挟む必要がない。
生成速度は10秒クリップで15〜30秒。Veoの半分以下だ。日本語プロンプトの精度については後述する。
2. 会話型編集(Multi-turn Editing)
Gemini Omni最大の差別化ポイント。生成済みの動画に対して「背景を変えて」「人物を追加して」「テンポを速くして」と自然言語で修正指示を出せる。タイムラインやレイヤーといった映像編集の知識は不要。
3〜4回の編集まではキャラクターの顔や服装の一貫性が保たれる。5回を超えると背景の色味がずれたり、人物の指の本数が変わったりする。3ターンが安定圏。
3. マルチモーダル入力
テキストだけでなく、参照画像、手描きスケッチ、既存動画、音声クリップを入力として受け付ける。筆者が試した限りでは、参照画像を1枚添付するだけで構図の再現度が別物になった。テキストだけだと「だいたい合ってるけど構図が違う」を5回繰り返すことになる。画像入力は積極的に使うべき。
4. SynthID自動透かし
全ての生成動画にGoogleのSynthID電子透かしが自動的に埋め込まれる。肉眼では見えないが、検出ツールで「AI生成コンテンツ」であることを判定できる。
EU AI規制法への準拠を意識した設計で、商用利用時のコンプライアンスリスクを軽減する。ただし透かしを外すツールが出回る可能性はあり、法的な免罪符にはならない点に注意。
5. AIアバター作成
自分の顔写真と音声サンプルからカスタムAIアバターを生成できる。ビジネス用途ではプレゼン動画やトレーニング教材での利用が想定されている。ただし2026年6月時点ではまだ限定公開で、全ユーザーに開放されていない。
Flash版(現在利用可能)
- ・最大10秒 / 1080p
- ・会話型編集(3〜4ターン推奨)
- ・テキスト+画像+スケッチ入力
- ・SynthID自動付与
- ・API未提供
Pro版(近日公開予定)
- ・長尺対応(秒数未発表)
- ・高解像度出力
- ・AIアバター完全対応
- ・API提供予定
- ・AI Ultraプラン優先
Gemini Omniの料金プラン比較
Gemini Omniを使うルートは大きく2つある。無料経路と有料サブスクリプション。有料プランはGoogle I/O 2026で体系が刷新され、旧「Google One AI Premium」から「Google AIプラン」に改称された。
| プラン | 月額 | Omni利用 | Flow Credits | 使用上限 |
|---|---|---|---|---|
| 無料(YouTube経由) | 0円 | YouTube Shorts / Create限定 | — | 非公開(制限あり) |
| AI Plus | 1,200円 | Geminiアプリ+Google Flow | 200 | 無料の2倍 |
| AI Pro | 2,900円 | Geminiアプリ+Google Flow | 1,000 | 無料の5倍 |
| AI Ultra | 14,500円〜 | 全機能+優先アクセス | 10,000〜25,000 | 無料の15〜20倍 |
無料で使える経路 — YouTube Shorts Remix
18歳以上のGoogleアカウントがあれば、YouTube ShortsのRemix機能とYouTube Createアプリ経由でGemini Omniを無料利用できる。ショート動画の素材生成に限定されるが、機能自体はFlash版と同等。
ただしGeminiアプリやGoogle Flowからは使えないため、本格的な動画制作には向かない。「まずどんなものか試したい」という段階なら十分だ。
AI Plus(月額1,200円)— 個人利用の最低ライン
GeminiアプリとGoogle FlowからOmniを呼び出せるようになる。Flow Creditsが200付与され、動画1本で約3クレジット消費する計算だと月60〜70本は回せる。個人利用ならまずここからで十分だ。Gemini全体の使い方はこちらで解説している。
AI Pro(月額2,900円)— コスパ最良の選択肢
Flow Creditsが1,000に増え、Gemini 3.1 ProやDeep Searchへの優先アクセスも付く。動画生成を業務で使うなら事実上ここがスタートラインになる。
PlusとProの差額は月1,700円、Creditsは5倍。クレジット単価で計算するとProが3倍以上安い。
AI Ultra(月額14,500円〜)— ヘビーユーザー向け
Google I/O 2026で新設されたプラン。旧AI Premiumの上位に位置し、月額14,500円($99.99相当)と32,000円($199.99相当)の2段階がある。Flow Creditsは10,000〜25,000。
開発者やクリエイティブチームで毎日大量の動画を生成するケースを想定している。Omni Pro版が公開された際に優先アクセス権が付与される見込み。個人で月100本以下の動画生成なら、ここまでは不要だ。
自分ならどのプランを選ぶか
副業で動画コンテンツを作る想定なら、AI Pro一択。月2,900円でFlow Credits 1,000は、動画1本あたり約3クレジット消費として月300本以上回せる計算になる。Plusは「お試し」、Ultraは「チーム利用」と割り切ってよい。
Gemini Omniの使い方 — 5ステップで始める
APIはまだない。GeminiアプリかGoogle Flowのどちらかで手を動かすしかない。
gemini.google.comにアクセスしGoogleアカウントでログイン
AI Plus以上のプランに加入(未加入なら設定画面から)
チャット画面でモデル選択から「Gemini Omni」を選ぶ
Step 4: プロンプトを入力する
テキストボックスに動画の内容を記述する。英語のほうが精度が高いが、日本語でも「東京の夜景を映すドローンショット、ネオンの反射が濡れた路面に映る」程度の指示なら問題なく通る。
参照画像があればクリップアイコンから添付。構図やカラートーンの再現度が大きく向上する。スケッチ入力はGoogle Flow側のインターフェースから利用可能。
// プロンプト例(英語推奨)
A drone shot of Tokyo at night, neon signs reflecting on wet streets,
slow camera movement, cinematic lighting, 16:9 aspect ratio
// 日本語でもOK
「雨上がりの渋谷スクランブル交差点、人々が横断歩道を渡る、
タイムラプス風、夕暮れの空が紫からオレンジに変わる」
Step 5: 会話型編集で仕上げる
生成された動画を確認し、修正したい部分を自然言語で指示する。「人物の服を黒に変更」「BGMをもっとアップテンポに」「最後の2秒をスローモーションに」など、映像編集ソフトの操作を覚える必要がない。
前述のとおり3ターンが安定圏。4ターン目から背景にノイズが混じった。大きな方向転換は最初のプロンプトで済ませ、会話型編集は色味や構図の微調整に絞るのが鉄則だ。
Gemini Omni vs Veo 3.1 — Google内の棲み分け
Google自身が2つの動画生成モデルを並行提供している。混乱しやすいが、用途で明確に棲み分けがある。
| 比較項目 | Gemini Omni Flash | Veo 3.1 |
|---|---|---|
| 設計思想 | 汎用マルチモーダル(ジェネラリスト) | 映像特化(スペシャリスト) |
| 最大解像度 | 1080p | 1080p → 4Kアップスケール |
| 最大尺 | 10秒 | 8秒(延長機能あり) |
| 会話型編集 | 対応 | 非対応 |
| 入力形式 | テキスト/画像/スケッチ/音声/動画 | テキスト/画像 |
| 映像品質 | 良好 | 最高(シネマティック) |
| 生成速度 | 15〜30秒 | 60秒超 |
| API | 未提供(近日公開予定) | Vertex AI GA |
| ネイティブ音声 | あり | あり |
Omniを選ぶべきケース
SNS用ショート動画の量産、プロトタイプの素早い作成、非エンジニアがUIだけで動画を生成・編集したい場合。スピードと柔軟性を重視するならOmni一択。プロンプトエンジニアリングの基礎はこちらの記事で解説している。
Veo 3.1を選ぶべきケース
4K品質が必要な広告映像、長尺動画(延長機能を使って30秒以上)、APIからプログラマティックに動画を生成したい開発者。映像のクオリティだけ見ればVeo 3.1が上回る。
実際にOmniで3本プロトタイプを作り、気に入ったカットをVeoで高画質化しようとしたところ、毎回手動でモデルを切り替える必要があった。同じGoogle内のモデルなのに横断UIがない。ここは早急に改善してほしいポイントだ。
Sora 2・Runway Gen-4との比較
Google以外の動画生成AIとの立ち位置も整理しておく。2026年6月時点のスペック比較。
| モデル | 会話型編集 | 最大尺 | 料金目安 | API |
|---|---|---|---|---|
| Gemini Omni Flash | ○ | 10秒 | 月1,200円〜 | 未提供 |
| Sora 2 | × | 20秒 | ChatGPT Plus(月$20) | 提供中 |
| Runway Gen-4 | △(一部対応) | 16秒 | 月$12〜 | 提供中 |
| Veo 3.1 | × | 8秒+延長 | 月1,200円〜 | Vertex AI GA |
Gemini Omniの強みは会話型編集と低コスト。弱みはAPI未提供と尺の短さ。Soraは尺の長さとAPI対応で先行しているが、会話型編集には非対応。Runwayは中間的な立ち位置で、モーションブラシなどの独自編集機能が売り。
自分が動画生成を業務に使うなら、今の第一候補はGemini Omniだ。ただしAPIがない間は、自動化の文脈ではVeo 3.1を並走させる。1ツールに絞り込む段階ではない。主要AIサービスの比較も合わせてチェックしておくと判断しやすい。
実務で使える活用シーン4選
Flash版だけで回せる活用例に絞る。試作と量産が現実のラインだ。
SNSショート動画の量産
TikTok、YouTube Shorts、Instagramリール向けの10秒動画を1本あたり数分で生成。会話型編集でブランドカラーやトーンを統一しやすい。
効果: 外注費の月5〜10万円削減
プレゼン資料の動画化
スライドの静止画をOmniに渡して「このスライドをアニメーション動画にして」で変換。社内プレゼンの説得力が格段に上がる。
効果: 資料作成時間 40%削減
ECサイトの商品動画
商品写真を入力に、使用シーンの動画を自動生成。撮影スタジオもモデルも不要。3Dルック風の回転動画も指示一つで作れる。
効果: 撮影コスト 1/10以下
社内トレーニング教材
操作手順をテキストで記述し、動画化。将来のAIアバター対応で、講師不在でも研修動画を量産できるようになる。
効果: 教材制作期間 1/3に短縮
AI副業の全体像を把握しておくと、動画生成スキルをどう収益化するかのイメージが湧きやすい。AI動画編集での稼ぎ方も合わせて読んでおくと良い。
使う前に知っておきたい制限と注意点
制約は4つある。使う前に把握しておくと、後で腹が立たずに済む。
10秒の尺制限
Flash版の最大出力は10秒。SNSショート動画やGIF的な用途には十分だが、30秒以上の動画を作りたい場合はVeo 3.1の延長機能を使うか、複数クリップを外部ツールで結合する必要がある。Pro版で尺が伸びる予定だが、具体的な秒数は未発表。
日本語プロンプトの精度
基本的な日本語指示は通るが、抽象的な表現や文学的な描写は英語より精度が落ちる。「桜が散る中を歩く女性」程度ならOK。「侘び寂びの空気感を持つ庭園」のようなニュアンスは伝わりにくい。
対策として、メインの指示は英語で書き、補足説明を日本語で加えるハイブリッド方式が実用的だ。
// ハイブリッドプロンプトの例
A woman walking through falling cherry blossoms in a traditional Japanese garden,
soft golden hour lighting, slow motion
// 補足: 着物を着た30代女性、京都の哲学の道風の小道
API未提供
2026年6月時点でGemini Omniの公開APIは存在しない。Googleは「coming weeks」と発表しているが、具体的な日程は未定。自動化パイプラインやSaaSプロダクトに組み込みたい開発者はVeo 3.1のVertex AI APIを使うしかない。API連携が必要なケースではGemini 3.1 ProのAPI活用ガイドが参考になる。
音声編集の未対応
BGMや環境音は自動で乗る。が、「BGMのテンポを変えて」「ナレーションを日本語に差し替えて」と頼んでも反応しない。映像の編集がここまで自然言語で回るのに、音声だけ触れないのは正直イライラする。「会話型編集」を名乗るなら音声も扱ってくれ、と言いたい。
商用利用時の注意
SynthID透かしはAI生成の証明であり、著作権のクリアランスとは別問題。生成動画に実在の人物やブランドが含まれる場合、肖像権・商標権の問題は利用者の責任で確認する必要がある。Googleの利用規約では「生成物の法的責任はユーザーに帰属」と明記されている。
よくある質問
Q. Gemini Omniは無料で使える?
YouTube ShortsのRemix機能とYouTube Createアプリ経由なら無料。GeminiアプリやGoogle Flowで使うにはGoogle AI Plus(月額1,200円)以上が必要。
Q. Gemini OmniとVeoはどう使い分ける?
速度と編集の柔軟性ならOmni、最高画質(4Kアップスケール)と長尺ならVeo 3.1。将来的にはOmniに統合される可能性が高い。
Q. Gemini Omni FlashとProの違いは?
Flashは速度重視・10秒制限・現在利用可能。Proは高画質・長尺対応・近日公開予定。Proの具体的な解像度と尺はまだ発表されていない。
Q. 日本語のプロンプトで動画生成できる?
基本的な日本語は通る。「渋谷の夜景」「桜の並木道を歩く人」程度なら問題ない。抽象的な指示は英語のほうが精度が高い。英語メイン+日本語補足のハイブリッド方式を推奨。
Q. 生成した動画を商用利用できる?
Google AI Plus以上のプランで生成した動画は商用利用可能。ただし実在の人物・ブランドの肖像権や商標権は利用者責任。SynthID透かしは自動付与され、除去は利用規約違反。
Q. APIはいつ使えるようになる?
Googleは「coming weeks」と発言しているが、2026年6月時点で具体的な日程は未定。開発者でAPIが必要なら、現時点ではVeo 3.1のVertex AI APIを使うのが現実的な選択肢。
まとめ — 自分ならGoogle AI Proから始める
Gemini Omniは「動画生成AIの操作体験」を根本的に変えたモデルだ。一発生成のガチャではなく、会話しながら動画を磨いていくワークフローは、Premiere ProやDaVinci Resolveを学ぶコストを一気に下げる。
自分がいま契約するなら、月額2,900円のGoogle AI Proプランを選ぶ。理由は3つ。
- Flow Credits 1,000で月300本以上の動画を生成可能(1本約3クレジット)
- Gemini 3.5 FlashやDeep Searchも使え、動画生成以外の用途でも元が取れる
- AI Plusとの差額は月1,700円だがCreditsは5倍。単価計算でProの圧勝
一方、API未提供の現状では開発者にとっての魅力は限定的。自動化パイプラインを組みたいならVeo 3.1のVertex AI APIが唯一の選択肢になる。Omni APIが公開されたタイミングで改めて比較する価値がある。
動画生成AI市場は3ヶ月で勢力図が変わる。Gemini Omni Proの正式公開、Sora 2のアップデート、Runway Gen-5のリリースが年内に控えている。今の最適解が半年後も最適とは限らないが、「会話型編集」という方向性自体は不可逆的なトレンドだ。動画生成を仕事に使いたいなら、まずOmniで手を動かしておいて損はない。主要AI3社の比較も合わせてチェックしておくと、Google AIエコシステム全体の立ち位置が見えてくる。