AI活用ツール・副業

Seedance入門|動画生成AIの使い方・料金・比較2026

読了時間: 約14分

Sora 2のWebアプリが2026年4月に終了した。代わりにどの動画生成AIを選ぶか。ByteDance製のSeedanceは、API秒単価3円でKlingの4分の1。無料プランつき。15秒のネイティブ動画にステレオ音声とリップシンクが同時に載る。価格破壊としか言いようがない。

6月23日にはSeedance 2.5も発表され、動画長が30秒に倍増する予定だ。Kling 3.0やVeo 3.1との使い方の違いは何か。料金・機能・弱点まで、Dreamina経由で20本ほど生成した結果をもとにまとめた。

Seedanceの全体像 — ByteDance製の動画生成AI

TikTokの親会社ByteDanceが作った動画生成AIモデル。グローバル版は2026年4月に公開済みで、CapCutの姉妹サービス「Dreamina」からブラウザだけで即座に使える。

テキストプロンプトに加えて、画像9枚+動画3本+音声3クリップを同時に「見本」として渡せる。建築家がスケッチを複数枚渡して「こんな感じで」と指示するのと同じ発想だ。他のツールがプロンプトの言語力に頼るのに対し、Seedanceは視覚的な指示が軸になる。

Seedanceの位置づけ

Artificial Analysis Video Arenaで世界ELO 2位(2026年6月時点)。Veo 3.1に次ぐ評価を受けている。Sora 2が2026年4月にWebアプリ終了、9月にAPI終了と発表した今、乗り換え先の筆頭候補として注目度が急上昇中。

ByteDanceは同時にSeedream(画像生成)やSeed 2.1 Pro(言語モデル)も展開しており、Seedanceはその「動画担当」にあたる。商用利用可否は利用規約に準ずるが、Dreaminaの有料プランで生成した動画は商用利用が認められている。

Seedance 2.0の主要機能

Seedance 2.0は単なるテキスト→動画変換ではない。複数の入力モダリティを組み合わせて、音声つきの動画をワンショットで出力する。主要な機能を4つに分けて整理する。

マルチモーダル入力 — 最大12素材を同時に参照

画像はキャラクターの外見を固定し、動画クリップはモーションの方向性を指示し、音声はリズムやムードに影響を与える。最大12ファイルを同時に受け取る。

参照画像を1枚入れるだけで、フレームごとの顔のブレがほぼ消える。テキストだけだと15秒の間に顔が3回変わった。参照画像ありだとほぼ同一人物。別物だ。

ネイティブ音声生成 — ステレオ音声を同時出力

動画と音声を別々に作って合成する必要がない。生成時にステレオ音声(効果音・環境音・ダイアログ)が同時に出力される。

環境音の再現度は高い。雨音、カフェのBGM、街の喧騒。どれも自然だった。会話音声は使えない。「それっぽいが不自然」で、ナレーション用途には回さないほうがいい。効果音やアンビエントに絞れば実用的だ。

8言語リップシンク — 日本語にも対応

8言語以上の音素レベルでリップシンクが同期する。日本語も対象。キャラクターの口の動きが発話に合わせて動く。

日本語の精度は英語より一段落ちる。母音は合うが、子音の微妙な口の形はまだ甘い。字幕をつける前提の短尺動画なら違和感なく通る水準ではある。英語プロンプトで生成した動画のほうがリップシンクの一致率は高かった。

動画の編集・延長 — 部分修正と続きの生成

生成済み動画の一部だけを修正する「サージカルエディティング」に対応する。衣装だけ変える、背景だけ差し替える、といった部分的な再生成が可能だ。全体を作り直す必要がないため、試行錯誤のコストが大幅に下がる。

動画の延長(ビデオエクステンション)も実装されている。15秒の動画の末尾を起点に、さらに15秒を追加生成する仕組み。ただし延長部分と元の部分の継ぎ目は完全にシームレスとは言えず、カット割りを変える工夫が要る。

使い方ガイド — 3ステップで動画を生成する

ブラウザから使えるDreamina(Web UI)か、開発者向けのAPI(fal.ai等)か。Seedanceの使い方はこの2択。まずDreaminaから。

Dreamina(Web UI)からの利用

CapCutの姉妹サービス「Dreamina」にアクセスすれば、アカウント登録だけでSeedance 2.0を使える。クレジットカード不要の無料枠がある。

STEP 1

アカウント作成

dreamina.capcut.com にアクセスし、Google/メールで登録。偽サイト(seedance2.ai等)に注意

STEP 2

モデル選択

動画生成画面でモデルピッカーから「Seedance 2.0」を選択。デフォルトは別モデルの場合あり

STEP 3

プロンプト入力+生成

テキストを入力し、必要なら参照画像をアップロード。「生成」をクリックで数分で完成

偽サイトに注意

seedance2.ai、seedance2.app、seedance.tv は公式ではない。公式はdreamina.capcut.comのみ。検索上位に非公式サイトが出ることがあるため、URLを必ず確認すること。

API経由の利用(fal.ai)

開発者やバッチ処理が必要な場合はAPIを使う。2026年4月9日にfal.aiでグローバルAPI公開が始まった。エンタープライズ向けにはBytePlus ModelArkも選択肢にある。

# fal.ai経由でSeedance 2.0のAPIを呼び出す例(Python)
import fal_client

result = fal_client.subscribe(
    "fal-ai/seedance-2.0",
    arguments={
        "prompt": "A cat walking through a sunlit garden, cinematic lighting",
        "duration": 5,
        "aspect_ratio": "16:9"
    }
)
print(result["video"]["url"])

レスポンスタイムは5秒動画で2〜4分。参照素材を増やすと遅くなる。WebUIで100本は現実的じゃない。バッチ処理ならAPI一択だ。

料金プラン — 無料から本格運用まで

Seedanceの料金体系は3層構造。無料プラン、Dreaminaの有料プラン、API課金。用途に応じて使い分ける。

無料プラン

Dreaminaのアカウントを作れば、1日数本の動画を無料で生成できる。クレジットカード不要。期間制限もない。月20〜30本で足りるなら無料のまま運用できる。生成速度は有料プランより遅く、解像度の上限もあるが、試作には十分だ。

有料プラン(Dreamina)

プラン 月額 クレジット 15秒動画の目安コスト
無料 $0 日次上限あり $0(制限あり)
Basic 約$15(約2,200円) 1,575 約$2.50(約370円)
Advanced 約$67(約9,900円) 大容量 約$1.91(約280円)

15秒の動画1本あたり280〜370円。外注なら1本数万〜数十万円。2桁違う。クオリティの差はあるが、SNS向けの短尺動画やプロトタイプ制作なら、この価格帯で十分戦える。映像制作のコスト構造が根本から変わりつつある。

API料金(fal.ai)

ティア 秒単価 5秒動画の料金 特徴
Fast $0.022(約3.3円) $0.11(約16円) コスト最優先。バッチ処理向き
Pro $0.247(約37円) $1.24(約183円) 高速・高品質。リアルタイム用途

Fastティアの$0.022/秒は破格。100本×10秒の動画を生成しても約$22(約3,300円)で済む。同じ条件でKling 3.0は約$95(約14,000円)、Veo 3.1は$90〜180(約13,000〜27,000円)かかる。

最安で使うなら

2026年6月時点で最安はサードパーティプラットフォームのYapper経由。ただし公式サポート外のため、品質保証は自己責任。安定性を取るならfal.aiのFastティア、手軽さならDreaminaの無料プランがバランスいい。

Kling・Veo・Soraと徹底比較

2026年6月時点で動画生成AI市場は「Seedance vs Kling vs Veo」の三つ巴だ。Sora 2はWebアプリが2026年4月に終了し、APIも9月に終了予定で事実上の撤退フェーズに入った。この3モデルの違いを軸ごとに整理する。

総合比較表

項目 Seedance 2.0 Kling 3.0 Veo 3.1
開発元 ByteDance Kuaishou Google DeepMind
最大動画長 15秒 15秒 非公開
最大解像度 4K(2026年6月追加) 4K(ネイティブ) 4K
ネイティブ音声 あり(ステレオ) なし あり(48kHz、最高品質)
リップシンク 8言語(日本語含む) 多言語対応 ダイアログ生成
API秒単価 $0.022〜0.247 約$0.095 $0.09〜0.18
無料プラン あり あり なし
参照素材入力 最大12(画像+動画+音声) 画像+動画 テキスト中心

画質と解像度

4Kネイティブレンダリングの鮮明さではKling 3.0が一歩リードする。3840×2160でのディテール表現、特に人物の肌質感や背景の奥行き感はKlingが最も自然だ。

Seedance 2.0は2026年6月のVolcano Engineカンファレンスで4K対応を追加した。後発のぶん、4K出力の安定性はKlingに及ばない部分がある。Veo 3.1は全体のバランスが良く、画質の破綻が少ない。

音声対応

音声同期でのトップはVeo 3.1。48kHzのダイアログ生成は、主要モデルで唯一「実用に耐える会話音声」を出力できる。Seedance 2.0は環境音やSEに強いが、会話音声の自然さではVeoに劣る。Kling 3.0はネイティブ音声非対応で、別ツールとの組み合わせが前提になる。

コスパ

ここがSeedance最大の強み。Fastティアの$0.022/秒は競合の4分の1以下。100本×10秒を生成した場合のコスト比較がわかりやすい。

Seedance 2.0

約$22

約3,300円(Fastティア)

Kling 3.0

約$95

約14,000円

Veo 3.1

$90〜180

約13,000〜27,000円

コスパ重視ならSeedanceのFastティア一択。月$5程度で十分な品質の短尺動画が量産できる。音声品質が決定的に重要なプロジェクトだけVeo 3.1に切り替える。Klingは「4Kの鮮明さが絶対に要る」場面でだけ使う。この二段構えが現実的だ。

Seedanceの弱点と注意点

コスパ最強だからといって万能ではない。実際に使い込むと見えてくる制約がいくつかある。

コンテンツフィルターが厳しすぎる

Disney・Netflix・Paramount・Sonyからの法的警告を受けて以降、フィルターが税関のように厳しくなった。実在人物の顔写真を参照素材に使うとブロック。有名人の名前、商標ロゴ、特定のアートスタイルも検出対象だ。

オリジナルキャラクターや風景なら問題ない。だが「この俳優風の顔で」は通らない。社員の顔写真を参照に入れても高確率でフィルターに引っかかる。人物の顔を使いたいなら、イラスト調に加工してから入力するワークアラウンドが必要だ。

15秒の壁

1回の生成で最大15秒。ビデオエクステンションで延長は可能だが、継ぎ目の品質が安定しない。30秒以上の動画を作るには複数クリップを生成してカット編集する前提になる。

Seedance 2.5で30秒に倍増する予定だが、それでもYouTube向けの長尺コンテンツには足りない。短尺SNS動画や広告クリエイティブには十分だ。

テキスト描画の弱さ

看板の文字、タイトルカード、字幕など画面内のテキスト描画は不安定。文字化けや配置ズレが頻繁に起きる。テキストは後から動画編集ソフトで重ねるほうが確実だ。これはSeedanceに限らず、動画生成AI全般の弱点でもある。

3人以上の複数キャラクター

2人までのシーンは安定するが、3人以上のキャラクターが同時に画面内で動くシーンでは一貫性が崩れやすい。キャラクターの服装が途中で変わったり、顔の特徴が混ざったりする。群衆シーンはまだ苦手と見ておいたほうがいい。

使いこなしの難易度

正直なところ、DreaminaのUIはわかりにくい。参照素材の上限がどこに書いてあるのか見つけるまで10分かかった。英語と中国語が混在する画面で試行錯誤するしかない。最初の10〜20本は学習コストと割り切ること。

Seedance 2.5 — 2026年7月の次期アップデート

2026年6月23日のVolcano Engineカンファレンスで、ByteDanceはSeedance 2.5を発表した。グローバル向けのエンタープライズベータが進行中で、一般公開は2026年7月初旬の見込みだ。

Seedance 2.0(現行)

  • 最大15秒
  • 12素材同時入力
  • 1080p(4K追加済み)
  • 音声・動画の別々処理

Seedance 2.5(次期)

  • 最大30秒(倍増)
  • 50素材同時入力(4倍)
  • 3Dプレビズ対応
  • 音声・映像を同一潜在空間で同時処理

特に注目すべきは「同一潜在空間での音声・映像同時処理」だ。2.0では音声と映像が別々のパイプラインで処理されていたが、2.5では両者が統合される。結果として、音楽のリズムに合わせたカメラワークや、セリフに連動した表情変化がより自然になる見込みだ。

3Dプレビズ対応も面白い。ローファイな3Dブロックアウト(大まかなカメラアングルと物体配置)を入力すると、そこからフォトリアルな動画を生成できる。映像制作の前段階で使う「動くストーリーボード」のような位置づけだ。

料金は未発表。2.0のAPIがそのままアップグレードされるのか、別モデルとして提供されるのかも不明だ。発表され次第この記事を更新する。

よくある質問

Q. Seedanceは日本語で使えますか?

Dreaminaのインターフェースは英語と中国語が中心だが、プロンプトは日本語で入力しても動作する。リップシンクも日本語対応済み。ただし英語プロンプトのほうが出力品質が安定する傾向がある。

Q. 商用利用は可能ですか?

Dreaminaの有料プランで生成した動画は商用利用可能。無料プランでの商用利用は利用規約で制限されている場合がある。API経由の場合はfal.aiやBytePlusの利用規約に準ずる。

Q. Sora 2の代替としてSeedanceは使えますか?

用途による。SNS向け短尺動画やプロトタイプ制作ならSeedanceは十分な代替になる。Sora 2のWebアプリは2026年4月に終了済みで、APIも9月に終了予定。乗り換え先としてはSeedance(コスパ重視)かVeo 3.1(品質重視)が現実的な選択肢だ。

Q. スマートフォンから使えますか?

Dreaminaのモバイルブラウザ版で利用可能。ただし参照素材のアップロードやプロンプト編集はPC画面のほうが圧倒的に操作しやすい。

Q. LoRAやファインチューニングには対応していますか?

非対応。カスタムデータセットでの微調整はできない。独自のキャラクターやスタイルを固定したい場合は、参照画像を工夫するか、Runway Gen-4.5のようなLoRA対応モデルを検討する。

まとめ

API秒単価$0.022。Klingの4分の1以下。無料プランあり。ネイティブ音声とリップシンクがワンモデルで完結する。動画生成AIのコスパという軸で、2026年6月時点のトップはSeedanceだ。

弱点は明確にある。コンテンツフィルターが厳しすぎる。15秒の壁。テキスト描画の不安定さ。会話音声はVeo 3.1に負け、4KはKling 3.0に負ける。万能ではない。

無料プランで試行錯誤するなら20〜30本は必要で、時間がかかる。時間対効果を考えると、最初からBasicプランで10本しっかり作るほうが合理的だ。数千円で学習コストが終わる。音声品質が必要な場面だけVeo 3.1に切り替えればいい。

Seedanceを始める最短ルート

dreamina.capcut.com でアカウント作成 → モデルピッカーで「Seedance 2.0」を選択 → プロンプト入力+参照画像アップロード → 生成ボタン。5分で最初の動画が手に入る。

7月にリリース予定のSeedance 2.5では30秒生成と50素材同時入力に対応し、音声・映像の統合処理で品質がさらに上がる見込み。動画生成AIを本格導入するなら、今のうちに2.0で操作感を掴んでおくのが合理的だ。