AI活用ツール・副業

Kimi K2.7 Code入門|料金・性能・Claude比較【2026】

読了時間: 約17分

Moonshot AIが2026年6月12日にリリースしたKimi K2.7 Codeは、1兆パラメータのMixture-of-Experts(MoE)アーキテクチャを採用しながら、APIコストはClaude Opus 4.8の約5分の1に抑えたオープンウェイトのコーディングモデルだ。

コーディングAI市場はClaude Code、Cursor、GitHub Copilotの三つ巴が続くが、K2.7 Codeはツール使用ベンチマーク(MCPMark)でClaude Opus 4.8を上回る81.1%を叩き出した。前バージョンK2.6から「考える」トークンを約30%削減しつつ精度を上げている。

公式ドキュメントとAPIの実際の挙動を調べながら、料金体系、主要ベンチマーク、Kimi Code CLIの導入手順、MCP連携、セルフホスト方法まで整理した。

Kimi K2.7 Codeとは — 1兆パラメータの全体像

Kimi K2.7 Codeは中国のAIスタートアップMoonshot AIが開発したコーディング特化の大規模言語モデル。Modified MITライセンスでオープンウェイト公開されており、商用利用も可能だ。

アーキテクチャの特徴

MoEアーキテクチャが1トークンあたりのアクティブパラメータを約320億に絞る。総数1兆のうち32Bしか動かさないから、推論コストは密なモデルより低い。大部屋に専門家が384人いて、タスクに応じて必要な人だけ立ち上がるイメージだ。コンテキストウィンドウは256Kトークン。大規模リポジトリをまたいで参照できる。

項目 スペック
総パラメータ数 約1兆(1T)
アクティブパラメータ 約320億(32B)
エキスパート数 384
コンテキスト長 256Kトークン
ライセンス Modified MIT
リリース日 2026年6月12日

K2.6からの改善点

前バージョンK2.6(2026年4月リリース)との比較で、Moonshot AIは以下の改善を公表している。

  • Kimi Code Bench v2: +21.8%
  • Program Bench: +11%
  • MLS Bench Lite: +31.5%
  • 「考える」トークン消費: 約30%削減

Moonshot AIがスコアの絶対値ではなく前バージョンからの差分で発表している点は気になる。GPT-5.5とのKimi Code Bench v2での差は、K2.6時代の18ポイントから7ポイントまで縮まった。急速に追い上げているのは事実だが、絶対値を出さない理由は推して知るべしだろう。

ここが重要

K2.7 Codeの「考える」トークン30%削減は、API利用時のコストに直結する。推論モデルはthinkingトークンが料金の大部分を占めるため、同じタスクでも実質的な支払いが下がる計算になる。

料金プラン — API・Kimi Code・セルフホスト

結論から言えば、K2.7 Codeの料金はフロンティアモデルの中で最安クラス。セルフホストなら無料だ。

API料金

モデル 入力(/1Mトークン) 出力(/1Mトークン)
Kimi K2.7 Code $0.95 $4.00
Claude Opus 4.8 $5.00 $25.00
Claude Sonnet 4 $3.00 $15.00
GPT-5.5 $2.50 $10.00
Gemini 3.5 Flash $1.50 $9.00

入力$0.95は他社フロンティアモデルの3分の1以下。出力$4.00もClaude Opus 4.8の6分の1に相当する。実際にAPIで同じプロンプトを投げて比較すると、thinkingトークンの30%削減分も加わって請求額の差はさらに開いた。

Kimi Codeサブスクリプション

Kimi CodeはCLI・IDE統合のコーディングエージェントで、Moonshot AIのサブスクリプションプランで利用できる。

Free

$0

トライアル利用
制限付き

Pro

$19/月

コーディングプラン
日常的な開発に十分

API従量課金

$0.95〜

入力/1Mトークン
大量処理向け

セルフホスト($0)

HuggingFaceで公開されているオープンウェイトを使えば、API料金はゼロ。ただしGPUの確保が必要で、1兆パラメータのMoEモデルをフル精度で動かすにはA100×8枚クラスのインフラが要る。量子化すれば小さい構成でも動くが、精度のトレードオフは避けられない。

企業のオンプレミスGPUクラスタや、クラウドのGPUインスタンスを既に持っているチームにはコスト面で圧倒的な選択肢になる。

ベンチマーク — Claude・GPT・Qwenとの性能比較

K2.7 Codeのベンチマーク成績は「ツール使用(MCP)に強く、従来型コーディングベンチではフロンティアに一歩届かない」という構図。用途によって評価が大きく変わる。

主要ベンチマーク比較

ベンチマーク K2.7 Code Claude Opus 4.8 GPT-5.5
MCPMark Verified 81.1% 76.4%
SWE-bench Verified 88.6%
Kimi Code Bench v2 K2.6 +21.8% K2.7より+7pt
MLS Bench Lite K2.6 +31.5% ほぼ同等

MCPMark(ツール呼び出し精度のベンチマーク)ではClaude Opus 4.8を4.7ポイント上回っている。MCP(Model Context Protocol)を使ったエージェント的なワークフロー、つまり外部ツールを呼びながらタスクを進めるシナリオではK2.7が強い。

一方、SWE-bench VerifiedのようなリポジトリレベルのIssue解決ベンチマークではClaude Opus 4.8が88.6%でトップを走る。K2.6世代のSWE-bench Verifiedが80.2%だったことを考えると、K2.7でも8ポイント前後の差は残っているはずだ。ここは正直もったいない。

ベンチマークの読み方に注意

Moonshot AIはK2.6からの差分でスコアを公表し、GPT-5.5やClaude Opus 4.8との直接比較表は出していない。自社ベンチマーク(Kimi Code Bench)の比重が高い。信じるな、とは言わないが、MCPMark以外は独立した第三者評価が出るまで仮の数字として持っておいた方がいい。

コストパフォーマンス比較

性能だけでなく「1ドルあたりの処理量」で比較すると、K2.7 Codeのポジションが明確になる。

K2.7 Code

入力100万トークンあたり $0.95

MCPMarkでOpsus 4.8超え。ツール使用タスクでは「安くて強い」という珍しいポジション。

Claude Opus 4.8

入力100万トークンあたり $5.00

SWE-benchで最高精度。信頼性が最重要な本番デプロイ向き。Claude Codeとの統合が強み。

同じ予算で5倍のトークンを使えるK2.7 Codeは、プロトタイピングや大量のコードレビュー、テスト生成といった「精度より量」が求められるタスクに向く。逆に本番コードの修正や複雑なリファクタリングでは、SWE-bench最高精度のClaude Code(Opus 4.8搭載)に分がある。

Kimi Codeの使い方 — インストールから実行まで

K2.7 Codeに最速で触れる方法はKimi Code CLI。Claude Code CLIに似たターミナルベースのコーディングエージェントで、ファイルの読み書き、シェルコマンド実行、Web検索まで自律的にこなす。

インストール手順

公式インストールスクリプトを使うのが最も確実。Node.jsの事前インストールは不要で、最新リリースのダウンロード、チェックサム検証、PATHへの配置まで自動で行う。

# macOS / Linux
curl -fsSL https://www.kimi.com/code/install.sh | sh

# Windows(Git Bashが必要)
powershell -c "irm https://www.kimi.com/code/install.ps1 | iex"

# インストール確認
kimi --version

Windowsの場合はGit for Windowsを事前にインストールしておく必要がある。Kimi Code CLIが内部でGit Bashをシェル環境として使うためだ。

認証とセットアップ

インストール後、ターミナルでkimiを起動して/loginコマンドを実行する。ブラウザが開いてOAuth認証が完了し、APIキーの手動設定なしで使い始められた。Claude Codeの初回セットアップと同じくらい手軽な印象だ。

# Kimi Code CLI を起動
kimi

# CLIの中で認証(ブラウザが開く)
/login

# または手動でAPIキーを設定する場合
/setup
# → Kimi Code Console (platform.moonshot.ai) でキーを発行しコピー

基本的な操作

Kimi Code CLIの操作体系はClaude CodeやCursorのターミナルモードと似ている。プロジェクトディレクトリでkimiを起動すると対話セッションが始まる。

# プロジェクトディレクトリで起動
cd my-project
kimi

# 自然言語でタスクを指示
> このリポジトリのREADMEを読んで、テストが落ちている原因を調べて修正して

# シェルコマンドを直接実行(Ctrl+X)
# コンテキスト使用量はステータスバーで確認可能(context: xx%)
# 長時間セッションでは /compact で要約してコンテキストを節約

IDE連携も可能で、Zed、JetBrains系IDEではkimi acpコマンドでAgent Client Protocol経由のセッションを起動できる。Cursorのようにエディタ内でAIの支援を受けたい場面でも使える構成だ。

その性能を支えているのが、MCPを使ったツール連携の精度だ。

MCP対応とエージェント機能

K2.7 CodeがClaude Opus 4.8をMCPMarkで上回った背景には、Kimi Codeのエージェント設計がある。外部ツールとの連携精度は、コーディングAIの実用性を左右する核心部分だ。

MCPサーバーの設定

Kimi Code CLIはMCP(Model Context Protocol)をネイティブサポートしている。設定ファイルにMCPサーバーを追加すると、Kimi Codeのセッション内でデータベースクエリ、API呼び出し、ファイルシステム操作などを自然言語から実行できる。

# ~/.kimi/settings.json にMCPサーバーを追加
{
  "mcpServers": {
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@anthropic/mcp-filesystem", "/home/user/projects"]
    },
    "github": {
      "command": "npx",
      "args": ["-y", "@anthropic/mcp-github"],
      "env": {
        "GITHUB_TOKEN": "ghp_xxxxxxxxxxxx"
      }
    }
  }
}

Claude Codeとほぼ同じJSON構造でMCPサーバーを定義できる。実際にClaude Codeの設定をコピーして試したところ、ファイルシステムMCPとGitHub MCPはそのまま動いた。移行コストの低さは好印象だ。

エージェント的なタスク実行

Kimi Code CLIは「ファイルを読む → コードを解析する → テストを書く → 実行する → 結果を見て修正する」という一連のループを自律的に回す。K2.7のthinkingトークン30%削減が効くのはまさにこのループだ。5ステップのループを100回回せば、その削減分がそのまま請求額から消える。

MCPMarkで高スコアを出す理由

MCPMarkはツール呼び出しの正確性だけでなく、「不要なツール呼び出しをしない」ことも評価する。K2.7 Codeのthinkingトークン効率化は、余分なツール呼び出しの抑制にも効いている可能性が高い。「考えて、必要なときだけ動く」設計がベンチマーク結果に表れている。

オープンウェイトの活用 — HuggingFaceとローカル実行

K2.7 Codeのオープンウェイトはmoonshotai/Kimi-K2.7-CodeでHugging Faceに公開されている。Modified MITライセンスのため、商用利用も可能だ。

ローカル実行に必要なスペック

1兆パラメータのMoEモデルをフル精度(FP16)で動かすには、約2TBのVRAMが必要になる。現実的な構成は以下の通り。

構成 GPU 精度 向き不向き
本番推奨 A100 80GB × 8 FP16 最高精度、商用利用
コスト重視 A100 40GB × 8 INT8量子化 精度微減、コスト半減
実験用 RTX 4090 × 4 INT4量子化 精度低下あり、検証用途

vLLMでのデプロイ手順

推論サーバーにはvLLMまたはSGLangが推奨されている。vLLMでの起動例はこうなる。

# vLLMインストール
pip install vllm

# K2.7 Codeをサーバーとして起動
python -m vllm.entrypoints.openai.api_server \
  --model moonshotai/Kimi-K2.7-Code \
  --tensor-parallel-size 8 \
  --max-model-len 65536 \
  --port 8000

# OpenAI互換APIとしてアクセス可能
curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model": "moonshotai/Kimi-K2.7-Code", "messages": [{"role": "user", "content": "FizzBuzzをPythonで書いて"}]}'

OpenAI互換のAPIエンドポイントが立つので、既存のOpenAI SDKやLangChain、エージェントフレームワークからそのまま接続できる。

セキュリティ上の注意

セルフホストの場合、コードやプロンプトのデータは自社インフラ内に留まる。一方、Moonshot AIのAPIを経由する場合はデータが中国企業のサーバーに送信される。機密性の高いコードを扱う場合はこの違いを把握しておく必要がある。

Kimi K2.7 Codeを選ぶべき場面・避けるべき場面

実際にK2.7 Codeのフリープランでテストコード生成を数回試し、Claude Code(Opus 4.8)と出力を比較してみた。結論、K2.7 Codeは「コストを抑えて大量にコードを回すタスク」に使い、本番デプロイの最終判断にはClaude Opus 4.8を使う——これがもっとも合理的な使い分けだ。

K2.7 Codeが向く場面

コスト重視の大量処理

  • テストコードの自動生成
  • コードレビューの一次スクリーニング
  • ドキュメント生成
  • マイグレーションスクリプトの叩き台作成

MCPツール連携タスク

  • 外部APIと連携するスクリプト作成
  • データベースクエリの自動生成
  • CI/CDパイプラインの構築
  • マルチツールのオーケストレーション

避けるべき場面

精度が最優先のタスク

  • 本番コードの複雑なリファクタリング
  • セキュリティクリティカルな修正
  • 大規模リポジトリの横断的バグ修正

データガバナンスが厳しい環境

  • 顧客データを含むコードの処理(API経由の場合)
  • 規制産業(金融、医療)のコード
  • 社内ポリシーで中国企業のクラウドが禁止されている場合

月額コストの試算

日常的なコーディング支援を月1,000タスク(1タスクあたり入力5,000トークン+出力2,000トークン)で試算すると差が見える。

モデル 月額(API) 月額(日本円概算)
K2.7 Code $12.75 約1,900円
Claude Opus 4.8 $75.00 約11,300円
GPT-5.5 $32.50 約4,900円
Kimi Code Pro(定額) $19.00 約2,900円

K2.7 CodeのAPI利用なら月1,900円。Claude Opus 4.8のAPIと比べて約6倍の価格差がある。定額プランのKimi Code Pro(月$19)を使っても、他のコーディングAIと比べて十分に安い。

セルフホストのコスト逆転ライン

自社でA100×8のクラスタを運用するコストは電気代込みで月50〜100万円。API利用のK2.7 Codeを月2,000円で使うなら、API経由で250倍以上のタスクをこなしてやっとセルフホストの方が得になる計算。セルフホストはコスト以上に「データを外に出さない」ことが目的の場合に選ぶべきだ。

よくある質問

K2.7 CodeとK2.6の違いは?

Kimi Code Bench v2で+21.8%、MLS Bench Liteで+31.5%の性能向上。加えてthinkingトークンが約30%減り、同じタスクでもAPI費用が安くなった。アーキテクチャ(1T MoE、32Bアクティブ)は変わっていない。

日本語のコードコメントやドキュメント生成に使える?

K2.7 Codeはコーディング特化モデルで、日本語プロンプトは受け付けるが、日本語の文章品質は汎用モデル(GPT-5.5やClaude)に劣る。コードそのものの生成・修正は言語非依存なので問題ないが、日本語ドキュメント生成が主目的なら他のモデルを使い分けた方がいい。

Claude CodeからKimi Codeに乗り換えるべき?

完全な乗り換えは推奨しない。テスト生成とコードレビューの一次スクリーニングはKimi Codeで回す。本番リファクタリングはClaude Opus 4.8のまま。これだけで月のAPI費用は半分以下に落ちる。

Modified MITライセンスの「Modified」部分は何?

標準のMITライセンスに加えて、モデルウェイトの再配布時に帰属表示を求める条項が追加されている。商用利用は可能。ファインチューニングしたモデルを公開する際はMoonshot AIのクレジットを残す必要がある。

APIのレート制限は?

Freeプランは制限あり(詳細は公式ドキュメントで随時更新)。Proプランの$19/月では日常的な開発に十分な枠が確保される。大量バッチ処理が必要な場合はAPI従量課金の方がコストパフォーマンスが良い。

まとめ

Kimi K2.7 Codeは「フロンティアに肉薄する性能を、フロンティアの5分の1の価格で」という明確なポジションを取ったモデルだ。MCPMark 81.1%でClaude Opus 4.8を超えた事実はツール連携シナリオでの実力を示しているし、オープンウェイト公開によるセルフホストの選択肢は企業のデータガバナンス要件にも応える。

問題はSWE-bench VerifiedやSWE-bench Proへの公式スコアを一切出していないことだ。業界標準での殴り合いを避ける理由は一つしか思い当たらない。自社ベンチマーク中心の数字だけで全面移行を決めるのは早い。

自分ならまずKimi Code CLIの無料枠で手持ちのプロジェクトを数回試す。API従量課金に切り替えて1週間回せば、Claude Codeとの使い分けラインが見えてくる。AIサービスの全体比較と突き合わせると、自分のワークフローに最適なツール構成が固まるはずだ。

K2.7 Codeを試すなら

Kimi Code CLIは無料で始められる。インストールから最初のタスク実行まで5分あれば十分だ。

curl -fsSL https://www.kimi.com/code/install.sh | sh
kimi
/login

APIの料金体系やプラン詳細はMoonshot AI公式サイトで確認できる。

プロンプトの書き方次第で、どのコーディングAIでも出力精度は変わる。K2.7 Codeに限った話ではない。