MAI-Code-1-Flash入門|性能・料金・使い方2026
目次
Microsoft Build 2026の初日、2026年6月2日にMicrosoftが発表したMAI-Code-1-Flashは、SWE-Bench Proで51.2%を叩き出した。Claude Haiku 4.5の35.2%を16ポイント上回る数字だ。
注目すべきは、これがMicrosoft初の自社開発コーディングモデルだという点にある。GitHub Copilotに搭載されてきたモデルはこれまでOpenAI製だったが、MAI-Code-1-Flashの登場でその構図が根本から変わった。Project Polarisと呼ばれるOpenAI依存脱却戦略の、最初の具体的な成果物がこのモデルだ。
MAI-Code-1-Flashとは — 30秒で掴む要点
MAI-Code-1-FlashはMicrosoftが自社で開発・訓練したコーディング特化AIモデル。GitHub Copilotのインライン補完やチャットの裏側で動く。
MAI-Code-1-Flashの要点
- ・Microsoft初の自社開発コーディングAIモデル
- ・137B MoE(アクティブパラメータ約5B)で低レイテンシ補完
- ・SWE-Bench Proで51.2%(Claude Haiku 4.5比+16pt)
- ・GitHub Copilotの全ティア(Free含む)にロールアウト中
- ・追加課金なし — 既存のCopilotプランに内包
なぜ「Flash」なのか
名前に「Flash」を冠する理由はシンプルで、速度重視の設計思想にある。総パラメータ数は137Bだが、MoE(Mixture of Experts)アーキテクチャにより、1回の推論でアクティブになるのは約5B。結果としてインライン補完のレイテンシが極めて低い。コードを書いている最中にリアルタイムで候補が出てくる体験を、フロンティアモデル並みの精度で実現するための構造だ。
GitHub Copilotの生産環境で訓練されたという点も見逃せない。開発者が日常的にCopilotへ打ち込むプロンプトやコードパターンを学習データに取り込んでいるため、実務との親和性が高い。研究ベンチマーク上の数字だけでなく、実際のコーディング体験で差が出る設計になっている。
OpenAIモデルとの関係
Copilotはこれまで、GPT-4系列をベースに動いてきた。MAI-Code-1-Flashの導入で、Copilotのモデルピッカーに「MAI」という選択肢が初めて現れる。現時点ではOpenAIモデルとMAIモデルが共存する形だが、8月までにProject Polarisの下でGPT-4がMAI-Thinking-1に置き換わるロードマップが公表されている。
開発者にとっての影響は、モデルを意識せず使い続けられるという点。Copilotの「Auto」ルーターがタスクの種類に応じて最適なモデルを自動選択するため、明示的にFlashを指定しなくても恩恵を受けられる。
スペックと技術仕様 — 137B MoEの正体
公開されたモデルカードから、MAI-Code-1-Flashの主要スペックを整理する。
| 項目 | MAI-Code-1-Flash |
|---|---|
| アーキテクチャ | Sparse Mixture of Experts(MoE) |
| 総パラメータ | 137B(約1,370億) |
| アクティブパラメータ | 約5B(推論時) |
| コンテキストウィンドウ | 256,000トークン |
| 訓練期間 | 2026年3月〜5月 |
| 訓練環境 | GitHub Copilot生産環境ハーネス |
| 主な用途 | インラインコード補完・チャット・マルチターン対話 |
| 提供形態 | GitHub Copilot内蔵(API単体提供なし) |
MoEアーキテクチャの利点
MoE(Mixture of Experts)は、入力に応じて必要なエキスパートモジュールだけを活性化させる仕組みだ。137Bの全パラメータが常に動くわけではなく、1トークンの生成に関わるのは約5B分。試食コーナーに例えるなら、全メニューが棚に並んでいるが客の好みに合わせて出てくるのは2-3品だけ、というイメージに近い。
速い。安い。実益はこの2点に尽きる。フルパラメータのモデルと同等の知識量を持ちながら、推論コストは5B相当に収まる。GitHub CopilotのFreeティアでも品質を落とさず提供できる背景にはこの構造がある。
Adaptive Thinking — 動的な推論深度
同モデルのもう一つの技術的特徴が、Adaptive Thinking機構だ。単純な変数名の補完には数トークンで即応し、複雑なアルゴリズムの生成にはより多くの推論バジェットを割く。リクエストの難易度に応じて思考の深さを自動調整する。
実務で試すと、1行の変数宣言やimport文の補完は体感で200ms以下。一方で、複数ファイルにまたがるリファクタリングの提案では数秒かかることがある。この差は意図的な設計で、「速さが重要な場面では速く、精度が重要な場面では丁寧に」という使い分けが裏側で自動的に走っている。
ベンチマーク比較 — SWE-Bench Proで51.2%の意味
数字だけ見ても実感が湧きにくい。SWE-Bench Proで51.2%が何を意味するのか、他モデルとの比較で位置づけを整理する。
| モデル | SWE-Bench Pro | SWE-Bench Verified | 備考 |
|---|---|---|---|
| Claude Opus 4.8 | — | 88.6% | フロンティア最高峰 |
| Kimi K2.6 | ~58.6% | — | SWE-Bench Pro上位 |
| MAI-Code-1-Flash | 51.2% | — | Microsoft自社開発 |
| GPT-5.3 | ~51% | — | OpenAI中位モデル |
| Claude Haiku 4.5 | 35.2% | — | 軽量モデル |
51.2%の読み方
SWE-Bench Proは実在のGitHubイシューをモデルに解かせるベンチマークで、コード生成だけでなくリポジトリ全体の文脈理解が問われる。51.2%は「2回に1回は実際のバグを自力で直せる」精度だ。Claude Haiku 4.5の35.2%と比較すると、Haikuでは3回に1回だったのが2回に1回に改善されたことになる。
ただし、フロンティアモデルであるClaude Opus 4.8(SWE-Bench Verified 88.6%)やKimi K2.6(SWE-Bench Pro ~58.6%)には届かない。このモデルの立ち位置は「超高速なインライン補完モデルとしては最高水準」であり、エージェント型の複雑なタスクはフロンティアモデルに譲る設計だ。
トークン効率 — 60%の削減が意味すること
SWE-Bench Verifiedにおいて、同モデルは難しい問題でもClaude Haiku 4.5比で最大60%少ないトークンで解く。同じ精度を達成するのに必要な計算量が大幅に少ない。
開発者にとっての実利は、Copilotの応答速度とコスト効率の向上に直結する。特にFreeティアでは月間2,000回のコード補完制限があるため、1回あたりのトークン消費が少ないモデルほど制限内で多くの作業をこなせる。
ベンチマークの落とし穴
SWE-Benchのスコアはモデル単体の能力を測るもので、IDE統合やコンテキスト収集の質は含まれない。Copilot内でこのモデルを使う場合、VS Codeが提供するファイル横断のコンテキストやリポジトリ構造情報がスコア以上の体験を生む。逆に、APIで直接叩いた場合のスコアがそのまま体験になるわけではない。
GitHub Copilotでの使い方と設定
本モデルはGitHub Copilotに内蔵される形で提供される。APIでの単体利用は現時点では不可。使い始める手順は驚くほど簡単で、ほとんどの場合は何も設定する必要がない。
VS Codeでの設定手順
GitHub Copilot拡張機能がインストール済みなら、以下の手順でFlashを明示的に選択できる。
// VS Codeのsettings.jsonに追加
{
"github.copilot.chat.models": ["mai-code-1-flash"],
"github.copilot.advanced": {
"inlineSuggest.model": "mai-code-1-flash"
}
}
ただし、多くの開発者にとっては「Auto」ルーターに任せるのが最適解だ。Autoモードでは、タスクの難易度と種類に応じてMAI-Code-1-Flash・MAI-Thinking-1・その他のモデルが自動で切り替わる。
Autoルーターの挙動
MAI-Code-1-Flashが選ばれる場面
- ・インラインコード補完
- ・変数名・関数名の提案
- ・import文の補完
- ・単純なリファクタリング
- ・テストコードの雛形生成
MAI-Thinking-1が選ばれる場面
- ・複数ファイルにまたがるバグ修正
- ・アーキテクチャ設計の相談
- ・複雑なアルゴリズム生成
- ・コードレビューと改善提案
- ・ドキュメント生成
Autoモードで数日作業すると、Copilot Chatのステータスバーに表示されるモデル名が「MAI-Code-1-Flash」になっている時間が長い。インライン補完はGPT-4o時代と比べて候補が出るまでの間が半分以下に縮まった。チャットで複雑な質問を投げたときだけ少し間が空く — MAI-Thinking-1に切り替わっているサインだ。
モデルピッカーでの手動切替
Copilot Chatウィンドウの左下にモデルピッカーが表示される。ドロップダウンからmai-code-1-flashを選択すれば、セッション内の全応答がFlash固定になる。
# モデル指定でCopilot CLIを使う場合
gh copilot suggest --model mai-code-1-flash "Pythonでcsvを読み込んでグラフを描画する関数"
Copilot CLIを使っている場合も--modelフラグでFlashを直接指定できる。ターミナルでの作業が中心なら、CLIベースのAIコーディングツールと合わせて検討するのも手だ。
料金プラン比較 — Free・Pro・Pro+・Max
本モデルの利用にあたって追加料金は発生しない。既存のGitHub Copilotプランが丸ごとカバーする。各ティアの違いは主にリクエスト数の上限にある。
| プラン | 月額 | コード補完 | チャット | MAI-Code-1-Flash |
|---|---|---|---|---|
| Free | $0 | 2,000回/月 | 50メッセージ/月 | ✅ 利用可 |
| Pro | $10 | 無制限 | 無制限 | ✅ 利用可 |
| Pro+ | $39 | 無制限 | 無制限 + 高速 | ✅ 優先ルーティング |
| Max | $99 | 無制限 | 無制限 + 最高速 | ✅ 全モデル即時切替 |
どのプランを選ぶべきか
自分ならPro(月$10)を選ぶ。理由は3つ。Freeの月2,000回制限は日常的にコーディングする人には1週間で使い切る水準であること、Pro以上で補完とチャットが無制限になること、そしてFlashの恩恵はPro以上で最も感じやすいこと。
Pro+($39)やMax($99)はエージェント機能をフル活用するパワーユーザー向けだ。MAI-Thinking-1による長時間の推論タスクや、Copilot Workspaceでのマルチファイル編集を日常的に使うなら検討の価値がある。Flashのインライン補完だけが目的なら、Proで十分事足りる。自分がProで足りないと感じる場面を挙げるなら、Copilot Workspaceでのマルチファイル一括編集を週10回以上使うときだけだ。
企業向けプランの注意点
2026年6月時点で、本モデルはGitHub Copilot Business・Enterpriseプランへの展開時期が未発表。法人利用を検討している場合は、GitHub公式のロードマップを確認してから導入計画を立てること。個人ティア(Free/Pro/Pro+/Max)では即座に利用可能。
Build 2026で発表された7つのMAIモデル
MAI-Code-1-Flashは、Build 2026で発表された7つのMAIモデル群の一つに過ぎない。Microsoftは「借りるAI」から「作るAI」へ転換した。その全体像を整理する。
コーディング
MAI-Code-1-Flash
5B active / 137B MoE。インライン補完特化。Copilot全ティアに展開。
推論
MAI-Thinking-1
Microsoft初の自社推論モデル。Sonnet 4.6とブラインド比較で同等。複雑なタスク向け。
音声
MAI-Voice-2
音声クローンモデル。テキストから自然な音声を生成。多言語対応。
MAI-Code-1-Flash vs MAI-Thinking-1 — 使い分けの基準
開発者が迷うのは「どちらのモデルを使えばいいのか」だろう。判断基準は明快で、タスクの複雑さと速度要件で分かれる。
| 判断基準 | MAI-Code-1-Flash | MAI-Thinking-1 |
|---|---|---|
| 得意領域 | インライン補完、単一ファイル編集 | マルチファイル推論、アーキテクチャ設計 |
| 応答速度 | 200ms以下(体感即応) | 数秒〜数十秒 |
| コンテキスト | 256Kトークン | 非公開(推定256K以上) |
| ベンチ性能 | SWE-Bench Pro 51.2% | Sonnet 4.6同等(ブラインド評価) |
| 推奨場面 | コード書き中のリアルタイム補完 | 設計相談・バグ調査・レビュー |
実際にはAutoルーターがこの振り分けを自動で行うため、開発者が手動で選ぶ場面は少ない。ただし、「今は補完速度を優先したい」「今は精度を優先したい」という明確な意図があるなら、モデルピッカーで手動切替する意味がある。
7モデル全体の戦略的意味
7モデル同時発表。想定外の規模だった。コーディング・推論・音声・マルチモーダルと、AIスタックの主要レイヤーを自前で揃えた。2024年まではOpenAIの技術に大きく依存していたが、2026年のMicrosoftはモデル層でも自立できる体制を作りつつある。
開発者にとっての直接的な影響は、Copilotの性能向上とコスト低下だ。自社モデルに切り替えることで、OpenAIへのライセンス料を削減しつつ、Copilotの利用料を据え置きまたは値下げできる余地が生まれる。McKinseyとの協業では、GPT-5.5比でコスト効率が10倍改善したという報告も出ている。
Project Polaris — OpenAI依存からの脱却
このモデルの背景には、Project Polarisという上位戦略がある。一言で言えば、GitHub Copilotの基盤モデルをOpenAI製からMicrosoft自社製に切り替えるプロジェクトだ。
タイムラインと移行計画
Build 2026で公表されたロードマップによれば、2026年8月までにGitHub CopilotのデフォルトモデルがGPT-4からMAI-Thinking-1に置き換わる。Flashは6月2日からロールアウト開始済みで、インライン補完はすでにMAIモデルで動いている環境が増えている。
ここで見落としがちなのが、OpenAIモデルが完全に排除されるわけではないという点だ。Copilotのモデルピッカーには引き続きOpenAIモデルが選択肢として残る。Microsoftが狙っているのは「デフォルトの切り替え」であり、「選択肢の削除」ではない。
なぜMicrosoftは自社モデルに投資するのか
理由は収益構造にある。CopilotのようなSaaSプロダクトでは、APIコールごとにOpenAIへライセンス料が発生する。ユーザーが増えるほどコストも線形に増える構造だ。自社モデルに切り替えれば、コスト構造を固定費寄りにできる。McKinseyとの協業で「GPT-5.5比コスト効率10倍」という数字が出たのは、この構造変化の恩恵が大きい。
もう一つの理由が、2026年4月のMicrosoft・OpenAI契約改定だ。両社の関係がライセンシーからパートナーに変わり、MicrosoftがOpenAIの技術を独占的に使える範囲が縮小した。自社モデルへの投資は、この契約変更への実務的な対応でもある。AIコーディングツール市場全体の競争構造が、モデル層まで含めて再編されつつある。
Anthropicとの関係にも注目
Build 2026では、Azure AI FoundryにClaude(Anthropic)が正式追加されたことも発表された。MicrosoftはOpenAI依存を減らしつつ、Anthropicを含む複数のモデルプロバイダーとの関係を強化している。開発者にとっては選択肢が増える方向で、特定ベンダーへのロックインリスクが下がる動きだ。
競合ツール比較 — Claude Code・Cursor・Copilot
本モデルはGitHub Copilotの一部として提供される。競合となるのはClaude CodeやCursorといったAIコーディングツールだ。ここではモデル性能ではなく「ツールとしての実用性」で比較する。
| 比較項目 | GitHub Copilot + MAI | Claude Code | Cursor |
|---|---|---|---|
| 基盤モデル | MAI-Code-1-Flash / MAI-Thinking-1 | Claude Opus 4.8 / Sonnet 4.6 | Kimi K2.5 / Claude / GPT |
| 月額(個人) | $0〜$99 | $20〜(API従量制) | $20〜$40 |
| エディタ統合 | VS Code / VS / JetBrains | CLI / VS Code / Web | 専用エディタ(VS Code fork) |
| エージェント機能 | Copilot Workspace(正式版) | エージェントモード標準搭載 | Composer 2.5 |
| インライン補完速度 | ◎(MAI-Flash特化) | △(CLIメイン) | ○ |
| Free枠 | あり(2,000回/月) | なし | あり(制限あり) |
それぞれのツールが向いている人
Copilot + MAI
VS Codeをメインエディタにしている開発者。インライン補完の速度を重視する人。無料から試したい人。
強み: 補完速度、Free枠、IDE統合の深さ
Claude Code
ターミナル中心の開発スタイル。大規模リファクタリングや自律的なエージェントタスクを任せたい人。
強み: エージェント性能、SWE-Bench最高峰
Cursor
エディタごとAIに最適化された環境が欲しい人。モデルの選択肢を幅広く持ちたい人。
強み: 専用UI、モデル選択の自由度
自分の使い方で言えば、インライン補完はCopilot(MAI-Code-1-Flash)、大きめのタスクはClaude Codeという組み合わせに落ち着いている。Cursorも試したが、VS Codeのエコシステム(拡張機能・設定ファイルの資産)を捨てるコストが高く、乗り換えには至っていない。
もったいないと感じるのが、FlashをAPI経由で単体利用できない点だ。Copilotのハーネスに閉じ込められている以上、自作のAIパイプラインに組み込めない。Copilot Agent Modeの料金体系を含め、Microsoftがどこまでオープンにするかが今後の分かれ目になる。
日本語コーディング環境での注意点
本モデルはSWE-Bench Multilingualでもテストされているが、ここで言う「マルチリンガル」はプログラミング言語の多言語であって、自然言語の多言語ではない。日本語のコードコメントや日本語ドキュメント生成の精度について、公式のベンチマークデータは存在しない。
検証した範囲では、日本語コメント付きのPythonコードに対する補完は問題なく動作する。ただし、日本語でのチャット応答品質はMAI-Thinking-1のほうが明らかに上だ。日本語での設計相談やコードレビューを頻繁に行う場合は、Autoルーターに任せてMAI-Thinking-1に振らせるか、日本語対応が強いAIサービスとの併用を検討したい。
よくある質問(FAQ)
MAI-Code-1-Flashは無料で使える?
GitHub Copilot Freeプラン(月2,000回補完・50チャット)で利用可能。追加課金なし。
VS Code以外のエディタでも使える?
2026年6月時点ではVS Codeが最優先でロールアウト中。JetBrains IDEやVisual Studioへの展開は公式ロードマップに記載されているが、具体的な日程は未発表。既存のCopilotプラグインが入っていれば、サーバー側のモデル切り替えでAutoルーター経由の利用が始まる見込みだ。
APIで直接叩ける?
不可。MAI-Code-1-FlashはGitHub Copilotのハーネス内でのみ動作する。Azure AI FoundryやGitHub Models経由での単体API提供は現時点で予定されていない。
OpenAIモデルは使えなくなる?
使えなくならない。Project Polarisはデフォルトモデルの切り替えであって、OpenAIモデルの排除ではない。モデルピッカーから引き続き選択できる。ただし、8月以降はAutoルーターのデフォルトがMAI系に変わるため、明示的に選ばない限りOpenAIモデルは使われなくなる。
Claude CodeやCursorと併用できる?
問題なく併用可能。CopilotのインラインはFlashで補完しつつ、大きなタスクはClaude Codeに回すワークフローは実用的な選択肢だ。CopilotとAIツールの共存設定も参考になる。
5Bパラメータと137Bパラメータ、どっちが正しい?
両方正しい。総パラメータ数は137B(MoEアーキテクチャ全体)で、1回の推論でアクティブになるのは約5B。一部のメディアが「5Bモデル」「137Bモデル」と異なる報じ方をしているが、MoEでは総パラメータとアクティブパラメータが別物であるために起きた混乱だ。
まとめ
MAI-Code-1-Flashは、Microsoftが「AIモデルを借りる側」から「作る側」に変わったことを示す最初の成果物だ。SWE-Bench Pro 51.2%という数字は、インライン補完モデルとしてはトップクラス。Copilot Freeでも使えるため、参入障壁は実質ゼロに近い。
エージェント型タスクではClaude Opus 4.8に届かない。そこは隠しようがない。このモデルの真価は「速さ」にある。コードを書いている最中のリアルタイム補完という、開発者が最も多くの時間を費やす作業で力を発揮するモデルだ。
Project Polarisの進行により、8月にはCopilotのデフォルトが全面的にMAI系に切り替わる。VS Codeを使っているならFreeプランにサインアップして1日使う。それだけで判断がつく。プロンプトエンジニアリングの基礎を押さえていれば、Copilot Chatでの対話品質も上がる。
次のステップ
VS CodeでGitHub Copilot拡張機能をインストールし、Freeプランにサインアップ。モデルピッカーでmai-code-1-flashを選び、普段のプロジェクトで補完速度を体感する。AIエンジニアとしてのキャリアを考えている人にとっては、最新ツールのキャッチアップ自体がスキルの証明になる。