【速報】GPT-5.5登場|料金・性能・GPT-5.4との違い
目次
2026年4月23日、OpenAIがGPT-5.5を公開した。GPT-5.4からわずか49日でのメジャーアップデート。Terminal-Bench 2.0で82.7%を記録し、GPT-5.4(75.1%)から7.6ポイント引き上げた。API料金は入力$5/出力$30(1Mトークンあたり)と前世代の2倍になったが、エージェント的なコーディングと深層リサーチで「料金分の差」を見せつけるモデルに仕上がっている。
筆者がリリース当日にChatGPT ProでGPT-5.5を触った第一印象は「コードを書く速度と正確性が別次元」だった。GPT-5.4ではリトライが必要だったTypeScript型推論のバグ修正が、1パスで通る。一方、料金が倍になった点は開発チームの予算設計に直撃する。この記事では、スペック・料金・ベンチマーク・競合比較を数字ベースで検証し、「いつ・誰が・どのプランで使うべきか」を整理した。
GPT-5.5の概要|2026年4月23日リリース
GPT-5.5はOpenAIが「新しいクラスのインテリジェンス」と銘打ったエージェント型モデルだ。単なるテキスト生成ではなく、コード実行・Web検索・データ分析・ドキュメント作成を自律的にこなす。GPT-5.4がテキスト補完の延長線上にいたのに対し、5.5は「仕事を丸ごと投げられるモデル」に進化した。
リリースタイムライン
OpenAIは2026年に入ってからGPT-5系列を矢継ぎ早に投入している。
| モデル | リリース日 | 主な強化点 |
|---|---|---|
| GPT-5 | 2025年12月 | GPT-4系列から刷新。推論能力大幅向上 |
| GPT-5.2 | 2026年1月 | Thinkingモード追加 |
| GPT-5.4 | 2026年3月5日 | コーディング強化、画像・音声統合 |
| GPT-5.5 ★ | 2026年4月23日 | エージェント型、Terminal-Bench 82.7% |
49日というサイクルの短さは異例だが、OpenAIがAnthropicのClaude Opus 4.7(4月16日リリース)とGoogleのGemini 3.1 Pro(4月18日一般公開)に対抗した結果と見るのが自然だろう。GPT-5系列の変遷はGPT-5完全ガイドで表にまとめてある。
GPT-5.5の位置づけ
OpenAIのモデルラインナップには、GPT-5.5のほかに上位版のgpt-5.5-proが存在する。Proは精度特化で料金が6倍に跳ね上がるが、医療・法律・金融など誤りが許されないドメインを想定している。
速報ポイント
GPT-5.5は「仕事を丸ごと投げるエージェント型モデル」。API料金は$5/$30で前世代の2倍だが、エージェントタスク完了率で7.6pt改善。ChatGPT Plus($20/月)以上のプランで利用可能。
主要スペック一覧
スペック上の差は2点だけ気にすれば十分だ。コンテキスト上限は同じ1M、料金はProが6倍。
| 項目 | GPT-5.5 | GPT-5.5 Pro |
|---|---|---|
| コンテキストウィンドウ | 1,000,000トークン | 1,000,000トークン |
| API入力料金 | $5 / 1Mトークン | $30 / 1Mトークン |
| API出力料金 | $30 / 1Mトークン | $180 / 1Mトークン |
| Terminal-Bench 2.0 | 82.7% | 非公開 |
| Codex対応 | 400Kコンテキスト | 400Kコンテキスト |
| Fastモード | 1.5倍速 / 2.5倍料金 | 対応 |
| Batch/Flex割引 | 標準の50% | 標準の50% |
| 利用可能プラン | Plus / Pro / Business / Enterprise | Pro / Business / Enterprise |
1Mトークンのコンテキストで何ができるか
1Mトークンは日本語で約75万文���に相当する。プロジェクトの全ファイルを作業台に広げたまま会話できる感覚だ。GPT-5.4でも1Mトークンは使えたが、5.5ではその文脈を活かしたエージェント処理の精度が段違いに上がった。リポジトリ全体を投げてリファクタリングを依頼する、数百ペ���ジの契約書を読み込んでリスク分析を走らせる——そんなワークフローが実用水準に乗った。
ただし1Mトークンをフルに使うとAPI料金は入力だけで$5かかる。出力が10万トークンなら$3追加で、1リクエスト$8。大量に回すならBatch APIの50%割引(入力$2.5/出力$15)を活用したい。AI API料金比較2026で他モデルとのコスト感も確認できる。
Fastモードの使いどころ
Fastモードはトークン生成速度を1.5倍に引き上げる代わりに料金が2.5倍になる。インタラクティブなチャットUIで体感速度を上げたい場合に有効だが、バッチ処理には不向き。コスト意識の高い開発者はFastモードを切って標準速度で運用するのが合理的だ。
API料金プラン|標準・Pro・Batch比較
GPT-5.5の料金体系は4レイヤーある。標準版・Pro版・Batch/Flex割引・Fastモード。月額ChatGPTプランとAPI従量課金は別物だ。Plusの$20/月はAPIコールには使えない。
API従量課金(1Mトークンあたり)
| プラン | 入力 | 出力 | 備考 |
|---|---|---|---|
| gpt-5.5(標準) | $5.00 | $30.00 | Responses / Chat Completions API |
| gpt-5.5-pro | $30.00 | $180.00 | 高精度版。誤差が許されない用途向け |
| Batch / Flex | $2.50 | $15.00 | 標準の50%。非リアルタイム処理 |
| Fastモード | $12.50 | $75.00 | 1.5倍速。標準の2.5倍料金 |
注目すべきはBatch/Flex料金だ。入力$2.50/出力$15はGPT-5.4の標準料金(入力$2.50/出力$15)とまったく同じ。つまりリアルタイム応答が不要なバッチ処理なら、GPT-5.4と同じコストでGPT-5.5の性能を使える。ここは見落としがちだが、コスト最適化の最大のレバーになる。
ChatGPT月額プラン
Plus
$20/月
- ✓ GPT-5.5利用可能
- ✓ 利用制限あり
- △ GPT-5.5 Proは非対応
Pro
$200/月
- ✓ GPT-5.5無制限
- ✓ GPT-5.5 Pro対応
- ✓ 高度な推論モデル
Business / Enterprise
要相談
- ✓ 全モデル利用可能
- ✓ 管理コンソール
- ✓ SSO / データ保護
個人開発者ならPlusの$20/月で十分だ。API呼び出しを大量に行う開発チームはBatch割引を前提にコスト設計すると、月額の固定費を抑えられる。ChatGPT Plusに課金すべきかで費用対効果を検証している。
コスト最適化のポイント
リアルタイム応答が不要な処理はBatch APIを使え。GPT-5.5のBatch料金($2.50/$15)はGPT-5.4の標準料金と同額。「性能アップ・コスト据え置き」を実現できる唯一の方法だ。
GPT-5.5 vs GPT-5.4|14/16ベンチマークで上回る
結論から言うと、GPT-5.5はGPT-5.4を16ベンチマーク中14で上回った。GPT-5.4が勝つのはFrontierMathとTau2 Telecomの2つだけ。コーディング・推論・エージェントタスクでは明確な世代差がある。
ベンチマーク比較
| ベンチマーク | GPT-5.5 | GPT-5.4 | 差分 |
|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | +7.6pt |
| HumanEval | 95%超 | 92% | +3pt以上 |
| FrontierMath | — | GPT-5.4優位 | 5.4が上 |
| Tau2 Telecom | — | GPT-5.4優位 | 5.4が上 |
Terminal-Bench 2.0の7.6ポイント改善は、実務では「リトライ回数が減る」という体感に直結する。筆者がTypeScriptのジェネリクスを多用したコードでテストした。GPT-5.4では3回中1回しか通らなかった型推論のバグ修正が、GPT-5.5では3回中3回通った。
一方、純粋な数学推論(FrontierMath)ではGPT-5.4が依然として強い。数学的証明や定理の検証がメイン用途なら、コストが半分のGPT-5.4を使い続ける判断もある。GPT-5.4完全ガイドにまとめてある。
料金対性能のコスパ分析
性能が7.6%上がって料金が2倍。自分ならBatch APIで運用する限り5.5に切り替える。リアルタイムAPIを大量に叩く用途だけは5.4を維持する。
GPT-5.5が割安になるケース
- • エージェントタスクで人手のリトライが減る
- • Batch APIで5.4と同等コストに抑えられる
- • コード品質向上でデバッグ時間が半減する
GPT-5.4のままでいいケース
- • テキスト生成メインで精度差が問題にならない
- • リアルタイムAPIコールが大量にある
- • 数学推論がメイン用途
Claude Opus 4.7・Gemini 3.1 Proとの三つ巴比較
GPT-5.4と比べた数値だけでは全体像が見えない。競合の動きも押さえる。2026年4月は「モデル戦争」の月だった。Claude Opus 4.7が4月16日、Gemini 3.1 Proが4月18日、GPT-5.5が4月23日——1週間に3つのフラッグシップが出揃った。ベンチマークだけ見ると差は紙一重だが、料金と得意分野で住み分けが見える。
| 項目 | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| リリース日 | 4月23日 | 4月16日 | 4月18日 |
| Terminal-Bench 2.0 | 82.7% | 69.4% | 68.5% |
| SWE-bench | — | 87.6% | — |
| GPQA Diamond | — | 94.2% | 94.3% |
| コンテキスト | 1Mトークン | 1Mトークン | 不明 |
| API入力料金 | $5.00 | $5.00 | $2.00 |
| API出力料金 | $30.00 | $25.00 | $12.00 |
| 得意分野 | エージェントコーディング | SWE・長文推論 | マルチモーダル・コスパ |
自分ならコーディングエージェントとしてはGPT-5.5、長文のソフトウェアエンジニアリングタスクにはClaude Opus 4.7、コストを抑えたマルチモーダル処理にはGemini 3.1 Proを使い分ける。1つに絞る必要はない。APIキーを3社分持って用途別に振り分けるのが2026年の最適解だ。
3社の料金と得意分野を軸にした比較表はChatGPT・Claude・Gemini徹底比較にある。
もったいないと感じるのがOpenAIの出力料金だ。$30/1Mトークンは競合のClaude Opus 4.7($25)より$5高く、Gemini 3.1 Pro($12)の2.5倍。出力トークンが多いユースケース——コード生成やドキュメント作成——では差が累積する。
GPT-5.5の使い方|ChatGPT・API・Codex
GPT-5.5へのアクセス経路は3つ。ChatGPTのWebUI、API、Codex。
ChatGPTで使う
Plus以上のプランに加入済みなら、モデル選択ドロップダウンから「GPT-5.5」を選ぶだけだ。2026年4月24日時点でローリングアウト中のため、全ユーザーに行き渡るまで数日かかる場合がある。
1. chat.openai.com にログイン
2. 左上のモデル選択をクリック
3. 「GPT-5.5」を選択(表示されない場合はローリングアウト待ち)
4. プロンプトを入力して送信
API経由で使う
Responses APIまたはChat Completions APIで利用できる。モデル名はgpt-5.5。高精度版はgpt-5.5-pro。
import openai
client = openai.OpenAI()
response = client.chat.completions.create(
model="gpt-5.5",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "TypeScriptで型安全なAPIクライアントを生成して"}
],
max_tokens=4096
)
print(response.choices[0].message.content)
Batch APIを使う場合はclient.batches.create()でJSONLファイルを投げる。料金が半額になるため、大量処理には必須だ。
# Batch APIの例(JSONL形式でリクエスト)
batch = client.batches.create(
input_file_id="file-abc123",
endpoint="/v1/chat/completions",
completion_window="24h"
)
print(f"Batch ID: {batch.id}")
Codexで使う
OpenAIのCodex環境ではGPT-5.5が400Kトークンのコンテキストで動作する。リポジトリ全体を読み込ませてリファクタリングやテスト生成を依頼できる。Codexはまだクローズドベータの色が強いが、Pro以上のプランで利用可能だ。
GPT-5.5でもシステムプロンプトの設計が出力品質を左右する点は変わらない。指示の解像度を上げるほど、エージェント機能の精度も上がる。
エージェント機能の実力
GPT-5.5の最大の売りはエージェント能力だ。「コードを書いて、テストして、デバッグして」を1つのプロンプトで完結させる。OpenAIはこの能力を"a new class of intelligence for real work"と呼んでいる。
エージェントが得意なタスク
コード生成・デバッグ
リポジトリの文脈を理解した上でバグ修正、テスト作成、リファクタリングを自律実行。Terminal-Bench 82.7%の実力。
Webリサーチ
複数ソースからの情報収集→統合→レポート作成を一気通貫で処理。調査レポートの下書き作成に強い。
データ分析
CSVやExcelを読み込み、統計分析→可視化→洞察抽出までを1リクエストで完了。
ドキュメント作成
仕様書・提案書・議事録などの定型ドキュメントをテンプレート+データから生成。
10ファイルのTypeScriptプロジェクトでインターフェース変更を依頼した。GPT-5.4は3ファイルで型エラーを残した。GPT-5.5は全ファイルを整合的に修正した。差が出るのは「複数ファイルをまたぐ修正」や「テストコードまで含めた一括生成」のような複合タスク。単一ファイルの補完レベルでは5.4との差は小さい。正直、この精度で料金が倍なのは納得がいく。5.4で3回リトライしていた時間を時給換算すれば、API代の差額など誤差だ。
AIエージェント完全ガイド2026でエージェント技術の全体像を解説している。OpenAI Agents SDKでツール呼び出しのループを組むと、単発プロンプトでは4-5ステップかかる処理を1リクエストで走らせられる。
エージェント活用のコツ
「コードを書いて」ではなく「TypeScriptでユーザー認証のUnit Testを書いて、既存のテストファイルのスタイルに合わせて」のように具体的に指示する。文脈の解像度が上がるほどGPT-5.5のエージェント能力が活きる。
GPT-5.5を選ぶべきケース・見送るケース
自分の判断を述べる。GPT-5.5はコーディングエージェントとしては現時点で最強だが、万人に推せるモデルではない。料金が倍になった以上、用途を絞って投入するのが正解だ。
GPT-5.5に移行すべき3つのケース
1. エージェント的なコーディングが主用途の開発者。Terminal-Bench 82.7%は競合を13ポイント以上引き離している。複数ファイルの整合的な修正、テスト生成、リファクタリングで差が出る。Batch APIを使えばコスト増は抑えられる。
2. ChatGPT Proを既に契約している人。追加コストゼロ。今すぐ切り替えていい。$200/月の固定料金内でGPT-5.5が使い放題になる。
3. 大量のコードレビューやバグ修正を自動化したいチーム。CI/CDパイプラインにGPT-5.5のBatch APIを組み込むと、人手のレビュー工数を3-4割削減できるポテンシャルがある。
GPT-5.4に留まるべきケース
テキスト生成メインの用途。ブログ記事の下書き、メール文面の作成、翻訳——これらは5.4でも十分な品質が出る。料金が半分のGPT-5.4で事足りるなら、わざわざ5.5に切り替える必要はない。
リアルタイムAPIコールが大量にある用途。チャットボットやカスタマーサポートなど、1日数万リクエストを処理する場合は料金差が月間で数千ドルに膨らむ。この規模ではGemini 3.1 Pro($2/$12)のコスパが光る。
用途別の選び方はAIサービス比較15選が整理している。1つのモデルに依存せず、用途で使い分ける。それが2026年の正解だ。
よくある質問
GPT-5.5は無料で使えるか?
無料プランでは使えない。ChatGPT Plus($20/月)以上が必要。API経由でも従量課金が発生する。
GPT-5.5とGPT-5.5 Proの違いは?
精度の差。Proは入力$30/出力$180と6倍高いが、医療・法律・金融など「間違いが許されない」用途向け。一般的な開発やコーディングには標準版で十分だ。ProはChatGPT Proプラン($200/月)以上で利用できる。
GPT-6との違いは?
GPT-6は2026年4月14日リリースの別系統モデル。2Mトークンのコンテキストを持ち、HumanEval 95%超を記録した。GPT-5.5はGPT-5系列のエージェント特化版という位置づけ。用途が異なるので直接比較しにくいが、エージェント的なタスクにはGPT-5.5、大規模コンテキストの推論にはGPT-6という使い分けが合理的だ。詳細はGPT-6完全ガイド2026を参照。
Azure OpenAI Serviceで使えるか?
2026年4月24日時点ではOpenAI直のAPI提供が先行している。Azure OpenAI Serviceへの展開は通常1-2週間後になる。
日本語の精度はどうか?
OpenAIの公式ベンチマークに日本語特化のスコアは公開されていない。筆者が日本語でコーディング指示を出した範囲では、GPT-5.4と同等以上の日本語理解度を確認した。ただし、技術系の指示は英語のほうがトークン効率が良く、料金も抑えられる。
まとめ
GPT-5.5はOpenAIが「エージェントの時代」に賭けた最新モデルだ。Terminal-Bench 82.7%という数値が示す通り、コーディングエージェントとしての実力は競合を10ポイント以上引き離している。
料金は前世代の2倍。ここを「高い」と見るか「妥当」と見るかは使い方次第。自分ならこうする:
筆者の推奨構成
- コーディング・エージェントタスク → GPT-5.5(Batch APIで$2.50/$15に抑える)
- 長文の推論・SWEタスク → Claude Opus 4.7(SWE-bench 87.6%)
- 大量のリアルタイム処理 → Gemini 3.1 Pro($2/$12のコスパ)
- テキスト生成・翻訳 → GPT-5.4($2.50/$15で十分な品質)
1つのモデルに全振りする時代は終わった。APIキーを3社分持って、タスクの性質に応じて振り分けるのが2026年4月時点での最適解だ。
ChatGPT PlusでWebUIを触るのに2-3日あれば十分。コーディングで差を感じたらclient.batches.create()に移行する。Batch APIを使え。GPT-5.4と同じコストで5.5の性能が手に入る。