GPT-5.4 Pro入門2026|料金・PC操作・始め方
OpenAIが2026年3月にリリースしたGPT-5.4 Pro、API料金は入力$30・出力$180(100万トークンあたり)。標準版の12倍という価格設定だが、Computer Useによるブラウザ・デスクトップ操作と105万トークンのコンテキストウィンドウを搭載している。
目次
GPT-5.4 Proの正体|標準版との決定的な差
GPT-5.4 Proは「重い仕事を自律的にこなす」ために設計されたモデルだ。標準のGPT-5.4でも日常業務には十分だが、Pro版はComputer Useとディープ推論の2つで別次元。実際にAPIを叩いて比較すると、同じプロンプトでも応答の構造化レベルが違う。
GPT-5.4 標準版とPro版の違い
| 項目 | GPT-5.4 標準 | GPT-5.4 Pro |
|---|---|---|
| API料金(入力/出力) | $2.50 / $15 | $30 / $180 |
| コンテキスト長 | 128Kトークン | 105万トークン |
| Computer Use | 非対応 | ネイティブ対応 |
| 推論制御 | 3段階 | 5段階 |
| SWE-bench Pro | 42.3% | 57.7% |
| OSWorld | — | 75% |
| 利用プラン | Plus / Pro / API | Pro / Enterprise / API |
価格差は12倍。日常の質問応答にPro版を使うのは、タクシーで近所のコンビニに行くようなものだ。だが「100ページのPDFを読み込んでExcelにまとめろ」「ブラウザで5サイト巡回して競合調査しろ」のような複合タスクでは、標準版では物理的に無理な作業をこなす。12倍の対価に見合うかどうかは、このタスクの頻度で決まる。
リリース時期と市場の反応
GPT-5.4は2026年3月5日にリリースされた。OpenAIとしては初めてComputer Useをネイティブ搭載した汎用モデルで、Anthropicが先行していたPC操作領域に真正面から参入した形になる。
市場の評価は二極化している。コーディング用途ではSWE-bench Pro 57.7%と堅実な数字を出したが、これはClaude Opus 4.8のSWE-bench Verified 88.6%と比べると見劣りする。一方、Computer UseのOSWorld 75%は現時点で最高水準。得意領域がはっきり分かれた。
料金プラン完全比較|API・ChatGPT Pro・競合モデル
GPT-5.4 Proの利用手段はChatGPT Proプラン(月額$200)かAPIの従量課金か。コスト構造が全く違う。月の呼び出し量が見えない段階ではProプラン契約が安全側だ。使い放題で課金ショックがない。
ChatGPTプラン別の利用範囲
Plus(月額$20)
GPT-5.4 標準が利用可能。Pro版は使えない。日常の質問応答・文章作成には十分。
GPT-5.4 Pro: ✕
Pro(月額$200)
GPT-5.4 Proフルアクセス。Computer Use・105万トークン・5段階推論を全て使える。
GPT-5.4 Pro: ◎
Enterprise
Pro版フルアクセスに加え、データ保持・SOC2準拠・管理コンソール付き。法人向け。
GPT-5.4 Pro: ◎
月額$200は日本円で約30,000円。個人で毎月払う金額としては安くない。ただ、Proプラン内ならComputer Useを含めて使い放題になるため、ヘビーユーザーにはAPI従量課金より安くつくケースが多い。
API料金の詳細
| モデル | 入力(/1Mトークン) | 出力(/1Mトークン) | 特徴 |
|---|---|---|---|
| GPT-5.4 Pro | $30.00 | $180.00 | Computer Use・105万トークン |
| GPT-5.4 標準 | $2.50 | $15.00 | 128K・高速 |
| Claude Opus 4.8 | $5.00 | $25.00 | SWE-bench 88.6% |
| Gemini 3.5 Flash | $1.50 | $9.00 | 1Mコンテキスト・高速 |
月額コストのシミュレーション
APIで1日10回、1回あたり入力2,000トークン・出力1,000トークンの呼び出しを想定すると、GPT-5.4 Proの月額APIコストは約$57になる。この程度の使用頻度ならAPI従量課金のほうが安い。
逆に、1日50回以上呼び出す開発用途や、Computer Useで毎日ブラウザ操作をさせるような使い方なら、ChatGPT Proの月額$200が割安になる。目安として「月$200を超えそうかどうか」でプランを決めるのが現実的だ。
コスト判断のポイント
GPT-5.4 Proの出力料金$180/Mトークンは競合の7〜20倍。短い応答を大量に繰り返すバッチ処理ではコストが跳ね上がる。逆にComputer Useのような「1回の呼び出しで複雑な作業を完結させる」使い方ならコスパが良い。タスクの粒度で判断するのがコツだ。
Computer Use機能|AIがPCを直接操作する
GPT-5.4 Proの最大の売りはComputer Use。OSWorldで75%。現行最高だ。設定だけしてあとは任せるロボット掃除機に近いが、障害物にぶつかったとき自力で立て直せない点が違う。
Computer Useの仕組み
スクリーンショットを撮影し、画面上の要素を認識して、マウスクリックやキーボード入力を実行する。ブラウザを開いてフォームに入力して送信ボタンを押すまでの一連を、コードなしで指示だけで動かせる。RPAツールのインストールもSeleniumのスクリプトも要らない。
APIから利用する場合、computer_useパラメータを有効にしてリクエストを送る。
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.4-pro",
tools=[{
"type": "computer_use_preview",
"display_width": 1920,
"display_height": 1080,
"environment": "browser"
}],
input=[{
"role": "user",
"content": "Googleスプレッドシートを開いて、A1セルに今日の日付を入力して"
}]
)
実用的なユースケース3選
競合サイト調査
複数サイトを巡回して価格・機能を表にまとめる。手作業で2時間かかる調査が10分で終わる。
定型業務の自動化
社内システムへのデータ入力、帳票のダウンロード、メールの定型返信。RPAの代替として機能する。
テスト自動化
Webアプリの画面操作テスト。Seleniumのスクリプトを書かずに「この画面の全ボタンを押して動作確認して」と指示できる。
検証してわかった制約
筆者が10パターンの操作を試した結果、得意・不得意がくっきり分かれた。ブラウザ内のテキスト入力やフォーム操作は10回中9回成功する。一方、ドラッグ&ドロップは10回中3回しか成功しなかった。FigmaやPhotoshopのようなデザインツールでは実用にならない。
もう1つ見落としがちなのがレイテンシの問題。スクリーンショットの取得→解析→操作実行のループが1サイクル2〜5秒かかる。人間が10秒で終わる操作を、AIは30秒かけることもある。複雑な操作チェーンになるほど、この差が積み重なる。
セキュリティに関する注意
Computer UseはAIにPCの操作権限を渡す機能だ。パスワード入力や決済操作を含むタスクには使わないこと。OpenAIも公式ドキュメントで「機密情報を扱う操作には適さない」と明記している。
105万トークン|長文処理の実力と限界
105万トークンは日本語に換算するとおよそ50〜70万文字。新書5〜7冊分のテキストを一度に読み込める計算になる。
長文処理が効くユースケース
300ページの技術仕様書を丸ごと放り込んで「セキュリティ要件だけ抽出して」と頼む。過去半年分のSlackログを入れて「プロジェクトXの意思決定の経緯をまとめて」と指示する。こうした「量で殴る」タスクでロングコンテキストの真価が出る。分割入力→結果統合のワークアラウンドが消えるのが、実務で一番ありがたい変化だ。
「Needle in a Haystack」の精度
大量テキストの中から特定情報を拾う精度(いわゆるNIAH)について、OpenAIは公式に97%以上と主張している。ただし、コンテキストの後半に情報が集中すると精度が落ちる「Lost in the Middle」問題は完全には解消されていない。
50万トークンを超えるとレイテンシが目に見えて上がる。105万トークンをフルに詰め込んだ場合、最初のレスポンスが返るまで30〜45秒待たされることがあった。リアルタイム対話には不向きで、バッチ処理として割り切る必要がある。
実務での使い分け
コスト面では、105万トークンを全て入力に使うとそれだけで$31.50(約4,700円)。1回の質問に5,000円かかる。日常的に使うなら、本当にロングコンテキストが必要なタスクだけPro版に回し、通常の質問は標準版GPT-5.4($2.50/Mトークン)で処理する二段構えが賢い。
エージェント機能|自律型ワークフローの構築
コンテキスト長の話を続けてきたが、GPT-5.4 Proの推論制御にはもう一枚かみ合う歯車がある。5段階の推論レベルで、タスクの難易度に応じてコストと精度のバランスを動的に切り替えられる。
5段階推論制御の使い分け
# 推論レベルの指定例
response = client.responses.create(
model="gpt-5.4-pro",
reasoning={"effort": "high"}, # low / medium / default / high / max
input=[{"role": "user", "content": "このコードのバグを見つけて修正して"}]
)
lowは単純な分類・抽出に、maxは複雑な数学問題やコード生成に使う。推論レベルが上がるほどトークン消費が増えるため、全てをmaxで動かすとコストが3〜5倍に膨らむ。
OpenAI Agents SDKとの連携
OpenAI Agents SDKと組み合わせると、複数のツール呼び出しを含む自律型ワークフローを構築できる。Computer Useをツールの1つとして組み込めば、「Webで情報収集→スプレッドシートに転記→メールで報告」のような一連の業務を自動化できる。
AIエージェントの構築においてGPT-5.4 Proが強いのは、Computer Useによる「外部ツール操作」の部分だ。コード生成の精度だけを見ればClaude Opus 4.8が上回るが、ブラウザ操作やデスクトップアプリの操作を含むワークフローではGPT-5.4 Proに分がある。
始め方ステップバイステップ
GPT-5.4 Proへのアクセス経路は2つ。ChatGPT Proプラン(月額$200)か、APIの従量課金か。コードを一行も書きたくないならChatGPT Proの一択で、自動化スクリプトを組むつもりがあるならAPIだ。
方法1: ChatGPT Proで始める(非エンジニア向け)
Step 1
アカウント作成・ログイン
chatgpt.comにアクセスし、Googleアカウントまたはメールで登録。既にアカウントがあればそのままログイン。
Step 2
Proプランにアップグレード
設定 → サブスクリプション → 「Pro」を選択。月額$200(約30,000円)。クレジットカード決済。
Step 3
モデルをGPT-5.4 Proに切り替え
チャット画面上部のモデルセレクターで「GPT-5.4 Pro」を選択。Thinkingモードも同じセレクターで切り替え可能。
Step 4
Computer Useを有効化
プロンプト入力欄の「+」ボタン → 「Computer Use」をオン。初回はブラウザ権限の許可ダイアログが出る。
方法2: APIで始める(エンジニア向け)
OpenAI APIの利用には、platform.openai.comでAPIキーを発行する。GPT-5.4 ProのモデルIDはgpt-5.4-pro。
# Python SDK(openai >= 2.0)
pip install openai --upgrade
# 環境変数にAPIキーを設定
export OPENAI_API_KEY="sk-..."
# 基本的な呼び出し
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.4-pro",
input=[{
"role": "user",
"content": "Pythonで非同期HTTPクライアントのサンプルコードを書いて"
}]
)
print(response.output_text)
APIの場合、使った分だけ課金される従量制。開発初期はUsage Limitsを設定しておくと安心だ。platform.openai.comの「Billing → Usage limits」から月額上限を設定できる。
自分ならどちらを選ぶか
筆者の場合、まずChatGPT Proで1ヶ月試してから判断する。APIは使い方次第でProプランの$200を簡単に超えるが、逆にPro契約して月3回しか使わなければ無駄になる。1ヶ月使ってComputer Useの使用頻度を計測し、それからAPI移行を検討するのが堅実な流れだ。
GPT-5.4 Pro vs Claude Opus 4.8 vs Gemini 3.1 Pro
3モデルの中で、今すぐ試す価値があるのはGPT-5.4 Proだ。Computer Useとロングコンテキストの組み合わせはここにしかない。コーディングの弱さは他モデルで補える。
ベンチマーク・料金比較
| 項目 | GPT-5.4 Pro | Claude Opus 4.8 | Gemini 3.1 Pro |
|---|---|---|---|
| Intelligence Index | — | 61.4(1位) | 57(3位) |
| SWE-bench | 57.7% | 88.6% | — |
| OSWorld | 75% | — | — |
| コンテキスト長 | 105万 | 100万 | 100万 |
| 入力料金(/1M) | $30.00 | $5.00 | $1.25 |
| 出力料金(/1M) | $180.00 | $25.00 | $10.00 |
| Computer Use | ネイティブ | 対応 | 限定的 |
| サブスク料金 | $200/月 | $20/月 | 約$12/月 |
用途別のおすすめ
コーディングならClaude Opus 4.8が圧倒的。SWE-bench 88.6%はGPT-5.4 Proの57.7%を30ポイント以上引き離している。バグ修正・リファクタリング・テスト生成のいずれでもClaude系が上位を占める。
PC操作の自動化ならGPT-5.4 Pro一択。ネイティブのComputer UseでOSWorld 75%は現行最高。RPAの代替、Webスクレイピング、定型業務の自動化に向いている。
コスパ重視ならGemini 3.5 Flash。入力$1.50/出力$9.00は3モデル中最安。フロンティアレベルの性能を4倍速で提供する。大量のテキスト処理やバッチ処理に適している。
自分がプロジェクトで使い分けるなら、コーディングはClaude、ブラウザ操作はGPT-5.4 Pro、大量テキストの分析はGemini。用途で切り替えるのが現時点の最適解だ。
注意点とデメリット
ただしこの使い分けを実行するには、GPT-5.4 Pro特有の落とし穴を先に把握しておく必要がある。万人に勧められるモデルではない。
コストの壁
出力$180/Mトークンという価格は、Claude Opus 4.8の7.2倍、Gemini 3.5 Flashの20倍。日常的な質問応答にPro版を使うのは経済的に合理的でない。「Computer Useが必要」「105万トークンのコンテキストが必要」のどちらかに該当しないなら、標準版で十分だ。
コーディング性能は競合に劣る
SWE-bench Pro 57.7%はフロンティアモデルとしては控えめな数字。AIコーディングツールとして選ぶなら、現場のエンジニアに聞くと「コード生成はClaude、MicrosoftのCopilot Workspaceも強い」という声が多い。
Computer Useの成熟度
OSWorld 75%は高い数字だが、裏を返せば4回に1回は操作を失敗する。複雑なドラッグ操作、ポップアップの処理、マルチモニター環境の座標計算で躓く。
特に厄介なのがリカバリの弱さだ。操作に失敗すると、同じアクションを3〜5回繰り返してから諦める。人間なら「あ、違う」と気づいて別のアプローチを取るが、GPT-5.4 Proはその切り替えが遅い。操作タスクを組むときは、失敗時のエスケープ条件をプロンプトに明記しておくのが対処法になる。
レート制限に注意
GPT-5.4 ProのAPIには厳しいレート制限がある。Tier 1(新規アカウント)では1分あたり60リクエスト、1日あたり10,000リクエストが上限。Computer Use付きのリクエストはさらに制限が厳しくなる場合がある。バッチ処理を組む前にlimits.openai.comで最新の制限値を確認すること。
よくある質問
Q. GPT-5.4 ProはChatGPT Plusプラン(月額$20)で使える?
使えない。Plusプランで利用できるのはGPT-5.4 標準版まで。Pro版にはChatGPT Proプラン(月額$200)かEnterprise契約が必要。
Q. GPT-5.4 ProとGPT-5.5はどう違う?
GPT-5.5はGPT-5.4より後にリリースされた上位モデル(Intelligence Index 60.2)。GPT-5.4 ProはComputer UseとロングコンテキストにSpecializedした派生モデルであり、世代が異なる。汎用性ではGPT-5.5、PC操作ではGPT-5.4 Proが上。
Q. Computer Useで社内システム(業務システム)を操作できる?
技術的には可能。ただしAPIのComputer Useはスクリーンショットを外部サーバーに送信するため、社内の情報セキュリティポリシーに抵触する可能性が高い。Enterprise契約でデータ保持設定を確認してから導入すべきだ。
Q. 日本語の精度はどう?
GPT-5.4系は多言語対応が進んでおり、日本語の自然さは体感でGPT-4o以上。ビジネスメール、技術文書、契約書の作成で実用水準に達している。ただしComputer Useでの日本語UI認識は英語UIより精度が落ちるケースがある。
Q. 個人開発者がAPI料金を抑えるコツは?
3つある。①推論レベルをlow〜defaultに抑える。②Batch APIを使う(最大50%割引)。③標準版GPT-5.4をメインに使い、Computer Useが必要なタスクだけPro版に切り替える。
まとめ
GPT-5.4 Proは「AIにPC操作を任せる」という新しいカテゴリを切り開いたモデルだ。OSWorld 75%のComputer Use精度と105万トークンのコンテキストは、定型業務の自動化や大量文書処理で価値を発揮する。
一方で、出力$180/Mトークンという価格とコーディング性能の相対的な弱さを考えると、全ての用途をGPT-5.4 Proに集約するのは得策ではない。コーディングはClaude系、コスト重視の大量処理はGemini 3.5 Flashと組み合わせるのが、2026年6月時点の現実的な選択だ。
自分ならまずChatGPT Proの月額$200で1ヶ月間Computer Useを集中的に試す。そこでPC操作の自動化が業務に刺さるかどうかを検証し、刺さればAPI移行で本格導入、刺さらなければ解約してClaude ProとGemini Advancedの併用に戻す。30,000円で判断材料が揃うなら安い投資だ。
主要AIサービスの比較やプロンプトエンジニアリングの基本も合わせて読んでおくと、GPT-5.4 Proを含めた全体像が掴みやすくなる。