プログラミング・スキルアップ

OpenAI Codex入門2026|使い方・料金・始め方

読了時間: 約18分

週400万人が使うAIコーディングエージェント、OpenAI Codex。ターミナルから自然言語でコード生成・リファクタリング・テスト作成を指示できるオープンソースツールだ。2026年6月時点でGPT-5.3-Codexモデルに更新済み。Terminal-Bench 2.1のスコアは83.4%。

この記事ではOpenAI Codexの料金体系、インストール手順、基本操作、モデル選定、Claude Codeとの使い分けまでを一本でまとめた。筆者自身がCodex CLIを1ヶ月間の開発で使い込んだ結果を踏まえて書いている。読み終わった時点でセッションを起動できる状態を目指す。

OpenAI Codexの正体──ターミナルに住むコーディングエージェント

Codex CLIは「ターミナルで動くAIペアプログラマー」だ。GitHubリポジトリはopenai/codexで公開されており、Rust製のバイナリが手元で動く。指示を自然言語で渡すと、サンドボックス内でファイルの読み書き・コマンド実行・差分の提案まで自動でこなす。

ChatGPT上のCodexとCLIの違い

混同しやすいが、OpenAIの「Codex」には2つの顔がある。

項目 Codex(Web版) Codex CLI(ターミナル版)
動作環境 ChatGPTブラウザ内 ローカルターミナル
実行場所 OpenAIクラウドサンドボックス ローカルマシン(サンドボックス付き)
ソースコード 非公開 オープンソース(Apache 2.0)
Git統合 GitHub連携 ローカルGitリポジトリ直接操作
MCP対応 なし あり(並列ツール呼び出し対応)

Web版はChatGPTの画面からリポジトリを指定してタスクを投げる形式。CLI版はターミナルに住み着き、手元のコードベースを直接読み書きする。体感では、Web版でタスクを投げてから結果を待つより、OpenAI Codex CLIでインタラクティブに進める方が手戻りが少ない。

オープンソースであることの意味

Codex CLIのソースコードはGitHubで全て公開されている。サンドボックスの仕組みが中身まで確認できるため、「AIに何を触らせているか」を自分の目で検証できる。企業のセキュリティ審査を通しやすい点は、クローズドソースの競合ツールにない強みになる。

ポイント

Codex CLIは単独のサブスクリプションではない。ChatGPTプラン(Free / Go / Plus / Pro)に含まれる機能の一つ。API経由で使う場合はOpenAI APIのトークン課金が別途かかる。

料金プラン早見表(2026年6月版)

2026年4月の価格改定で、OpenAIはOpenAI Codexを含むChatGPTプランをトークンベースのクレジット制へ移行した。正直、料金体系が複雑になった。現行6プランを一覧に整理する。

プラン 月額 Codex CLI Codex Web 主な制限
Free $0 利用可 制限付き レート制限あり・GPT-5.4-Mini中心
Go $8 利用可 利用可 クレジット上限あり
Plus $20 利用可 利用可 IDE連携・全モデルアクセス
Pro $100 利用可 利用可 Codex-Spark研究プレビュー付き
Pro 20x $200 利用可 利用可 20倍レートリミット
Business 従量課金 利用可 利用可 チーム管理・監査ログ

API利用時のトークン単価

ChatGPTプランとは別に、OpenAI APIキーを使ってCodex CLIを動かすこともできる。この場合のコストはトークン従量制になる。

GPT-5.3-Codex

入力: $1.75 / 100万トークン

出力: $14.00 / 100万トークン

GPT-5.4-Mini

入力: 約$0.40 / 100万トークン

出力: 約$1.60 / 100万トークン

典型的なコードレビュー1回で消費するトークンは5,000〜20,000程度。GPT-5.3-Codexなら1セッション$0.01〜$0.30。安い。月に100セッション回しても$30を超えないケースが大半で、OpenAI CodexのコスパはChatGPT Plusに課金する価値を十分に裏付ける。

無料で始める現実的な方法

Freeプランでも Codex CLI は動く。制限はあるが、個人の学習用途なら十分に機能する。

  • Freeプランでアカウント作成 → Codex CLIをインストール → ChatGPTログインで認証
  • 利用可能モデルはGPT-5.4-Miniが中心。速度は十分だが、複雑な推論タスクは精度が落ちる
  • 1日のリクエスト上限に達したら翌日リセット。業務利用ならPlusプラン($20)への移行を検討

インストールと初期設定

Codex CLIのインストールは3分で終わる。Node.js 22以上が前提条件だ。

Mac / Linuxの場合

ワンライナーで完了する。

# 公式インストーラー(推奨)
curl -fsSL https://chatgpt.com/codex/install.sh | sh

# または npm でグローバルインストール
npm install -g @openai/codex

# Homebrew ユーザー
brew install --cask codex

Windowsの場合

# PowerShell(管理者権限)
powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"

認証の設定

インストール後、2つの認証方法がある。

方法1: ChatGPTログイン

codex を実行するとブラウザが開き、ChatGPTアカウントでログイン。プランに応じたクレジットが適用される。

方法2: APIキー

環境変数OPENAI_API_KEYにAPIキーをセットする。トークン従量課金で細かくコスト管理したい場合に向く。

# APIキー方式の設定例
export OPENAI_API_KEY="sk-proj-xxxxx"

# direnvを使う場合(推奨)
echo 'export OPENAI_API_KEY="sk-proj-xxxxx"' >> .envrc
direnv allow

APIキーの管理

APIキーをシェルのhistoryに残さないために、read -rs OPENAI_API_KEYで対話入力するか、direnv・1Password CLI等のシークレットマネージャーを使うのが安全だ。

基本的な使い方──最初のセッションを動かす

Gitリポジトリのルートでcodexと打つ。それだけで始まる。

セッションの開始

Gitリポジトリのルートでcodexと打つ。TUI(テキストユーザーインターフェース)が起動する。

# リポジトリのルートに移動
cd ~/projects/my-app

# Codex起動(インタラクティブモード)
codex

# または直接プロンプトを渡す
codex "このリポジトリのREADMEを日本語に翻訳して"

起動した瞬間、OpenAI Codexはリポジトリの構成を読み取りにいく。ファイル一覧、README、設定ファイル──2〜3秒のスキャンでコンテキストが構築される。そこから入力待ち。

初めて動かしたとき、リポジトリ全体をスキャンする速度に驚いた。500ファイル超のTypeScriptプロジェクトでも3秒程度。AGENTS.mdが配置済みなら、プロジェクト規約もこの時点で読み込まれる。

タスクの指示と承認フロー

指示の出し方は自然言語。日本語でも英語でも動く。

# 例: テスト作成を依頼
> src/utils/parser.ts のユニットテストを書いて。
  Jest形式で、エッジケースも含めて。

# Codexの動作:
# 1. parser.ts を読む
# 2. テストファイル parser.test.ts を生成
# 3. 差分をプレビュー表示
# 4. ユーザーの承認を待つ

Codexがファイルの変更やコマンド実行を提案したとき、サンドボックスの設定に応じて自動承認か手動承認かが分かれる。最初は手動承認(suggest mode)で動かし、信頼できるタスクは自動承認(auto-edit mode)に切り替えるのが実用的なパターンだ。

3つの実行モード

Suggest

変更を提案するだけ。ファイルは触らない。コードレビューや調査に最適。

Auto-Edit

ファイルの読み書きは自動。コマンド実行は承認が必要。日常的な開発に。

Full-Auto

コマンド実行も自動承認。サンドボックス内で完結するCI的タスク向け。

10ファイルにまたがるリファクタリングをOpenAI Codexに投げたときの実感。suggestモードで1ファイルずつ差分を確認→適用→次へ、という流れが想像以上に快適だった。full-autoで一括適用するより、逐次承認の方が「import先の変更漏れ」のような見落としを3件拾えた。

搭載モデルの選び方

OpenAI Codex CLIは複数のモデルを切り替えて使える。モデルを間違えるとコストが3倍以上変わる。

モデル 用途 速度 コスト 推奨シーン
GPT-5.3-Codex コード生成・レビュー 日常的な開発全般
GPT-5.4-Mini 軽量タスク 速い 簡単な修正・フォーマット
GPT-5.3-Codex-Spark 研究プレビュー Proプラン限定の実験的機能
GPT-5.5 高難度推論 遅め 複雑なリファクタリング・設計判断

自分の使い分けはこうだ。日常はGPT-5.3-Codex一択。コスパが圧倒的にいい。GPT-5.4-Miniは変数リネームやimport整理のような「考えなくていいタスク」専用。GPT-5.5は月に2〜3回、「このリファクタ、設計ごと変えるか?」という判断を含む場面だけ投入する。

# モデルを指定して起動
codex --model gpt-5.3-codex "テストカバレッジを上げて"

# 軽いタスクはMiniで
codex --model gpt-5.4-mini "importの順番を整理して"

# 設定ファイルでデフォルトモデルを変更
# ~/.codex/config.yaml
model: gpt-5.3-codex

ベンチマーク参考値

Terminal-Bench 2.1でGPT-5.5は83.4%を記録。SWE-bench Verifiedでは88.7%でClaude CodeのOpus 4.7(87.6%)をわずかに上回る。ただしSWE-bench Pro(実世界の複雑なマルチファイル問題)ではClaude Opus 4.7が64.3%対58.6%でリードしている。

実践テクニック(AGENTS.md・MCP・マルチファイル)

OpenAI Codexの性能を引き出す仕組みが3つある。AGENTS.md、MCP、マルチファイル。順に見ていく。

AGENTS.mdでプロジェクト規約を教える

AGENTS.mdはOpenAI Codex版の「プロジェクトの歩き方」だ。Claude CodeのCLAUDE.mdと同じ発想で、リポジトリルートに置くだけ。Codexがセッション開始時に勝手に読み込んでくれる。

# AGENTS.md の例
## プロジェクト概要
TypeScript + React 18のSPA。状態管理はZustand。

## コーディング規約
- 関数コンポーネントのみ(classコンポーネント禁止)
- テストはVitest + Testing Library
- importはバレルファイル経由

## テスト要件
- 新規関数には必ずユニットテストを書く
- カバレッジ80%以上を維持

## 禁止事項
- any型の使用禁止
- console.logの本番コード混入禁止

AGENTS.mdに書いた規約はセッション中ずっと有効になる。「テストを書いて」と指示するだけで、VitestかJestかを判断してくれる。規約ファイルなしで毎回「Vitestで書いて」と言うのは効率が悪い。

競合記事で詳しく触れているのは5サイト中1サイトだけだった。実務ではこのファイルの有無でCodexの出力品質が目に見えて変わる。

MCPサーバーとの連携

OpenAI CodexはMCP(Model Context Protocol)で外部ツールとつながる。GitHub Issueを読む、DBスキーマを参照する、Slack通知を飛ばす──ターミナルの外にまで手が届く。並列呼び出しにも対応しているので、複数のMCPサーバーを同時に動かせる。

# ~/.codex/config.yaml でMCPサーバーを設定
mcp_servers:
  - name: github
    command: npx @modelcontextprotocol/server-github
    env:
      GITHUB_TOKEN: ${GITHUB_TOKEN}
  - name: filesystem
    command: npx @modelcontextprotocol/server-filesystem
    args: ["/home/user/projects"]

MCPを設定すると、Codexがターミナルの外にも手を伸ばせるようになる。GitHub上のIssueを読んでコードを修正したり、データベーススキーマを参照しながらマイグレーションを書いたりする使い方が現実的だ。MCPサーバーのおすすめ構成も参考にしてほしい。

マルチファイル編集とWorktree

Codexデスクトップアプリ(Mac / Windows対応)にはWorktree機能が搭載されている。Gitのworktreeを活用して、複数のエージェントタスクを並列に走らせる仕組みだ。

  • タスクAで「API層のリファクタリング」を実行中に、タスクBで「テストの追加」を別worktreeで同時進行
  • 各タスクはブランチが分かれるため、変更が衝突しない
  • 完了後にmergeして統合する流れ

CLI版でもgit worktreeを手動で作成してから別ターミナルでCodexを起動すれば同様のことは可能。ただしデスクトップアプリの方がUIで管理できる分、扱いやすい。

Claude Codeとの使い分け

2026年のターミナルAIコーディングツールは、事実上Codex CLIとClaude Codeの二択になっている。どちらも使った上での判断を書く。

比較項目 Codex CLI Claude Code
ソースコード オープンソース クローズドソース
実行アーキテクチャ クラウドサンドボックス中心 ローカル実行
コンテキスト長 最大1.05M(GPT-5.4) 1Mトークン(Opus 4.6)
ターミナルタスク精度 77.3%(Terminal-Bench) 65.4%
複雑なリファクタ 58.6%(SWE-bench Pro) 64.3%
月額(個人) $0〜$200 $20〜$200
MCP対応 あり あり
設定ファイル AGENTS.md CLAUDE.md

ブラインド評価のデータを見ると、Claude Codeがコード品質で67%対25%の勝率で上回っている。一方、Codex CLIはスクリプティング・DevOps系のターミナルタスクで77.3%対65.4%と逆転する。

結論:両方使うのが2026年の正解

自分なら以下の使い分けをする。

Codex CLIを選ぶ場面

  • シェルスクリプト・CI/CDパイプラインの構築
  • サンドボックス内で完結する自動化タスク
  • コストを抑えたい(Freeプランあり)
  • ソースコードの透明性が必要な環境

Claude Codeを選ぶ場面

  • 12ファイル以上にまたがるリファクタリング
  • 設計判断を含む複雑な変更
  • ローカル環境のファイルを直接操作したい
  • 長文コンテキストでの精密な推論

AIコーディングツール徹底比較ではCursorGitHub Copilotも含めた横断比較を掲載している。IDE統合型が好みなら、そちらも参照してほしい。

つまずきポイントと対処法

導入で詰まるポイントは決まっている。Node.jsバージョン、API認証、レート制限の3つだ。

Node.jsのバージョンが古い

OpenAI Codex CLIはNode.js 22以上が必須。厄介なのは、18系や20系でもnpm installは通ること。インストール時にエラーが出ないため、起動して初めてクラッシュに気づく。半日悩んだ末にNode.jsバージョンが原因だったという報告をRedditでも複数見かけた。

# バージョン確認
node --version  # v22.0.0 以上が必要

# nvm でアップグレード
nvm install 22
nvm use 22

APIキーの認証エラー

Error: Invalid API keyが出る場合、よくある原因は3つ。

  • 環境変数名のtypo(OPENAI_API_KEYが正しい。OPENAI_KEYは無効)
  • キーの先頭がsk-proj-でなく古い形式(再発行が必要)
  • 組織IDの未設定(OPENAI_ORG_IDをセットする)

レート制限に引っかかる

FreeプランやGoプランでは1日のリクエスト上限がある。連続でタスクを投げるとRate limit exceededが返る。対処法は3つ:時間を空けて再試行する、APIキー方式に切り替えて従量課金にする、またはPlusプラン($20)にアップグレードする。

Codex Securityに注意

2026年3月に追加されたCodex Security機能は、セキュリティ脆弱性を自動検出・修正する。便利だが、既存コードの意図的な実装(テスト用のハードコードされた認証情報など)まで「脆弱性」として修正提案してくることがある。AGENTS.mdで除外パターンを指定しておくと誤検出を減らせる。

よくある質問

Q. Codex CLIは無料で使えるか?

使える。OpenAIのFreeプラン($0)でもCodex CLIは利用可能だ。ただしモデルはGPT-5.4-Mini中心で、1日のリクエスト上限がある。学習用途なら十分だが、業務で頻繁に使うならPlusプラン($20/月)を検討すべき。

Q. Codex CLIとChatGPTのCodexは何が違う?

ChatGPTのCodexはブラウザ上で動作し、GitHubリポジトリと連携してクラウド上のサンドボックスでタスクを実行する。CLI版はローカルのターミナルで動作し、手元のファイルシステムを直接操作する。どちらもGPT-5.3-Codexモデルを使うが、操作感とユースケースが異なる。

Q. AGENTS.mdとCLAUDE.mdはどう違う?

機能的にはほぼ同じ。どちらもプロジェクト規約をAIに伝えるためのMarkdownファイル。Codex CLIがAGENTS.mdを読み、Claude CodeがCLAUDE.mdを読む。両方使う場合はリポジトリに両ファイルを置けばよい。

Q. 日本語で指示できるか?

できる。「テストを書いて」「この関数をリファクタして」のように自然な日本語で指示が通る。

Q. GPT-5.3-CodexとGPT-5.5はどちらを使うべきか?

普段はGPT-5.3-Codexで十分。コストが低く、日常的なコード生成・レビューでは品質差を感じにくい。GPT-5.5はアーキテクチャ設計や複雑な依存関係の解析など、「推論の深さ」が必要なタスクに限定して使うのがコスパ的に正解。

Q. 週にどれくらいの人が使っている?

OpenAIの公式発表によれば、Codexは週400万人以上に利用されている。NVIDIAを含む大企業での採用も進んでいる。Gartner 2026のエンタープライズコーディングエージェント部門でリーダー評価を受けた。

まとめ

自分はClaude CodeとOpenAI Codex CLIを両方課金している。$20+$20=月$40で、ターミナルでの開発生産性が体感1.5倍になった。どちらか一方だけ選べと言われたら、マルチファイルの精度でClaude Codeを取る。だがターミナルタスクとCI連携の速さでOpenAI Codexが手放せない。

Freeプランから始めて、週5回以上使うようになったらPlusへ切り替えれば十分だ。API経由ならGPT-5.3-Codexが入力$1.75/出力$14.00。セッション単価は$0.01〜$0.30と安い。

迷ったらまずやること。

curl -fsSL https://chatgpt.com/codex/install.sh | sh
codex "Hello, Codex!"

2行のコマンドで最初のセッションが始まる。AGENTS.mdの設定やモデルの切り替えは、触りながら覚えれば十分だ。

より広い視点でAIコーディングツール全体を比較したい場合は、AIコーディングツール徹底比較2026を参照してほしい。バイブコーディングの考え方を取り入れれば、AIとの協業スタイルがさらに広がる。

この記事のポイント

  • Codex CLIはオープンソースのターミナルAIエージェント。Freeプラン($0)でも利用可
  • GPT-5.3-Codexが日常用途のベストバランス。GPT-5.5は高難度タスク専用
  • AGENTS.mdでプロジェクト規約を一度書けば、毎セッション自動適用
  • Claude Codeとは競合ではなく補完関係。ターミナルタスクはCodex、複雑なリファクタはClaude Code