最終更新日: 2025/10/06
OpenAI 公式 Models ページ をもとに OpenAI が提供するモデルについて日本語でまとめています。料金や仕様は変更される可能性があるため最新情報は必ず公式サイトでご確認ください。
- 単位 $ はすべて US ドルです
- 概要
- ピックアップモデル
- フロンティアモデル
- オープンウェイトモデル
- 特化モデル
- リアルタイム・音声モデル
- その他モデル
- 価格
- モダリティ
- 利用可能なエンドポイント
- 主要機能
- Responses API で利用できるツール
- スナップショットとエイリアス
- レートリミット
- 参考資料
OpenAI API は多様なワークロードに対応する複数のモデル群で構成されています。モデルごとに対応モダリティ、推論能力、料金体系、サービスポリシーが異なります。開発用途に応じてモデルを選択し、必要であればファインチューニングやツール連携を組み合わせて利用できます。
カテゴリ | 概要 |
---|---|
ピックアップモデル | 最新世代の代表的な汎用モデル。コーディングやエージェント用途を含む幅広いタスクを想定。 |
フロンティアモデル | 推論性能や指示追従性が高い大規模モデル。ツール呼び出しや長いコンテキスト処理を重視。 |
オープンウェイトモデル | Apache 2.0 ライセンスのオープンウェイトモデル。ローカル環境や独自デプロイ向け。 |
その他 | モデレーション、 Embeddings、音声、画像生成など専門タスク向けモデル(ここでは概要のみ)。 |
最新の代表モデル。推論トークン( reasoning tokens )をサポートし、テキストと画像を入力できます。
コーディング・推論・ドメインを跨いだエージェント的タスクに向いたフラグシップモデル。
- Reasoning: 非常に高い(推論トークン対応)
- Speed: 中
- 価格(1M トークンあたり): 入力 $1.25 / キャッシュ入力 $0.125 / 出力 $10.00
- コンテキストウィンドウ: 400,000
- 最大出力トークン: 128,000
- ナレッジカットオフ: 2024/09/30
- 入力モダリティ: テキスト・画像
- 出力モダリティ: テキスト
- 特徴: 高精度のコーディング支援とエージェント的操作に最適
GPT-5 のより高速でコスト効率のよいバージョン。よく定義されたタスクや精密なプロンプトに向いています。
- Reasoning: 高(推論トークン対応)
- Speed: 高
- 価格(1M トークンあたり): 入力 $0.25 / キャッシュ入力 $0.025 / 出力 $2.00
- コンテキストウィンドウ: 400,000
- 最大出力トークン: 128,000
- ナレッジカットオフ: 2024/05/31
- 入力モダリティ: テキスト・画像
- 出力モダリティ: テキスト
- 特徴: 定型業務や大量バッチ処理向け。
GPT-5 の最も高速で安価なバージョン。要約や分類のタスクに向いています。
- Reasoning: 普通(推論トークン対応)
- Speed: 非常に高速
- 価格(1M トークンあたり): 入力 $0.05 / キャッシュ入力 $0.005 / 出力 $0.40
- コンテキストウィンドウ: 400,000
- 最大出力トークン: 128,000
- ナレッジカットオフ: 2024/05/31
- 入力モダリティ: テキスト・画像
- 出力モダリティ: テキスト
- 特徴: レイテンシー重視の分類・要約パイプラインに最適。
高性能な大規模モデル群。複雑なツールコールや長文指示への対応を想定しています。
(説明はピックアップモデルの項をご覧ください)
(説明はピックアップモデルの項をご覧ください)
(説明はピックアップモデルの項をご覧ください)
GPT-5 のより賢く正確なレスポンスを返すバージョン。計算資源を多く使いよりよい答えを提供します。 API レスポンスを返す前に複数ステップのアクションを可能とするために Responses API 限定。
- Reasoning: 最高(
reasoning.effort: high
固定) - Speed: 低(シリーズ中最も遅い)
- 価格(1M トークンあたり): 入力 $15.00 / 出力 $120.00
- コンテキストウィンドウ: 400,000
- 最大出力トークン: 272,000
- ナレッジカットオフ: 2024/09/30
- 入力モダリティ: テキスト・画像
- 出力モダリティ: テキスト
- 特徴: 難しい問題に対応できるよう設計されておりリクエスト処理に数分かかることもある。タイムアウトを避けるにはバックグラウンドモードでの利用が推奨される。
指示追従とツールコールに最適化された非推論モデル。低レイテンシー重視。
- Reasoning / Intelligence: 非常に高い(推論ステップなし)
- Speed: 中
- 価格(1M トークンあたり): 入力 $2.00 / キャッシュ入力 $0.50 / 出力 $8.00
- コンテキストウィンドウ: 1,047,576
- 最大出力トークン: 32,768
- ナレッジカットオフ: 2024/06/01
- 入力モダリティ: テキスト・画像
- 出力モダリティ: テキスト
- 特徴: 推論トークンを使用せずリアルタイム性を優先。複雑なタスクには GPT-5 が推奨されます。
Apache 2.0 ライセンスで公開されているモデルウェイト。 HuggingFace から取得し、ローカル/オンプレミスでカスタマイズ・推論可能です。
OpenAI の最も強力なオープンウェイトモデル。 H100 GPU 1枚で動作可能な設計。 117B パラメータ( 5.1B アクティブ)。
- Reasoning: 非常に高い(推論トークン対応)
- Speed: 中
- 価格: API 課金なし(ダウンロード提供)
- コンテキストウィンドウ: 131,072
- 最大出力トークン: 131,072
- ナレッジカットオフ: 2024/06/01
- 入力モダリティ: テキスト
- 出力モダリティ: テキスト
- 主な特徴:
- Apache 2.0 ライセンスで自由に利用・再配布可能
- 推論負荷を調整可能(低/中/高)
- 推論過程を追跡できる完全な Chain-of-Thought
- ファインチューニングやエージェント用途(ファンクションコーリング・ウェブブラウジング・ Python コード実行・ Structured outputs 等)に対応
レイテンシの低い、中サイズのオープンウェイトモデル。ローカルや特化したユースケース向き。 21B パラメータ( 3.6B アクティブパラメータ)。
- Reasoning: 非常に高い(推論トークン対応)
- Speed: 中
- 価格: API 課金なし(オープンウェイト/ダウンロード提供)
- コンテキストウィンドウ: 131,072
- 最大出力トークン: 131,072
- ナレッジカットオフ: 2024/06/01
- 入力モダリティ: テキスト
- 出力モダリティ: テキスト
- 主な特徴:
- Apache 2.0 ライセンス
- 推論負荷を調整可能(低/中/高)
- 推論過程を追跡できる完全な Chain-of-Thought
- ファインチューニングやエージェント用途(ファンクションコーリング・ウェブブラウジング・ Python コード実行・ Structured outputs 等)に対応
同期した音声付きの動画を生成するフラッグシップ動画モデル。自然言語や画像の指示からリッチで動的なクリップを作成できます。
- Performance: 高
- Speed: 低
- 価格(動画生成): 1 秒あたり $0.10 (縦長: 720x1280 / 横長: 1280x720 )
- 入力モダリティ: テキスト・画像
- 出力モダリティ: 動画
- 特徴: 汎用的な動画生成用途向け
最も高度な同期した音声付きの動画生成モデル。自然言語や画像の指示から映画品質のクリップを生成します。
- Performance: 最高
- Speed: 最も低速
- 価格(動画生成): 1 秒あたり $0.30 (縦長: 720x1280 / 横長: 1280x720 )、$0.50(縦長: 1024x1792 / 横長: 1792x1024 )
- 入力モダリティ: テキスト・画像
- 出力モダリティ: 動画
- o3-deep-research
- o4-mini-deep-research
- GPT Image 1
- gpt-image-1-mini
- DALL·E 3
- GPT-4o mini TTS
- GPT-4o Transcribe
- GPT-4o mini Transcribe
音声とテキストの双方向ストリーミングに特化した初の一般提供リアルタイムモデル。WebRTC、WebSocket、SIP 接続を介して応答します。
- 価格
- テキストトークン / 1M: 入力 $4.00 / キャッシュ入力 $0.40 / 出力 $16.00
- 音声トークン / 1M: 入力 $32.00 / キャッシュ入力 $0.40 / 出力 $64.00
- コンテキストウィンドウ: 32,000
- 最大出力トークン: 4,096
- ナレッジカットオフ: 2023/10/01
- 入力モダリティ: テキスト・音声・画像
- 出力モダリティ: テキスト・音声
gpt-realtime のコスト効率のよいバージョン。 WebRTC / WebSocket / SIP 接続を通じて音声・テキストを扱えます。
- 価格
- テキストトークン / 1M: 入力 $0.60 / キャッシュ入力 $0.06 / 出力 $2.40
- 音声トークン / 1M: 入力 $10.00 / キャッシュ入力 $0.30 / 出力 $20.00
- 画像トークン / 1M: 入力 $0.80 / キャッシュ入力 $0.08
- コンテキストウィンドウ: 32,000
- 最大出力トークン: 4,096
- ナレッジカットオフ: 2023/10/01
- 入力モダリティ: テキスト・画像・音声
- 出力モダリティ: テキスト・音声
Chat Completions REST API で利用できる初の一般提供音声モデル。テキストと音声の入力・出力に対応します。
- 料金
- テキストトークン / 1M: 入力 $2.50 / 出力 $10.00
- 音声トークン / 1M: 入力 $40.00 / 出力 $80.00
- コンテキストウィンドウ: 128,000
- 最大出力トークン: 16,384
- ナレッジカットオフ: 2023/10/01
- 入力モダリティ: テキスト・音声
- 出力モダリティ: テキスト・音声
Chat Completions REST API で利用できる gpt-audio のコスト効率のよいバージョン。テキストと音声の双方向入出力を低コストで提供します。
- 料金
- テキストトークン / 1M: 入力 $0.60 / 出力 $2.40
- 音声トークン / 1M: 入力 $10.00 / 出力 $20.00
- コンテキストウィンドウ: 128,000
- 最大出力トークン: 16,384
- ナレッジカットオフ: 2023/10/01
- 入力モダリティ: テキスト・音声
- 出力モダリティ: テキスト・音声
Codex (や Codex の類似環境)でのエージェント的コーディングタスクに最適化された GPT-5 の 1 バージョン。 Responses API 限定で提供され、定期的にスナップショットが更新されます。
- Reasoning: 非常に高い(推論トークン対応)
- Speed: 中
- 価格(1M トークンあたり): 入力 $1.25 / キャッシュ入力 $0.125 / 出力 $10.00
- コンテキストウィンドウ: 400,000
- 最大出力トークン: 128,000
- ナレッジカットオフ: 2024/09/30
- 入力モダリティ: テキスト・画像
- 出力モダリティ: テキスト
- o3
- o4-mini
- GPT-4.1 mini
- GPT-4.1 nano
- o1-pro
- computer-use-preview
- GPT-4o mini Search Preview
- GPT-4o Search Preview
- GPT-4.5 Preview (deprecated)
- o3-mini
- GPT-4o mini Audio
- GPT-4o mini Realtime
- o1
- omni-moderation
- o1-mini (deprecated)
- o1 Preview (deprecated)
- GPT-4o
- GPT-4o Audio
- GPT-4o mini
- GPT-4o Realtime
- GPT-4o Turbo
- babbage-002
- ChatGPT-4o
- codex-mini-latest
- DALL·E 2
- davinci-002
- GPT-3.5 Turbo
- GPT-4
- GPT-4 Turbo Preview
- GPT-5 Chat
- text-embedding-3-large
- text-embedding-3-small
- text-embedding-ada-002
- text-moderation (deprecated)
- text-moderation-stable (deprecated)
- TTS-1
- TTS-1 HD
- Whisper
- 料金は基本的に使用トークン数に基づきます。 Responses API でツールを呼び出す場合はツール呼び出しごとに追加料金が発生することがあります。
- Batch API を利用すると割引料金が適用されます。
モデル | 入力 ($ / 1M トークン) | キャッシュ入力 | 出力 |
---|---|---|---|
GPT-5 | $1.25 | $0.125 | $10.00 |
GPT-5 pro | $15.00 | - | $120.00 |
GPT-5 mini | $0.25 | $0.025 | $2.00 |
GPT-5 nano | $0.05 | $0.005 | $0.40 |
GPT-4.1 | $2.00 | $0.50 | $8.00 |
gpt-oss-120b | - | - | - |
gpt-oss-20b | - | - | - |
いずれも先頭に v1/
が付きます。
chat/completions
responses
realtime
(GPT-5 シリーズは未対応)assistants
batch
fine-tuning
(GPT-5 シリーズは未対応)embeddings
images/generations
images/edits
audio/speech
audio/transcriptions
audio/translations
moderations
completions
(レガシー)
- ストリーミング: 逐次的なトークン出力
- Function calling: 外部関数・ツールの呼び出し
- Structured outputs: JSON などの構造化フォーマットの強制
- 推論トークン: Reasoning モデルにおける追加の推論ステップを使用
- 蒸留: 小型モデルへの知識蒸留
- ファインチューニング: 特定のユースケースへの最適化( GPT-5 シリーズは未対応)
- ウェブ検索
- ファイル検索
- 画像生成
- コードインタプリタ
- MCP (Model Context Protocol) ツール連携
OpenAI の API レートは組織ごとに設定された Usage tier に基づきます。利用額が増えると自動的に次のティアへ昇格し利用上限が引き上げられます。詳細はアカウント設定の limits セクションで確認できます。
ティア | 条件 | 月間利用上限(月) |
---|---|---|
Free | サービス対象地域のユーザー | $100 |
Tier 1 | $5 支払い済み | $100 |
Tier 2 | $50 支払い済みかつ初回支払いから 7 日以上経過 | $500 |
Tier 3 | $100 支払い済みかつ初回支払いから 7 日以上経過 | $1,000 |
Tier 4 | $250 支払い済みかつ初回支払いから 14 日以上経過 | $5,000 |
Tier 5 | $1,000 支払い済みかつ初回支払いから 30 日以上経過 | $200,000 |
- OpenAI Models: https://platform.openai.com/docs/models
- Pricing: https://platform.openai.com/docs/pricing
- Deprecations: https://platform.openai.com/docs/deprecations