OpenAI API モデル一覧（日本語）

最終更新日: 2025/10/06

OpenAI 公式 Models ページをもとに OpenAI が提供するモデルについて日本語でまとめています。料金や仕様は変更される可能性があるため最新情報は必ず公式サイトでご確認ください。

単位 $ はすべて US ドルです

概要
ピックアップモデル
フロンティアモデル
オープンウェイトモデル
特化モデル
リアルタイム・音声モデル
その他モデル
価格
モダリティ
利用可能なエンドポイント
主要機能
Responses API で利用できるツール
スナップショットとエイリアス
レートリミット
参考資料

概要

OpenAI API は多様なワークロードに対応する複数のモデル群で構成されています。モデルごとに対応モダリティ、推論能力、料金体系、サービスポリシーが異なります。開発用途に応じてモデルを選択し、必要であればファインチューニングやツール連携を組み合わせて利用できます。

カテゴリ	概要
ピックアップモデル	最新世代の代表的な汎用モデル。コーディングやエージェント用途を含む幅広いタスクを想定。
フロンティアモデル	推論性能や指示追従性が高い大規模モデル。ツール呼び出しや長いコンテキスト処理を重視。
オープンウェイトモデル	Apache 2.0 ライセンスのオープンウェイトモデル。ローカル環境や独自デプロイ向け。
その他	モデレーション、 Embeddings、音声、画像生成など専門タスク向けモデル（ここでは概要のみ）。

ピックアップモデル

最新の代表モデル。推論トークン（ reasoning tokens ）をサポートし、テキストと画像を入力できます。

GPT-5

コーディング・推論・ドメインを跨いだエージェント的タスクに向いたフラグシップモデル。

Reasoning: 非常に高い（推論トークン対応）
Speed: 中
価格（1M トークンあたり）: 入力 $1.25 / キャッシュ入力 $0.125 / 出力 $10.00
コンテキストウィンドウ: 400,000
最大出力トークン: 128,000
ナレッジカットオフ: 2024/09/30
入力モダリティ: テキスト・画像
出力モダリティ: テキスト
特徴: 高精度のコーディング支援とエージェント的操作に最適

GPT-5 mini

GPT-5 のより高速でコスト効率のよいバージョン。よく定義されたタスクや精密なプロンプトに向いています。

Reasoning: 高（推論トークン対応）
Speed: 高
価格（1M トークンあたり）: 入力 $0.25 / キャッシュ入力 $0.025 / 出力 $2.00
コンテキストウィンドウ: 400,000
最大出力トークン: 128,000
ナレッジカットオフ: 2024/05/31
入力モダリティ: テキスト・画像
出力モダリティ: テキスト
特徴: 定型業務や大量バッチ処理向け。

GPT-5 nano

GPT-5 の最も高速で安価なバージョン。要約や分類のタスクに向いています。

Reasoning: 普通（推論トークン対応）
Speed: 非常に高速
価格（1M トークンあたり）: 入力 $0.05 / キャッシュ入力 $0.005 / 出力 $0.40
コンテキストウィンドウ: 400,000
最大出力トークン: 128,000
ナレッジカットオフ: 2024/05/31
入力モダリティ: テキスト・画像
出力モダリティ: テキスト
特徴: レイテンシー重視の分類・要約パイプラインに最適。

フロンティアモデル

高性能な大規模モデル群。複雑なツールコールや長文指示への対応を想定しています。

GPT-5

（説明はピックアップモデルの項をご覧ください）

GPT-5 mini

（説明はピックアップモデルの項をご覧ください）

GPT-5 nano

（説明はピックアップモデルの項をご覧ください）

GPT-5 pro

GPT-5 のより賢く正確なレスポンスを返すバージョン。計算資源を多く使いよりよい答えを提供します。 API レスポンスを返す前に複数ステップのアクションを可能とするために Responses API 限定。

Reasoning: 最高（ reasoning.effort: high 固定）
Speed: 低（シリーズ中最も遅い）
価格（1M トークンあたり）: 入力 $15.00 / 出力 $120.00
コンテキストウィンドウ: 400,000
最大出力トークン: 272,000
ナレッジカットオフ: 2024/09/30
入力モダリティ: テキスト・画像
出力モダリティ: テキスト
特徴: 難しい問題に対応できるよう設計されておりリクエスト処理に数分かかることもある。タイムアウトを避けるにはバックグラウンドモードでの利用が推奨される。

GPT-4.1

指示追従とツールコールに最適化された非推論モデル。低レイテンシー重視。

Reasoning / Intelligence: 非常に高い（推論ステップなし）
Speed: 中
価格（1M トークンあたり）: 入力 $2.00 / キャッシュ入力 $0.50 / 出力 $8.00
コンテキストウィンドウ: 1,047,576
最大出力トークン: 32,768
ナレッジカットオフ: 2024/06/01
入力モダリティ: テキスト・画像
出力モダリティ: テキスト
特徴: 推論トークンを使用せずリアルタイム性を優先。複雑なタスクには GPT-5 が推奨されます。

オープンウェイトモデル

Apache 2.0 ライセンスで公開されているモデルウェイト。 HuggingFace から取得し、ローカル/オンプレミスでカスタマイズ・推論可能です。

gpt-oss-120b

OpenAI の最も強力なオープンウェイトモデル。 H100 GPU 1枚で動作可能な設計。 117B パラメータ（ 5.1B アクティブ）。

Reasoning: 非常に高い（推論トークン対応）
Speed: 中
価格: API 課金なし（ダウンロード提供）
コンテキストウィンドウ: 131,072
最大出力トークン: 131,072
ナレッジカットオフ: 2024/06/01
入力モダリティ: テキスト
出力モダリティ: テキスト
主な特徴:
- Apache 2.0 ライセンスで自由に利用・再配布可能
- 推論負荷を調整可能（低／中／高）
- 推論過程を追跡できる完全な Chain-of-Thought
- ファインチューニングやエージェント用途（ファンクションコーリング・ウェブブラウジング・ Python コード実行・ Structured outputs 等）に対応

gpt-oss-20b

レイテンシの低い、中サイズのオープンウェイトモデル。ローカルや特化したユースケース向き。 21B パラメータ（ 3.6B アクティブパラメータ）。

Reasoning: 非常に高い（推論トークン対応）
Speed: 中
価格: API 課金なし（オープンウェイト／ダウンロード提供）
コンテキストウィンドウ: 131,072
最大出力トークン: 131,072
ナレッジカットオフ: 2024/06/01
入力モダリティ: テキスト
出力モダリティ: テキスト
主な特徴:
- Apache 2.0 ライセンス
- 推論負荷を調整可能（低／中／高）
- 推論過程を追跡できる完全な Chain-of-Thought
- ファインチューニングやエージェント用途（ファンクションコーリング・ウェブブラウジング・ Python コード実行・ Structured outputs 等）に対応

特化モデル

Sora 2

同期した音声付きの動画を生成するフラッグシップ動画モデル。自然言語や画像の指示からリッチで動的なクリップを作成できます。

Performance: 高
Speed: 低
価格（動画生成）: 1 秒あたり $0.10 （縦長: 720x1280 / 横長: 1280x720 ）
入力モダリティ: テキスト・画像
出力モダリティ: 動画
特徴: 汎用的な動画生成用途向け

Sora 2 Pro

最も高度な同期した音声付きの動画生成モデル。自然言語や画像の指示から映画品質のクリップを生成します。

Performance: 最高
Speed: 最も低速
価格（動画生成）: 1 秒あたり $0.30 （縦長: 720x1280 / 横長: 1280x720 ）、$0.50（縦長: 1024x1792 / 横長: 1792x1024 ）
入力モダリティ: テキスト・画像
出力モダリティ: 動画

その他の特化モデル

o3-deep-research
o4-mini-deep-research
GPT Image 1
gpt-image-1-mini
DALL·E 3
GPT-4o mini TTS
GPT-4o Transcribe
GPT-4o mini Transcribe

リアルタイム・音声モデル

gpt-realtime

音声とテキストの双方向ストリーミングに特化した初の一般提供リアルタイムモデル。WebRTC、WebSocket、SIP 接続を介して応答します。

価格
- テキストトークン / 1M: 入力 $4.00 / キャッシュ入力 $0.40 / 出力 $16.00
- 音声トークン / 1M: 入力 $32.00 / キャッシュ入力 $0.40 / 出力 $64.00
コンテキストウィンドウ: 32,000
最大出力トークン: 4,096
ナレッジカットオフ: 2023/10/01
入力モダリティ: テキスト・音声・画像
出力モダリティ: テキスト・音声

gpt-realtime-mini

gpt-realtime のコスト効率のよいバージョン。 WebRTC / WebSocket / SIP 接続を通じて音声・テキストを扱えます。

価格
- テキストトークン / 1M: 入力 $0.60 / キャッシュ入力 $0.06 / 出力 $2.40
- 音声トークン / 1M: 入力 $10.00 / キャッシュ入力 $0.30 / 出力 $20.00
- 画像トークン / 1M: 入力 $0.80 / キャッシュ入力 $0.08
コンテキストウィンドウ: 32,000
最大出力トークン: 4,096
ナレッジカットオフ: 2023/10/01
入力モダリティ: テキスト・画像・音声
出力モダリティ: テキスト・音声

gpt-audio

Chat Completions REST API で利用できる初の一般提供音声モデル。テキストと音声の入力・出力に対応します。

料金
- テキストトークン / 1M: 入力 $2.50 / 出力 $10.00
- 音声トークン / 1M: 入力 $40.00 / 出力 $80.00
コンテキストウィンドウ: 128,000
最大出力トークン: 16,384
ナレッジカットオフ: 2023/10/01
入力モダリティ: テキスト・音声
出力モダリティ: テキスト・音声

gpt-audio-mini

Chat Completions REST API で利用できる gpt-audio のコスト効率のよいバージョン。テキストと音声の双方向入出力を低コストで提供します。

料金
- テキストトークン / 1M: 入力 $0.60 / 出力 $2.40
- 音声トークン / 1M: 入力 $10.00 / 出力 $20.00
コンテキストウィンドウ: 128,000
最大出力トークン: 16,384
ナレッジカットオフ: 2023/10/01
入力モダリティ: テキスト・音声
出力モダリティ: テキスト・音声

その他モデル

GPT-5-Codex

Codex （や Codex の類似環境）でのエージェント的コーディングタスクに最適化された GPT-5 の 1 バージョン。 Responses API 限定で提供され、定期的にスナップショットが更新されます。

Reasoning: 非常に高い（推論トークン対応）
Speed: 中
価格（1M トークンあたり）: 入力 $1.25 / キャッシュ入力 $0.125 / 出力 $10.00
コンテキストウィンドウ: 400,000
最大出力トークン: 128,000
ナレッジカットオフ: 2024/09/30
入力モダリティ: テキスト・画像
出力モダリティ: テキスト

その他（説明は省略）

o3
o4-mini
GPT-4.1 mini
GPT-4.1 nano
o1-pro
computer-use-preview
GPT-4o mini Search Preview
GPT-4o Search Preview
GPT-4.5 Preview (deprecated)
o3-mini
GPT-4o mini Audio
GPT-4o mini Realtime
o1
omni-moderation
o1-mini (deprecated)
o1 Preview (deprecated)
GPT-4o
GPT-4o Audio
GPT-4o mini
GPT-4o Realtime
GPT-4o Turbo
babbage-002
ChatGPT-4o
codex-mini-latest
DALL·E 2
davinci-002
GPT-3.5 Turbo
GPT-4
GPT-4 Turbo Preview
GPT-5 Chat
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
text-moderation (deprecated)
text-moderation-stable (deprecated)
TTS-1
TTS-1 HD
Whisper

価格

料金は基本的に使用トークン数に基づきます。 Responses API でツールを呼び出す場合はツール呼び出しごとに追加料金が発生することがあります。
Batch API を利用すると割引料金が適用されます。

モデル	入力 ($ / 1M トークン)	キャッシュ入力	出力
GPT-5	$1.25	$0.125	$10.00
GPT-5 pro	$15.00	-	$120.00
GPT-5 mini	$0.25	$0.025	$2.00
GPT-5 nano	$0.05	$0.005	$0.40
GPT-4.1	$2.00	$0.50	$8.00
gpt-oss-120b	-	-	-
gpt-oss-20b	-	-	-

利用可能なエンドポイント

いずれも先頭に v1/ が付きます。

chat/completions
responses
realtime （GPT-5 シリーズは未対応）
assistants
batch
fine-tuning （GPT-5 シリーズは未対応）
embeddings
images/generations
images/edits
audio/speech
audio/transcriptions
audio/translations
moderations
completions （レガシー）

主要機能

ストリーミング: 逐次的なトークン出力
Function calling: 外部関数・ツールの呼び出し
Structured outputs: JSON などの構造化フォーマットの強制
推論トークン: Reasoning モデルにおける追加の推論ステップを使用
蒸留: 小型モデルへの知識蒸留
ファインチューニング: 特定のユースケースへの最適化（ GPT-5 シリーズは未対応）

Responses API で利用できるツール

ウェブ検索
ファイル検索
画像生成
コードインタプリタ
MCP (Model Context Protocol) ツール連携

レートリミット

OpenAI の API レートは組織ごとに設定された Usage tier に基づきます。利用額が増えると自動的に次のティアへ昇格し利用上限が引き上げられます。詳細はアカウント設定の limits セクションで確認できます。

ティア	条件	月間利用上限（月）
Free	サービス対象地域のユーザー	$100
Tier 1	$5 支払い済み	$100
Tier 2	$50 支払い済みかつ初回支払いから 7 日以上経過	$500
Tier 3	$100 支払い済みかつ初回支払いから 7 日以上経過	$1,000
Tier 4	$250 支払い済みかつ初回支払いから 14 日以上経過	$5,000
Tier 5	$1,000 支払い済みかつ初回支払いから 30 日以上経過	$200,000

参考

OpenAI Models: https://platform.openai.com/docs/models
Pricing: https://platform.openai.com/docs/pricing
Deprecations: https://platform.openai.com/docs/deprecations

Name		Name	Last commit message	Last commit date
Latest commit History 117 Commits
scripts		scripts
.python-version		.python-version
README.md		README.md
pyproject.toml		pyproject.toml
uv.lock		uv.lock

gh640/openai-models-ja

Folders and files

Latest commit

History

Repository files navigation

OpenAI API モデル一覧（日本語）

目次

概要

ピックアップモデル

GPT-5

GPT-5 mini

GPT-5 nano

フロンティアモデル

GPT-5

GPT-5 mini

GPT-5 nano

GPT-5 pro

GPT-4.1

オープンウェイトモデル

gpt-oss-120b

gpt-oss-20b

特化モデル

Sora 2

Sora 2 Pro

その他の特化モデル

リアルタイム・音声モデル

gpt-realtime

gpt-realtime-mini

gpt-audio

gpt-audio-mini

その他モデル

GPT-5-Codex

その他（説明は省略）

価格

利用可能なエンドポイント

主要機能

Responses API で利用できるツール

レートリミット

参考

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases 18

Uh oh!

Contributors 2

Languages