【完全解説】OpenAI「GPT-5」全モデル徹底ガイド:gpt-5/mini/nano/chat-latest/Thinking/Proの違いと選び方
まずは要点の“先出し”まとめ
– 2025年8月7日公開の最新旗艦。ChatGPTでは自動で「速い応答」と「深い思考」を切り替える統合システムに進化しました。
– モデル構成の全体像(ChatGPTの体験とAPIの提供形態で役割が少し異なります):
• ChatGPT:GPT-5(通常)/GPT-5 Thinking(深い推論)/GPT-5 Pro(さらに長く・深く考える上位版)
• API:gpt-5
(推論モデル)/gpt-5-mini
/gpt-5-nano
(軽量版)/gpt-5-chat-latest
(ChatGPTの“非推論”側に相当)
– コンテキストは最大400Kトークン、出力上限128Kトークン(各サイズ共通)。
– 参考価格(API):gpt-5
$1.25(入力)/$10.00(出力)/gpt-5-mini
$0.25/$2.00/gpt-5-nano
$0.05/$0.40(いずれも 100万トークンあたり)。
– 強み:実運用のコーディング、指示追従とツール連携(エージェント的な作業)、マルチモーダル理解、ヘルス系の質問でSOTA級。
– 新パラメータ:reasoning_effort
(どれだけ深く考えるか)とverbosity
(簡潔~詳細の度合い)。カスタムツール(JSONではなくプレーンテキストでのツール呼び出し)も追加。
– 利用者視点の実利:幻覚が大幅減、へつらい(sycophancy)も抑制。日常の執筆・要約・設計レビューから本格的なリポジトリ修正まで、現場仕事の正確さと完遂力が上がっています。
– ロールアウト:ChatGPTはデフォルトがGPT-5に。プランごとのメッセージ上限やThinking回数の扱いも整理され、使い勝手はそのままに賢く自動切替されます。
1. GPT-5とは何か――“速さ”と“深い思考”を自動で使い分ける統合システム
GPT-5は、従来の「高速に応答するモデル」と「じっくり推論するモデル」をひとつの体験に束ねた統合システムです。ChatGPTでは、質問の種類や複雑さ、必要なツール、さらに「じっくり考えて」などの明示的な意図まで加味して、ルーターが最適なモードを即時選択します。多くの質問は高速モデルが、難問はGPT-5 Thinkingが担当し、使用量が上限に達すると自動的にミニ版へフェイルオーバー。この“頭の使い分け”が標準化されたことで、ユーザーはモデル選びの迷いから解放されました。リリースは2025年8月7日で、ChatGPTは原則としてこの新体験がデフォルトです。
さらに今回の刷新では、実世界の問いへの正答性、指示の忠実な追従、へつらいの低減など、応答の“らしさ”より“役に立つこと”に直結する改善が目立ちます。日常の文章作成から、コードの修正・設計の合意形成、医療情報の理解補助まで、現実のタスクで頼れる相棒へと踏み出した印象です。
2. モデルの全体像:ChatGPTの体験設計とAPIの提供形態
2-1. ChatGPT(プロダクト)側の設計
ChatGPTでは、GPT-5(高速・標準)と、難問向けのGPT-5 Thinking(深い推論)をルーターで適切に選びます。さらにGPT-5 Proは、より長く・深く考えるためのバリアントで、最難関の設問や緻密な検討に向きます。Thinking/Proは並列のテスト時計算などを賢く使い、広い探索と精緻な検証を行ったうえで結論を返します。ChatGPTの画面では、推論中の控えめなインジケーターが出て、必要なら 「すぐ答える」 へ切り替えも可能です。
なお、音声モードは引き続きGPT-4oが担当します(音声体験の継続性確保のため)。過去スレッドは、使っていたモデルに応じて最も近いGPT-5系に自動移行します(例:o3→GPT-5 Thinking、o3-Pro→GPT-5 Pro)。
2-2. API(開発者)側のラインアップ
開発者がAPIで直接使うのは、推論ができる“開発者向けのGPT-5” です。サイズごとに次の3種が提供されます。
gpt-5
:フル性能。推論とツール連携の中核。gpt-5-mini
:コスト・レイテンシを抑えた実務向けライト版。gpt-5-nano
:さらに軽い運用向け。高速バッチや大量処理に最適。
加えて、ChatGPTの“非推論側”に相当する gpt-5-chat-latest
もAPIで利用できます。reasoning_effort
で“どれだけ深く考えるか”を制御でき、verbosity
で出力の簡潔さ~詳しさを切り替え可能。カスタムツールによりJSONなしのプレーンテキストでもツールを呼べます。ツールの逐次・並列呼び出しや長文コンテキストの検索 も強化されています。
2-3. システムカードが示す内部ラベル(参考)
システムカードでは、ChatGPT体験を支える内部的なラベルとして、gpt-5-main
(高速)/gpt-5-thinking
(推論)とそのmini/nano版、さらに gpt-5-thinking-pro
が言及されています。4o→gpt-5-main、o3→gpt-5-thinking といった系譜 も示され、将来的には単一モデル統合も視野に入っていると明記されています(あくまで内部説明であり、APIの正式なモデル名とは別物です)。
3. スペックと料金:コンテキスト400K/出力128K、用途で選べる3サイズ
コンテキスト長は最大400Kトークン、出力は128Kトークン 。これは gpt-5
/gpt-5-mini
/gpt-5-nano
のいずれも共通 です。価格は 100万トークンあたり で、gpt-5
:$1.25(入力)/$10.00(出力)、gpt-5-mini
:$0.25/$2.00、gpt-5-nano
:$0.05/$0.40。gpt-5-chat-latest
の価格はgpt-5
に準じます。大規模リサーチや長文の証跡管理にも十分耐えられるメモリを、使い分けやすい価格帯で提供しているのが今回の特徴です。
ミニ Tips
400Kコンテキストでも、「要点だけ渡す」→「必要に応じて追い読み」の段階設計にすると、コストも精度も安定します。まず骨子(見出し・主要根拠)を与え、モデルに必要な参照箇所を自動で抽出させる設計が有効です。
4. どこが強い?— 現場で効く性能アップデート
4-1. コーディング(SWE-bench Verified 74.9%、Aider polyglot 88%)
GPT-5は実案件に即したコーディングで総合的に強く、SWE-bench Verifiedで74.9%、Aider polyglotで88%。前工程(設計・分解)→実装→検証→修正を自走で回す力が増しました。フロントエンドのUI生成でも審美性と構造のよさが両立し、o3との比較で7割のケースで選好されたという社内評価も紹介されています。大規模リポジトリの理解と局所修正が得意で、長時間のエージェント作業でも迷いにくいのが実務では効きます。
4-2. 指示追従・ツール連携(τ²-bench 96.7%)
ツールの逐次・並列呼び出し、エラーからのリカバリー、進捗の合間報告(preamble)など、“人に見せられる仕事ぶり”が標準化。カスタマーサポート系のツール連携ベンチ(τ²-bench)で96.7%と、マルチステップの実作業に強くなりました。カスタムツールでプレーンテキスト指示も扱え、ツール設計の自由度が増しています。
4-3. マルチモーダル理解・空間推論(MMMU 84.2%ほか)
画像や図表、ビデオ系の課題を含むMMMUで84.2%。チャート解釈やスライド要約、UIモックの指摘など非テキスト情報の整理力が実務レベルに。ERQAやCharXivのような科学・研究系でも堅調です。ビジュアル要素の言語化(例:代替テキストの叙述)に活きます。
4-4. 数学・科学・ヘルス分野(AIME’25 94.6%/GPQAダイヤ 88.4%[Pro])
数学の難問集AIME’25で94.6%、科学の難問GPQA(ダイヤモンド)もGPT-5 Proで88.4%に到達。ヘルス分野の評価でも大幅向上し、受診前の予習や検査結果の理解など“医師の代替ではなく理解の相棒”という位置づけに磨きがかかりました。日常の健康管理への助けになりつつ、医療判断は専門家とという線引きが明確なのも安心材料です。
4-5. 正確さ・誠実さの向上(幻覚・へつらいの抑制)
ChatGPTでの匿名プロンプトを使った測定では、GPT-5は4o比で約45%幻覚が減少。Thinkingモードはo3比で約80%減という報告。へつらいも4o比で大幅低減するようポストトレーニングが行われました。「できないことはできない」と言うための訓練や、欺瞞的ふるまいの監視・抑止も組み込まれ、攻めすぎず、引きすぎない誠実な応答へと舵が切られています。
5. ChatGPTでの使い方:プラン別の違いと上限
ChatGPTはログイン利用の既定モデルがGPT-5になりました。Plus/Pro/Teamではモデルピッカーから 「GPT-5」 または「GPT-5 Thinking」を選択可能。Pro/Teamは 「GPT-5 Thinking Pro」 にもアクセスできます。上限については Free:5時間あたり10メッセージ (上限到達時はミニ版に自動切替 、Thinkingは 1日1回)、Plus:3時間あたり80メッセージ(超過時はミニ版へ)など、 実利用で困らない範囲 に整えられています。順次ロールアウトのため、アカウントによって反映タイミングがわずかに前後します。
補足
旧モデル(4o/4.1/4.5/o3 など)は段階的に置き換えられます。過去スレッドを開くと自動的にGPT-5系へ移行するため、応答のテイストが変わる場合があります。音声モードは引き続き4oのままです。
6. 開発者向けトピック:APIの“深く考える”を使いこなす
APIでの核はgpt-5
(+mini
/nano
)と gpt-5-chat-latest
です。実務で押さえるポイントは3つ。
reasoning_effort
:"low"|"medium"|"high"
などで思考コストを調整。初手は最小→必要なら段階的に引き上げが定石です。verbosity
:"low"|"medium"|"high"
で要点だけ/詳述を制御。人に見せるログや監査に最適。- カスタムツール:プレーンテキストのI/Oで複雑なJSON設計を簡素化。文法制約(CFG)で安全・正確な書式を担保できます。
また、並列ツール呼び出しや長文からの高精度検索も強化。Microsoft 365 Copilot/GitHub Copilot/Azure AIなどMicrosoft各プロダクトへの展開もアナウンスされており、企業ITの基盤としての親和性が高まっています。
ミニ実装例(Chat Completions/ツール連携の骨子):
POST /v1/chat/completions
{
"model": "gpt-5",
"reasoning_effort": "low",
"verbosity": "medium",
"tools": [
{
"type": "custom_tool",
"name": "search_tickets",
"input_format": "text" // ← プレーンテキストでOK
}
],
"messages": [
{"role":"system","content":"You are a customer support engineer."},
{"role":"user","content":"昨日のSLA違反に関する問い合わせ一覧を要約し、重大度順に並べて。"}
]
}
運用Tips
– 最初はreasoning_effort":"low"
で高速に全体像。論点が割れた箇所だけ"high"
に再実行して詰めると、体感コストと正確さのバランスが良くなります。
–gpt-5-mini
は決まりきった自動処理や大量の軽量タスクに◎。gpt-5-nano
はログ整形やバッチ要約などの裾野処理に向きます。
7. ユースケース別「このモデルが向いています」
7-1. すばやい意思決定・要点整理(非推論/gpt-5-chat-latest
)
- 向き:営業資料の骨子作成、議事録の要点抽出、FAQの初期ドラフト
- 理由:思考を深く回しすぎず、高速でブレなくまとめられる
- 例プロンプト:「この議事録から意思決定に関係する一文だけを抽出し、“決定事項/保留/宿題”に三分類して、見出し+箇条書きで出力してください。」
7-2. 本格コーディング・設計レビュー(推論/gpt-5
)
- 向き:リポジトリ横断の不具合修正、UIの美観とアクセシビリティを両立するリファクタ
- 理由:SWE-bench Verified 74.9%等、 実務寄りのタスク完遂力が高い
- 例プロンプト:「
Form
コンポーネント群をWAI-ARIAに沿って見直し、ラベル関連付け/フォーカス移動の問題を自動テスト付きで修正するPR計画を作り、差分パッチまで提案して。」
7-3. 大量・反復処理(gpt-5-mini
/gpt-5-nano
)
- 向き:商品説明の多言語整形、ログの要約、議事のタグ付け
- 理由:十分な精度×低コスト。並列ツール呼び出しでスループットも確保
- 例プロンプト:「この1,000件のFAQを重複統合し、読み上げに適した短文へ正規化。見出し(20文字以内)+本文(90文字以内) でCSVに。」
7-4. 研究・検証・監査(gpt-5
+reasoning_effort:"high"
/GPT-5 Thinking/Pro)
- 向き:医療・法務の資料読み、意思決定の根拠提示、長期タスクの合議形成
- 理由:幻覚の抑制と根拠の整理が改善。Proはさらに詳述が得意
- 例プロンプト:「この治療選択に関する論文3本を前提・方法・結果・限界で対比し、推定バイアスと外的妥当性を指摘。 曖昧な点は“答えを保留” として明示して。」
8. アクセシビリティ重視の実務サンプル
サンプルA:代替テキストの自動生成(画像→説明文)
目的:ECの商品画像から読み上げに配慮した説明を自動作成
プロンプト例:
「次の商品の代替テキストを120文字以内で。色・形・用途を必ず含め、主観表現は避け、キーボード操作ユーザー向けの焦点移動順の注意点も一文添えて。」
期待出力(要旨):「黒の丸形ワイヤレススピーカー。前面にメッシュ、上部に物理ボタン。USB-C充電。操作ボタンは上面に集約、Tabキーで音量→再生→電源の順。」
サンプルB:フォームのエラーメッセージ最適化
目的:短く、解決方法が伝わるエラー文へ
プロンプト例:「このフォームのエラー文を 『何が』『なぜ』『どう直す』の3点で 各 30文字以内 に。」
期待出力(要旨):「郵便番号が不足です。7桁で入力してください。」
サンプルC:会議録の“理解しやすい要約”
目的:認知負荷を抑える“先に結論”の要約
プロンプト例:「この議事録を 『決定/懸念/宿題』の順で、各3点以内 に要約し、専門用語にはかっこ注を付けて。」
期待出力(要旨):「決定:A案採用(A/Bテスト=比較実験で検証)。懸念:導線のF字閲覧が阻害。宿題:入力補助のARIA属性を見直し。」
なぜGPT-5が向く?
– 長い文脈と多数の項目を一貫した基準で整えるのが上手。
– 指示の粒度(上限文字数・語彙制約)を忠実に守る。
– Thinkingモードでは “言い切れない時は保留する” 態度がより適切。{index=16}
9. リスクと注意点:過信しない運用設計
- 幻覚は“減った”が“ゼロではない”:重要判断は二重化(他情報源+人のレビュー)。出典の明示や不確実箇所の保留をプロンプトで強要すると安定します。
- へつらいの抑制は進んだが、意思決定者の意図に迎合する余地は残る。反証の要求(「反対の立場からも理由を挙げて」)を定型化。
- 医療・法務:“理解の補助”にとどめ、 専門家の判断を必須に。GPT-5自身もその前提で案内します。
- ツール連携:権限の最小化と 実行前の要約確認(preamble) を必ず。ログの監査可能性を
verbosity:"high"
で担保。
10. だれに特に効く?— 具体的な利用者像と導入効果
- プロダクト/Web制作チーム:UI改善とアクセシビリティ対応を計画→実装→検証まで一貫支援。デザインの審美性+操作性を両立し、コードレビューの説得力が増します。
- テクニカルライター/広報:“先に結論”の骨子づくりと用語の平易化が高速化。読了率や理解度の改善が見込めます。
- カスタマーサポート/オペレーション:τ²-benchでの強さが示すとおり、マルチツール連携で実務を終端まで運べます。一次回答の網羅性とエスカレーション判断が平準化。
- 研究・監査・品質保証:長文の証跡管理と保留の適切化がしやすく、リスク説明責任に耐える文書が作れます。
- ヘルスリテラシー向上を支援する教育者:患者さん向け説明文 の**“過不足ない言い回し”**を事例つきで支援できます。
11. アクセシビリティ水準(このコンテンツの評価と配慮)
本記事は、対象者が幅広い理解度・認知特性を持つことを前提に、次の点を重視しています。
- インバーテッド・ピラミッド:要点→背景→詳細の順で配置し、冒頭の箇条書きで“何が分かるか”を即示。
- 短文・やさしい日本語寄り:一文を短く、漢字/ひらがな/カタカナのバランスを調整。専門語にはかっこ注を併用。
- 箇条書き・表の多用:視線移動を最小化し、読み上げでも区切りが明確。
- 具体サンプル:代替テキスト/エラー文/会議録など、理解の橋渡しとなる“手触りのある事例”を同梱。
- 対象読者の明示:職種別の有用性を具体化。意思決定の見通しを良くします。
総合評価:理解容易性の高い“AA相当”の配慮(WCAGの原則「知覚可能・操作可能・理解可能・堅牢」に沿った情報設計。ただし厳密な適合宣言ではなく、読みやすさ・分かりやすさを実務目線で高めたものです)。
12. まとめ――“速くて、正確で、ちゃんと考える”が標準になった
- GPT-5は、速い応答と深い推論を自動で使い分ける統合体験。日常の執筆・要約から本格的なコーディング、長期の検討作業まで、1つの窓口で賢く対応します。
- APIは
gpt-5
/mini
/nano
で使い分け。reasoning_effort
とverbosity
でスピード×正確さ×説明性を状況に合わせて最適化。 - 幻覚とへつらいが抑制され、“できない時は保留する” 姿勢が強化。監査しやすい運用が組みやすくなりました。
- 現場導入のコツは、はじめは小さく・段階的に深く考えさせること。mini/nanoで裾野処理を捌き、難所だけ
gpt-5
やThinking/Proで詰めると、コストも品質も安定します。
明日の仕事にすぐ載せ替えられる“標準装備の賢さ”――それがGPT-5です。
付録:モデル比較(要点早見)
観点 | gpt-5 |
gpt-5-mini |
gpt-5-nano |
gpt-5-chat-latest |
ChatGPTのThinking/Pro |
---|---|---|---|---|---|
役割 | 推論・本番 | 軽量本番 | 大量バッチ | 非推論の高速回答 | 深い推論/最深推論 |
代表用途 | 大規模修正/検証 | 反復整形・翻訳 | ログ要約・タグ付け | 一問一答/要点整理 | 難問の検討・根拠整理 |
思考制御 | reasoning_effort |
同左 | 同左 | なし | ルーター自動/手動選択 |
価格(入/出) | $1.25/$10.00 | $0.25/$2.00 | $0.05/$0.40 | $1.25/$10.00 | –(ChatGPT内の体験) |
コンテキスト/出力 | 400K/128K | 400K/128K | 400K/128K | 400K/128K | 体験依存(上限は共通) |
※ 価格は100万トークンあたり。数値・仕様は今後更新の可能性があります。