GPT-5.4 使い方【2026年最新】PC自動操作・Thinking・料金を完全解説

GPT-5.4 使い方の要点を先に書く。GPT-5.4は2026年3月5日にOpenAIがリリースした最新モデルで、コンピュータ操作で人間を超えたスコア（OSWorld 75.0%、人間72.4%）を記録した。コンテキストは1.05Mトークン、出力は128Kトークン。ChatGPT Plus（月$20）以上で利用でき、モデルセレクターから「GPT-5.4 Thinking」を選ぶだけで使える。

この記事では、GPT-5.4 使い方をChatGPTでの切り替え手順からThinkingモード5段階の使い分け、料金プラン別のできること、Claude Opus 4.6・Gemini 2.5 Proとの比較まで、図解付きで完全解説する。

最終更新日: 2026年3月16日

Table of Contents

Toggle

GPT-5.4とは？30秒でわかる要点

GPT-5.4は、OpenAIが2026年3月5日にリリースした汎用AIモデルだ。一言で言えば「GPT-5.3-Codexのコーディング力 + GPT-5.2の推論力 + ネイティブPC操作」を1つに統合したモデル。

項目	GPT-5.4	前モデル（GPT-5.3-Codex）
リリース日	2026年3月5日	2026年1月
コンテキスト	1,050,000トークン（1.05M）	400,000トークン
最大出力	128,000トークン	128,000トークン
PC操作	ネイティブ対応（人間超え）	非対応
推論レベル	5段階（none〜xhigh）	3段階
API入力料金	$2.50/1Mトークン	$1.75/1Mトークン
API出力料金	$15.00/1Mトークン	$14.00/1Mトークン

コンテキストが2.6倍に拡大し、100万トークン超の大規模プロジェクト全体を一度に把握できるようになった。料金は若干上がったが、Tool Search機能でトークン使用量を47%削減できるため、実質的なコストは下がるケースが多い。

GPT-5.4 使い方｜5つの新機能を解説

1. コンピュータ操作（Computer Use）── 人間を超えた

GPT-5.4の最大の目玉がこれだ。AIがマウスとキーボードを直接操作して、PCの作業を自動化する。

「GPT-5.4はOSWorld-Verifiedベンチマークで75.0%を記録し、人間の72.4%を初めて超えた。」
── OpenAI公式発表（2026年3月5日）

何ができるかを具体的に挙げる。

スプレッドシートのデータ整理・グラフ作成を自動実行
ブラウザを操作してフォーム入力・情報収集
プレゼン資料の作成・編集
複数アプリケーション間のデータ連携

これまで「AIにやらせたいけど、手作業でしかできなかった」タスクが自動化される。バイブコーディングでアプリを作るときも、テスト操作をGPT-5.4に任せるという使い方が現実的になった。

2. コンテキスト1.05Mトークン ── 大規模コードベースを丸ごと読む

GPT-5.3-Codexの400Kから2.6倍に拡大。272Kトークン以下なら標準料金、それを超えると入力料金が2倍（$5.00/1M）になる。

1.05Mトークンがどれくらいかというと、約80万文字。一般的な技術書3〜4冊分のテキストを一度に渡せる計算だ。大規模なコードベース全体をコンテキストに入れて「このプロジェクトのバグを見つけて」と指示できる。

3. 推論レベル5段階（Thinking） ── タスクに合わせて深さを選ぶ

GPT-5.4 使い方で最も実用的なのが、推論レベルの選択だ。APIではreasoning_effortパラメータで5段階を指定できる。

レベル	用途	速度	精度
none	単純な変換・フォーマット	最速	低
low	要約・翻訳・軽い質問	速い	中
medium	一般的な質問・文章作成	普通	高
high	複雑な分析・コーディング	遅い	非常に高
xhigh	数学的証明・最高精度が必要な場面	最遅	最高

ChatGPTでは、Proプラン（$200/月）ならLight / Standard / Extended / Heavyの4モードを選べる。Plusプラン（$20/月）ではStandardとExtendedの2モード。

使い分けのコツ: 日常的な質問はmedium（Standard）で十分。コードのバグ修正や論文分析など「間違いが許されない」場面でhigh以上を使う。xhighは時間がかかるため、本当に必要な場面だけに絞るのがおすすめだ。

AI業務自動化に興味がある方は、Instagram（@taro_taro609）にDMで「診断」と送ってください →

4. Tool Search ── トークン47%削減の新技術

API開発者向けの機能だが、インパクトは大きい。従来はAPIを呼ぶ際にすべてのツール定義（関数の説明）をプロンプトに含める必要があった。GPT-5.4のTool Searchは、必要なツールだけをオンデマンドで取得する。

「250タスク・36 MCPサーバーのテストで、精度を維持したままトークン使用量を47%削減した。」
── OpenAI公式（GPT-5.4発表）

つまり、API料金が約半分になる可能性がある。多くのツールを接続するエージェントアプリの開発者にとって、これは嬉しいアップデートだ。

5. コーディング統合 ── GPT-5.3-Codex内蔵

GPT-5.4は、コーディング特化モデルのGPT-5.3-Codexの能力を内蔵している。個別のベンチマーク結果は以下のとおり。

ベンチマーク	GPT-5.4	説明
SWE-Bench Verified	77.2%	実際のGitHub issueを修正する能力
SWE-Bench Pro	57.7%	より難しいコーディング課題
GPQA Diamond	92.8%	科学的推論
Humanity’s Last Exam	39.8%	人類最難関の問題セット

SWE-Bench Proでは57.7%を記録し、Claude Opus 4.6（約45%）を大幅に上回った。大規模なコードベースを扱う実務的なタスクでは、現時点で最強クラスだ。

GPT-5.4 使い方｜ChatGPTでの切り替え手順

ChatGPTでGPT-5.4を使う手順はシンプルだ。

ChatGPT（chatgpt.com）にログイン
チャット画面上部のモデルセレクターをクリック
「GPT-5.4 Thinking」を選択
Proプランの場合、推論レベル（Light / Standard / Extended / Heavy）を選択可能

Autoモードを使っている場合、複雑な質問を投げると自動的にGPT-5.4にルーティングされることもある。ただし確実に使いたいなら、手動で切り替えるのが安全だ。

思考中に指示を追加できる新機能もある。GPT-5.4 Thinkingが長い推論を行っている最中に「この観点も考慮して」と方向修正の指示を追加できる。従来は回答完了を待つしかなかったが、リアルタイムで軌道修正が可能になった。

📩 無料会員登録で限定コンテンツをゲット

登録者限定で「バイブコーディング厳選プロンプト集」を無料配布中。
記事では書けない実践テクニックも会員限定で公開しています。

無料で会員登録する（30秒）→

GPT-5.4の料金【プラン別比較表】

「結局いくらかかるの？」が最も気になるところだろう。GPT-5.4 使い方でまず確認すべきは、自分のプランで何ができるかだ。

プラン	月額	GPT-5.4 Thinking	推論レベル	GPT-5.4 Pro
Free	無料	Auto経由で限定的	自動	不可
Go	$8（約¥1,200）	「+」ボタンで限定利用	限定	不可
Plus	$20（約¥3,000）	利用可	Standard / Extended	不可
Pro	$200（約¥30,000）	利用可	Light / Standard / Extended / Heavy	利用可
Team	$25/人	利用可	Standard / Extended	不可

おすすめはPlusプラン（$20/月）。GPT-5.4 Thinkingの主要機能がすべて使え、StandardとExtendedの2段階で推論レベルを選べる。月$20（約3,000円）でこの性能が手に入るなら、投資対効果は高い。

GPT-5.4 使い方プラン別比較表 — GPT-5.4 使い方 Free〜Proプランで使える機能の違い

Proプラン（$200/月）はHeavyモードとGPT-5.4 Proが使えるが、研究者やヘビーユーザー向け。一般的な用途ならPlusで十分だ。

API料金

モデル	入力（/1Mトークン）	出力（/1Mトークン）	キャッシュ入力
gpt-5.4（272K以下）	$2.50	$15.00	$1.25
gpt-5.4（272K超）	$5.00	$15.00	—
gpt-5.4-pro	$30.00	$180.00	—

GPT-5.4 vs Claude Opus 4.6 vs Gemini 2.5 Pro【比較表】

2026年3月時点のトップ3モデルを比較する。どれが「最強」かは用途次第だ。

項目	GPT-5.4	Claude Opus 4.6	Gemini 2.5 Pro
リリース日	2026年3月5日	2026年2月	2026年1月
コンテキスト	1.05M	1M	1.05M
最大出力	128K	128K	64K
SWE-Bench Verified	77.2%	79.2%	63.2%
SWE-Bench Pro	57.7%	~45%	—
GPQA Diamond	92.8%	—	86.4%
PC操作（OSWorld）	75.0%	対応	—
API入力料金	$2.50/M	$15.00/M	$1.25/M
API出力料金	$15.00/M	$75.00/M	$10.00/M
速度	普通	普通	最速（91%高速）

結論を正直に言う。

万能型・PC操作なら → GPT-5.4：コンピュータ操作のネイティブ対応と推論力で総合1位
コーディング品質なら → Claude Opus 4.6：SWE-Bench Verifiedで79.2%、コード生成の精度は最高
コスパ・速度なら → Gemini 2.5 Pro：API料金が最安で速度も最速。大量処理に向いている

1つだけ選ぶなら、GPT-5.4が最もバランスが良い。ただしコーディング特化ならClaudeを、大量データ処理ならGeminiを、と使い分けるのが2026年の正解だ。

GPT-5.4 使い方ベンチマーク比較 — GPT-5.4 使い方 Claude・Geminiとの性能比較

GPT-5.4をバイブコーディングに活かす方法

このブログの読者なら気になるだろう。GPT-5.4はバイブコーディングとどう組み合わせるか。

Cursor × GPT-5.4の組み合わせ

CursorのAgent ModeでGPT-5.4をバックエンドモデルとして使えば、1.05Mトークンのコンテキストでプロジェクト全体を把握しながらコードを生成できる。SWE-Bench Pro 57.7%の実力は、実務レベルのバグ修正や機能追加に直結する。

PC操作 × テスト自動化

Lovableでアプリを作った後、GPT-5.4のコンピュータ操作機能でUIテストを自動実行する。「このボタンをクリックして、こういう画面が表示されることを確認して」という自然言語の指示でテストが走る世界が来ている。

エージェントワークフロー

GPT-5.4のTool Search機能を使えば、複数のAPI（Slack、Notion、GitHub、Google Sheetsなど）を連携させたエージェントを効率的に構築できる。トークン使用量47%削減のおかげで、ランニングコストも抑えられる。

GPT-5.4 使い方でよくある質問

Q: GPT-5.4は無料で使えますか？

A: 限定的に使えます。Freeプランでは「Auto」モードが複雑なクエリをGPT-5.4に自動ルーティングすることがありますが、常に利用できるわけではありません。確実に使うにはPlus（$20/月）以上のプランが必要です。

Q: GPT-5.4とGPT-5.3-Codexはどちらが良いですか？

A: GPT-5.4がGPT-5.3-Codexの能力を内蔵しているため、基本的にGPT-5.4を選べば問題ありません。コンテキストも400K→1.05Mに拡大し、PC操作機能も追加されています。料金は若干高くなりますが（入力$1.75→$2.50）、Tool Searchでトークン47%削減できるため、実質コストは同等以下です。

Q: Thinkingモードの「Standard」と「Extended」の違いは？

A: Standardは思考と速度のバランスが取れたモードで、日常的な質問に向いています。Extendedは時間をかけて深く推論するモードで、複雑な分析やコーディングに向いています。迷ったらStandardから始めて、精度が足りないときにExtendedに切り替えるのがおすすめです。

Q: GPT-5.4のPC操作（Computer Use）はどうやって使えますか？

A: 現時点ではCodex環境とAPI経由で利用可能です。ChatGPTの通常画面からは直接PC操作はできません。OpenAIのCodexプラットフォームにアクセスするか、APIでcomputer_useツールを有効にして利用します。

Q: GPT-5.4 Proとは何ですか？通常版との違いは？

A: GPT-5.4 Proは最高性能バージョンで、API料金は入力$30.00/出力$180.00と高額です。ChatGPT Proプラン（$200/月）またはEnterprise契約で利用可能。通常のGPT-5.4で十分なケースが大半で、研究者や高精度が要求される業務向けです。

Q: Claude Opus 4.6とGPT-5.4、コーディングにはどちらが良いですか？

A: SWE-Bench Verifiedのスコアではclaude Opus 4.6（79.2%）がGPT-5.4（77.2%）をわずかに上回ります。一方、SWE-Bench Pro（より実務的なタスク）ではGPT-5.4（57.7%）がClaude（~45%）を大幅に上回っています。小規模な修正ならClaude、大規模プロジェクトの実務タスクならGPT-5.4が強いです。

参考ソース

📌 関連記事

著者: 稲邉舜太朗（Lovable公式アンバサダー）
運営: テイラーの隠れ家（shuntailor.net）

会員登録（無料）で限定プロンプト集を受け取る → 無料で会員登録する

🤖 AI導入を迷っているあなたへ──30分無料診断

「どのAIツールが合うかわからない」「自動化できる業務を知りたい」方は、
Instagramの @taro_taro609 にDMで 「診断」 とメッセージを送ってください。
30分のビデオ通話で、あなたの業務に最適なAI活用プランを無料でご提案します。

Instagramで「診断」とDMする →

バイブコーディング入門ガイドPDF（¥1,480）でゼロから始めよう →

Post Views: 28