← 2026-05-04
Model Releases Community 2026-05-04 Source →

OpenAI、GPT-5.5をリリース——Terminal-Bench 2.0で82.7%を達成、GPT-4.5以来初の完全再トレーニングモデル

OpenAIは2026年4月23日、エージェントワークフロー向けに最適化した新モデル「GPT-5.5」を公開しました。GPT-4.5以来初の完全再トレーニングとなるこのモデルは、複雑なコマンドライン操作を評価するベンチマーク「Terminal-Bench 2.0」で82.7%という最高水準のスコアを記録し、2位のClaude Opus 4.7(69.4%)に13ポイント以上の差をつけています。同日からAPIでも利用可能となっています。

GPT-5.5が示すエージェント性能の飛躍

OpenAIの発表によると、GPT-5.5はGPT-4.5以降に積み上げてきた技術的知見を一から統合し直した「基盤モデルの世代刷新」です。複雑な目標を理解し、ツールを活用し、自らの作業を検証しながら多段階タスクを最小限の人間の介入で完遂する能力が大幅に向上しています。Terminal-Bench 2.0での82.7%に加え、GDPvalベンチマークでも84.9%を達成しており、コーディング・コンピュータ操作・知識作業・科学研究補助といった分野での性能向上が顕著です。また、Codexとの連携による収益は7日以内で2倍になったと報告されており、API収益全体も過去最速のペースで2倍成長を続けているといいます。

X(旧Twitter)では「82%は驚異的——エージェントワークフローにおける本物の進歩でCopilot不要になるかも」という声が上がっている一方、Redditでは「200メッセージ/週という利用制限が実質的なユーザー体験の低下を招いている」との批判も多く見られます。Hacker Newsでは「バージョン番号の割に実際は大きな飛躍——これが真のGPT-5世代の基盤になる」とする見方が優勢で、単なるマイナーアップデートを超えた位置づけで捉えられています。

GPT-5.5の登場は、AIがユーザーの指示を待つ「受け身の道具」から、自律的に計画・実行・修正を繰り返す「エージェント」へと本格移行したことを示しています。今後、企業の業務自動化ニーズを取り込む競争はさらに激化し、AnthropicやGoogleとのエージェント性能比較が業界の主戦場になると見られます。利用制限の緩和や価格体系の見直しが進めば、個人ユーザーの日常利用にも大きな影響を与えることになるでしょう。

関連リンク

- [Introducing GPT-5.5 OpenAI](https://openai.com/index/introducing-gpt-5-5/)