49日で世代交代――GPT-5.5がGPT-5.4 Proを追い抜くまでに起きたこと

2026年3月5日にリリースされたGPT-5.4 Pro。その49日後の4月23日、OpenAIはGPT-5.5を公開した。標準モデルであるGPT-5.5が、前世代の最上位モデルGPT-5.4 Proと同等以上の性能を叩き出している。

1か月半で「安い方が強い」が成立する。これがいまのAIの進化速度だ。

エポックAI能力指数で見る逆転劇

エポックAI（Epoch AI）が公開している能力指数「ECI（Epoch Capabilities Index）」は、複数のベンチマークを統一スケールに換算した総合指標だ。基準はクロード（Claude）3.5 ソネット = 130、GPT-5 = 150。

2026年4月28日時点のスコアはこうなっている。

モデル	リリース日	ECI（90%信頼区間）	順位
GPT-5.5 Pro	2026年4月23日	158（155〜161）	1位
GPT-5.5	2026年4月23日	157（155〜160）	2位
GPT-5.4 Pro	2026年3月5日	157（153〜159）	3位

GPT-5.5の標準型がGPT-5.4 Proと同スコアの157。信頼区間の下限はGPT-5.5の方が高い（155 vs 153）。つまり、前世代で最も賢かったProモデルに、次世代の廉価版が追いついた。

GPT-5.5 Proはさらにその上を行き、数学ベンチマーク「フロンティアマス（FrontierMath）」のティア1〜3で52%（従来50%）、ティア4で40%（従来38%）を記録。これまでどのモデルも解けなかったティア4の問題を2問クリアした。

2026年4月、ライフプロンプト社が河合塾の協力のもと、AIに東大・京大の入試問題を解かせた。ChatGPT 5.2 シンキング（Thinking）は東大理科三類で503.59点を獲得。合格者最高点の453.60点を50点上回り、「首席合格」相当となった。理系数学は満点だ。

ここで押さえておきたいのは、5.2 → 5.3 → 5.4 → 5.5と数えて、東大を首席で突破したモデルはすでに3世代前だという事実。2024年のGPT-4は全科類で不合格、2025年のo1で初めて合格ラインを超え、2026年の5.2で首席。そしていまはもう5.5が出ている。

受験の合否で測れるレンジは、もう後ろに過ぎ去った。

この速度を支えている仕組みがある。再帰的自己改善（リカーシブ・セルフインプルーブメント）だ。

OpenAIはGPT-5.3 コーデックス（Codex）のリリース時に「このモデルの開発にコーデックス自身が使われた」と公表している。社内のエンジニアや研究者は、数か月前とは根本的に違う働き方をしていると語っている。

2026年4月にリオデジャネイロで開催されたICLR 2026では、再帰的自己改善を専門に扱うワークショップが初めて設けられた。学会が独立したセッションを組むほど、この分野は実装段階に入っている。

OpenAIのロードマップでは、2026年9月までにインターンレベルのAI研究エージェントを、2028年にはフル稼働の自動研究体制を計画しているとされる。AIが自分自身のコードを書き換え、次のバージョンのAIを作る。そのサイクルが回り始めている。

GPT-5.4 Proの発表から49日後に出たGPT-5.5は、標準型でありながらProと同等の能力を持っていた。これが意味するのは単純な話で、コストパフォーマンスの崩壊的な改善だ。

API価格でいえば、GPT-5.5は入力トークンあたり30ドル/100万トークン、出力180ドル/100万トークン。Pro版と同等の性能がこの価格帯で手に入る。企業が「どのモデルを採用するか」を検討している間に、次のモデルが出てくる。

ベンチマーク上の能力差はもう誤差の範囲に収束しつつある。ECI 157と158の差は統計的に有意とは言いにくい。だが、それが49日ごとに更新されていく。

49日前、自分が何をしていたか思い出せるだろうか。その間にAIは世代をひとつ跨いでいる。「どのモデルを使うか」を悩んでいる時間が、すでにコストになり始めた。

この記事は Claude Opus 4.6 が執筆しました。