Featured image of post 49日で世代交代――GPT-5.5がGPT-5.4 Proを追い抜くまでに起きたこと

49日で世代交代――GPT-5.5がGPT-5.4 Proを追い抜くまでに起きたこと

2026年3月5日にリリースされたGPT-5.4 Pro。その49日後の4月23日、OpenAIはGPT-5.5を公開した。標準モデルであるGPT-5.5が、前世代の最上位モデルGPT-5.4 Proと同等以上の性能を叩き出している。

1か月半で「安い方が強い」が成立する。これがいまのAIの進化速度だ。

エポックAI能力指数で見る逆転劇

エポックAI(Epoch AI)が公開している能力指数「ECI(Epoch Capabilities Index)」は、複数のベンチマークを統一スケールに換算した総合指標だ。基準はクロード(Claude)3.5 ソネット = 130、GPT-5 = 150。

2026年4月28日時点のスコアはこうなっている。

モデルリリース日ECI(90%信頼区間)順位
GPT-5.5 Pro2026年4月23日158(155〜161)1位
GPT-5.52026年4月23日157(155〜160)2位
GPT-5.4 Pro2026年3月5日157(153〜159)3位

GPT-5.5の標準型がGPT-5.4 Proと同スコアの157。信頼区間の下限はGPT-5.5の方が高い(155 vs 153)。つまり、前世代で最も賢かったProモデルに、次世代の廉価版が追いついた。

GPT-5.5 Proはさらにその上を行き、数学ベンチマーク「フロンティアマス(FrontierMath)」のティア1〜3で52%(従来50%)、ティア4で40%(従来38%)を記録。これまでどのモデルも解けなかったティア4の問題を2問クリアした。

東大「首席合格」は3世代前のモデル

2026年4月、ライフプロンプト社が河合塾の協力のもと、AIに東大・京大の入試問題を解かせた。ChatGPT 5.2 シンキング(Thinking)は東大理科三類で503.59点を獲得。合格者最高点の453.60点を50点上回り、「首席合格」相当となった。理系数学は満点だ。

ここで押さえておきたいのは、5.2 → 5.3 → 5.4 → 5.5と数えて、東大を首席で突破したモデルはすでに3世代前だという事実。2024年のGPT-4は全科類で不合格、2025年のo1で初めて合格ラインを超え、2026年の5.2で首席。そしていまはもう5.5が出ている。

受験の合否で測れるレンジは、もう後ろに過ぎ去った。

AIがAIを改良する時代

この速度を支えている仕組みがある。再帰的自己改善(リカーシブ・セルフインプルーブメント)だ。

OpenAIはGPT-5.3 コーデックス(Codex)のリリース時に「このモデルの開発にコーデックス自身が使われた」と公表している。社内のエンジニアや研究者は、数か月前とは根本的に違う働き方をしていると語っている。

2026年4月にリオデジャネイロで開催されたICLR 2026では、再帰的自己改善を専門に扱うワークショップが初めて設けられた。学会が独立したセッションを組むほど、この分野は実装段階に入っている。

OpenAIのロードマップでは、2026年9月までにインターンレベルのAI研究エージェントを、2028年にはフル稼働の自動研究体制を計画しているとされる。AIが自分自身のコードを書き換え、次のバージョンのAIを作る。そのサイクルが回り始めている。

49日という数字の意味

GPT-5.4 Proの発表から49日後に出たGPT-5.5は、標準型でありながらProと同等の能力を持っていた。これが意味するのは単純な話で、コストパフォーマンスの崩壊的な改善だ。

API価格でいえば、GPT-5.5は入力トークンあたり30ドル/100万トークン、出力180ドル/100万トークン。Pro版と同等の性能がこの価格帯で手に入る。企業が「どのモデルを採用するか」を検討している間に、次のモデルが出てくる。

ベンチマーク上の能力差はもう誤差の範囲に収束しつつある。ECI 157と158の差は統計的に有意とは言いにくい。だが、それが49日ごとに更新されていく。

49日前、自分が何をしていたか思い出せるだろうか。その間にAIは世代をひとつ跨いでいる。「どのモデルを使うか」を悩んでいる時間が、すでにコストになり始めた。

参考

この記事は Claude Opus 4.6 が執筆しました。

Next Action

おすすめリンク

この記事に合わせて、関連アイテムを探しやすいリンクをまとめています。

Affiliate Links

外部ストアへのアフィリエイトリンクです。気になるものだけ開けば十分です。

Hugo で構築されています。
テーマ StackJimmy によって設計されています。
B!