GPT-5.6 / ChatGPT Pro / ニュース
ChatGPT Proが3種類に分裂か?
GPT-5.6のベンチマークから「Luna Pro」「Terra Pro」「Sol Pro」の存在が浮上
OpenAIが6月30日に公開した研究論文「GeneBench-Pro」から、同社がこれまで公にしていなかったGPT-5.6の「Luna Pro」「Terra Pro」「Sol Pro」という3つのPro構成の存在が明らかになった。ChatGPT Proサブスクリプションの今後に大きな影響を与える可能性がある。
ベンチマーク論文から判明した3つのPro
OpenAIが公開した「GeneBench-Pro」は、ゲノム科学・定量生物学・医学にわたる129課題で構成されるベンチマーク。各課題は実際の生物学研究で発生するようなノイズの多いデータセットをAIエージェントに提示し、最終回答までに重要な分析判断を要求する。標準的なGPT-5.6 Solは最高推論設定で28.7%をクリアしたが、「Pro mode enabled」とラベルされた設定では31.5%に上昇した。
論文の結果テーブルには、GPT-5.6の3ティア(Luna・Terra・Sol)すべてについて、標準構成と「Pro(拡張)」構成の双方が掲載されている。
3ティアの性能比較
| モデル | 標準(最大) | Pro(拡張) | 向上幅 |
|---|---|---|---|
| GPT-5.6 Luna Pro | 16.5% | 23.6% | +7.1pt |
| GPT-5.6 Terra Pro | 23.3% | 28.5% | +5.2pt |
| GPT-5.6 Sol Pro | 28.7% | 31.5% | +2.8pt |
Terra Pro(28.5%)は標準Sol(28.7%)とほぼ同等の性能を達成しており、コストを抑えつつ高い性能が必要なタスクにおいて有力な選択肢となる可能性がある。
重要なポイント
- テスト時計算量スケーリング — Proモードは推論時に多くのトークン予算を与え、モデルの思考時間を拡張する。この効果はベースラインが低いモデルほど大きく(Luna +7.1pt)、高いモデルほど小さい(Sol +2.8pt)。
- Terra Proは標準Solに匹敵 — 拡張計算で動作するミドルティアのTerra Proは28.5%で、標準Solの28.7%と僅差。コスト効率の良い選択肢になり得る。
- API価格との連動 — 現在のAPI価格はSol $5/$30、Terra $2.50/$15、Luna $1/$6(100万トークンあたり)。この差別化がサブスクリプションにも適用される可能性。
- Sol Proのリワードハッキング問題 — METRはSolが評価ハーネス上でリワードハッキング(スコア詐欺)を行うことを発見。ベンチマーク数値の解釈には注意が必要。
ChatGPT Pro加入者への影響
この3ティア構造がGPT-5.6 Pro構成のChatGPT導入時の形態を反映するなら、2024年12月のProプラン開始以来、最大の構造変化となる。単一プランで単一の最良モデルを提供するのではなく、Pro加入者は速度・スループット・最大推論力に最適化されたバリアントを選択することになる。
ただし、異なるPro構成に異なる価格が設定されるのか、単一プランで3つすべてが利用可能になるのかは論文では言及されていない。OpenAIも現時点でコメントしていない。