OpenAIは2026年6月26日、GPT-5.6シリーズの限定プレビューを開始しました。シリーズはSol、Terra、Lunaの3モデルで構成され、最初は米国政府の承認を受けた約20社の信頼パートナーに限定して提供されます。広範な公開は数週間以内を予定しています。

📑目次
  1. GPT-5.6シリーズの3モデル概要と新機能
  2. 米国政府要請による限定プレビューの背景と理由
  3. 強化された安全保障機能・セーフガードとred-teaming
  4. 価格体系・利用可能タイミング・Cerebras統合
  5. ベンチマーク結果(Terminal-Bench, GeneBench, ExploitBench)と影響
  6. 読者(AIエンジニア・企業)への示唆と今後の展望
  7. まとめ
  8. FAQ

GPT-5.6シリーズの3モデル概要と新機能

GPT-5.6はSolをフラッグシップモデル、Terraをバランス型、Lunaを高速・低価格型として位置づけています。Solは最も強力な安全対策を備え、cyber、biology、misuseに対する保護を強化しました。TerraはGPT-5.5の半額程度で利用可能で、Lunaはさらに手頃な価格帯です。新たにSolではmax reasoning effortとultra modeが追加され、ultra modeでは複数のsub-agentが協調して動作します。

これらのモデルはAPIとCodex経由で最初にパートナーに提供され、ChatGPTへの展開も順次行われます。Cerebrasとの統合により、Solは7月から最大750 tokens/secの推論速度を実現する予定です。


米国政府要請による限定プレビューの背景と理由

米国政府(Trump政権)は国家安全保障上の懸念から、GPT-5.6の広範なリリースを制限しました。OpenAIは過去1ヶ月間にわたり政府とプレビューを共有し、Sam Altman氏が6月初旬にWhite Houseを訪問した経緯もあります。政府はcyber Executive Orderの枠組み整備を進めており、8月までに「covered frontier models」に対する分類プロセスを完了させる計画です。

OpenAIは当初、このような厳格なper-customer承認や20社限定という形態を想定していませんでした。同社は「この種の政府アクセスプロセスが長期的なデフォルトになるべきではない」との立場を示しています。AnthropicのFable 5やMythos 5に対する類似の制限事例も参考にされています。


強化された安全保障機能・セーフガードとred-teaming

Solはこれまでで最も堅牢なsafety stackを搭載しています。model training、real-time classifiers、account review、自動red-teaming(700k GPU hours)を組み合わせた多層防御を採用しました。GPT-5.6 Solは脆弱性の発見・修正能力でend-to-end攻撃能力を上回る結果を示し、Cyber Critical thresholdには達していません。

政府は防御的な用途での実質的な利益を期待する一方、禁止された攻撃的用途を抑制する方向で調整を進めています。OpenAIはこれらのセーフガードを自動および人間によるred-teamingで検証済みです。


価格体系・利用可能タイミング・Cerebras統合

価格は以下の通りです。

モデル Input ($/1M tokens) Output ($/1M tokens)
Sol 5 30
Terra 2.50 15
Luna 1 6

Prompt cachingではwriteで1.25x、readで90%の割引が適用されます。限定プレビューは即時開始され、広範な一般公開は数週間以内、ChatGPTやCodexへの展開も順次予定されています。Cerebras統合は7月にSol向けに開始され、初期は限定ユーザー向けです。

出典: OpenAI公式発表(2026年6月時点)、Axios報道(2026年6月時点)


ベンチマーク結果(Terminal-Bench, GeneBench, ExploitBench)と影響

SolはTerminal-Bench 2.1(coding)、GeneBench v1(biology)、ExploitBenchおよびExploitGym(cyber)で高いスコアを記録しました。Agenticな改善により、coding、biology、cybersecurity分野での実務適用が期待されます。

これらのベンチマークは、モデルが実際のワークフローでどのように機能するかを示すものであり、単なる理論値ではありません。Solは防御的なセキュリティ作業を支援しつつ、攻撃的な用途を制限する設計となっています。


読者(AIエンジニア・企業)への示唆と今後の展望

AIエンジニアや企業にとっては、frontier modelのリリースが政府介入により段階的になる初の事例です。セキュリティ審査の新潮流を理解し、APIアクセスやCodex統合のタイミングを計画する必要があります。OpenAIの「理想的でないが持続可能でない」という指摘は、今後の規制環境がどう変化するかの指標となります。

実務では、限定プレビュー期間中に自社のユースケースを検証し、広範公開後の移行を準備することが推奨されます。Cerebras統合による高速化は、latency-sensitiveなアプリケーションに特に有効です。


関連記事:

まとめ

GPT-5.6シリーズは安全性を最優先に、限定プレビューから段階的に展開されます。Sol、Terra、Lunaの3モデルはそれぞれ異なるニーズに対応し、価格と性能のバランスを提供します。政府要請による制限は一時的な措置であり、Executive Orderの詳細が明らかになる8月以降の動きに注目が集まります。

AIエンジニアは公式発表と報道を継続的に追うことで、適切なタイミングで新機能を活用できるでしょう。


FAQ

Q: GPT-5.6の限定プレビューはどのように申し込めますか?

現在は政府承認済みの約20社に限定されており、一般ユーザー向けの申し込みは受け付けていません。広範な公開を待つか、OpenAIのパートナープログラムを監視してください。

Q: SolとTerra、Lunaの違いは何ですか?

Solは最上位の性能と安全性を備えたフラッグシップ、Terraは性能と価格のバランス型、Lunaは速度と低価格を重視したモデルです。

Q: 価格はGPT-5.5と比べてどう変わりますか?

TerraはGPT-5.5の約半額、Lunaはさらに低価格帯です。Prompt cachingの割引も強化されています。

Q: 安全対策は具体的に何が強化されたのですか?

多層のred-teaming(70万GPU時間相当)とreal-time classifier、account reviewを組み合わせ、cyberとbiology分野のmisuseを抑制します。

Q: Cerebras統合で何が変わりますか?

Solの推論速度が最大750 tokens/secまで向上し、7月から限定ユーザー向けに提供開始されます。

Q: 政府の制限はいつまで続くのですか?

8月までにExecutive Orderの詳細が決まる見通しで、それ以降のプロセスが明確になる予定です。

Q: ベンチマークで特に優れている点は?

Terminal-Benchでのcoding能力、GeneBenchでのbiologyタスク、ExploitBenchでの脆弱性検出で高い評価を得ています。

krona23

著者

krona23

IT業界20年以上の実務経験を持ち、日本国内有数のPVを誇る大規模Webサービスで事業部長・CTOを複数社で歴任。Windows/iOS/Android/Webと技術の変遷を経験し、現在はAIネイティブへの変革に注力。DevGENTでは、AIコードエディタ・自動化ツール・LLMの実践的な使い方を日英西3言語で発信中。

DevGENT について →

コメントを残す

Trending

DevGENTをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む