Claude Opus 4.8リリース(5月28日)後の開発者・アナリストレビューが5月29-30日にかけてTokenMix・the-decoder・Vellum・Digital Applied・9to5Mac等から公開された。主要ベンチマーク分析: (1)SWE-bench Pro 69.2%でOpus 4.7(64.3%)・GPT-5.5(58.6%)・Gemini 3.1 Pro(54.2%)を大差リード。(2)Humanity's Last Exam 49.8%(ツールなし)でGPT-5.5(41.4%)を8.4pt上回る。(3)Online-Mind2Web 84%でWebエージェントタスクの「意味のある跳躍」と評価。(4)Harvey Legal Agent Benchmark(all-pass基準)で初めて10%を超えた最初のモデルとなり法務エージェント実用化の閾値に到達。(5)GDPval-AA Elo 1890(Opus 4.7比+137)で知識作業能力が大幅向上。開発者向け推奨: Opus 4.7からの移行はモデルID変更のみで同一価格のため即時推奨。the-decoderはAnthropicの「控えめだが実質的な改善」という位置づけを引用しつつ、複数ベンチマークでのトップ性能を強調。
Claude Code v2.1.154が5月28日にリリースされ、Claude Opus 4.8の統合とDynamic Workflows(リサーチプレビュー)の導入を含む44の変更を実装。Opus 4.8がClaude Codeのデフォルトトップティアモデルとして利用可能になり、SWE-bench Pro 69.2%のエージェントコーディング性能がClaude Code内で直接活用できる。Dynamic Workflowsにより、プロンプトから動的にサブエージェントオーケストレーションを生成・実行する機能が追加。DevelopersIOの分析によると、バックグラウンドセッション・claudeエージェント周辺の安定化にも焦点が当てられており、Opus 4.8の誠実性向上(コード欠陥無批判報告0%)がClaude Codeでのコーディング品質にも寄与する。v2.1.153からの即時アップデートを推奨。
Claude Opus 4.8が5月28日のリリースと同時にAmazon Bedrock・Google Cloud Vertex AI・Microsoft Foundryで一般提供開始。DevelopersIO(5月29日記事)によるとAmazon BedrockではCross-Region Inference対応で複数リージョンからの利用が可能。1Mトークンコンテキストウィンドウ・128k最大出力トークンの全機能がクラウドプロバイダー経由でも利用可能。Opus 4.7と同一価格で提供され、エージェントコーディング(SWE-bench Pro 69.2%)・誠実性向上(欠陥報告率0%)・知識作業スコア向上の全改善がマルチクラウド環境で即座に活用できる。既存のBedrock・Vertex AI環境でのモデルIDの更新のみで移行可能。
Claude Opus 4.8リリースと同時に、claude.ai・Coworkのモデルセレクタ横にEffort Control UIが追加された。ユーザーがLow〜Maxの範囲でClaudeの応答深度を直接制御でき、高effortでは思考頻度・深度が増し高品質な応答を生成、低effortでは高速応答でレート制限消費を抑制する。Opus 4.8ではeffortデフォルトが全サーフェス(Claude API・Claude Code・claude.ai)で`high`に設定。APIで`effort`パラメータを明示的に設定しているユーザーの設定は変更されない。従来はAPI・Claude Codeからのみ制御可能だったeffort設定が、コンシューマー向けUIでも直接操作可能になり、Claude利用体験のカスタマイズ性が向上。
Claude Opus 4.8のAPI詳細機能が公式ドキュメントで公開。(1)プロンプトキャッシュ最小長がOpus 4.7から引き下げられ1,024トークンに。短いプロンプトでもキャッシュエントリ作成が可能になり、繰り返し呼び出しのコスト効率が向上。(2)stop_detailsオブジェクトがrefusal応答時に公式ドキュメント化。拒否カテゴリ(cyber・bio・null)と人間可読な説明を返し、アプリケーション内で拒否クラス別のルーティング(再試行・代替モデル・ユーザー通知等)が可能に。Opus 4.7から利用可能だったが正式なドキュメント化は今回が初。(3)Claude Code v2.1.154でLean System Promptが Haiku・Sonnet・Opus 4.7以前を除く全モデルのデフォルトに。より簡潔なシステムプロンプトでトークン効率が向上。(4)Adaptive thinkingの改善: 同一effortレベルでの無駄なthinkingトークン削減、ツールトリガリングの改善(必要なツール呼び出しのスキップ減少)、コンパクション後の長コンテキスト品質向上。
Fortune(5月26日)・Axios(5月27日)・Time・AI Magazine等が、OpenAI CEO Sam AltmanとAnthropic CEO Dario Amodeiが以前のAI雇用影響予測を大幅に後退させていると一斉報道。Altmanは2025年6月の「エントリーレベル職が深刻なリスク」発言から「かなり間違っていた(pretty wrong)」と転換。Amodeiも2025年の「ホワイトカラー職の50%がAIに置換される可能性」から「自動化は実際には人々の仕事を拡大する可能性がある」へ方針転換し、ジェボンズのパラドックス(効率化が需要拡大を生む)を引用。一方、Anthropic共同創業者Chris Olahはバチカン講演(5月25日)で「AIが非常に大規模に人間の労働を置き換える現実的な可能性」を維持。Fortune・複数メディアはこの転換のタイミングがAnthropic 10月・OpenAI 9月のIPOターゲットと重なることを指摘し、「機関投資家を引き付けるためのナラティブ調整」と分析。両社合わせて$2T規模の上場が見込まれる。