← Back to News
Claude API

Fable 5サーバーサイドフォールバックAPI(ベータ) — リクエスト単位で最大3モデルの自動フォールバック・フォールバッククレジットでコスト最適化

元記事を読む →

Summary

Fable 5リリースと同時に`fallbacks`パラメータによるサーバーサイドフォールバックAPIがベータ公開(`server-side-fallback-2026-06-01`ヘッダー)。Fable 5の安全性分類器がリクエストを拒否した場合、同一APIコール内で最大3つのフォールバックモデル(推奨: Opus 4.8)を順次試行し1回のラウンドトリップで応答を返す。拒否応答は`stop_reason: "refusal"`・`stop_details`(category: cyber/bio/reasoning_extraction)で構造化。出力なしrefusalは無料、フォールバック時は`fallback_message`のusage.iterationsで課金を追跡。Sticky routingで同一会話の後続リクエストを自動的にフォールバックモデルにルーティング(約1時間保持)。TypeScript・Python・Go・Java・C# SDKにrefusal-fallbackミドルウェアも提供。ストリーミング対応でmid-stream refusal時もシームレスに切り替え。

Key Takeaways

  • `fallbacks: [{"model": "claude-opus-4-8"}]`で1リクエスト1レスポンスの自動フォールバック — アプリケーション側のリトライロジック不要
  • `stop_details.category`(cyber/bio/reasoning_extraction)で拒否理由をプログラマティックに判別可能
  • Sticky routing: 一度フォールバックした会話は約1時間フォールバックモデルに固定 — 毎ターンの無駄な試行を回避
  • SDKミドルウェアは全プラットフォーム対応(サーバーサイドはClaude API・Claude Platform on AWSのみ)
  • Message Batchesではfallbacks非対応 — バッチ拒否アイテムは別途リトライが必要

Best Practice Updates

  • Fable 5利用時はサーバーサイドフォールバック(Claude API/AWS)またはSDKミドルウェア(全プラットフォーム)の二択でフォールバックを必ず構成し、refusal率を監視ダッシュボードで可視化すべき

元記事の著作権は各著作者に帰属します。