Claude API
Fable 5サーバーサイドフォールバックAPI(ベータ) — リクエスト単位で最大3モデルの自動フォールバック・フォールバッククレジットでコスト最適化
元記事を読む →Summary
Fable 5リリースと同時に`fallbacks`パラメータによるサーバーサイドフォールバックAPIがベータ公開(`server-side-fallback-2026-06-01`ヘッダー)。Fable 5の安全性分類器がリクエストを拒否した場合、同一APIコール内で最大3つのフォールバックモデル(推奨: Opus 4.8)を順次試行し1回のラウンドトリップで応答を返す。拒否応答は`stop_reason: "refusal"`・`stop_details`(category: cyber/bio/reasoning_extraction)で構造化。出力なしrefusalは無料、フォールバック時は`fallback_message`のusage.iterationsで課金を追跡。Sticky routingで同一会話の後続リクエストを自動的にフォールバックモデルにルーティング(約1時間保持)。TypeScript・Python・Go・Java・C# SDKにrefusal-fallbackミドルウェアも提供。ストリーミング対応でmid-stream refusal時もシームレスに切り替え。
Key Takeaways
- `fallbacks: [{"model": "claude-opus-4-8"}]`で1リクエスト1レスポンスの自動フォールバック — アプリケーション側のリトライロジック不要
- `stop_details.category`(cyber/bio/reasoning_extraction)で拒否理由をプログラマティックに判別可能
- Sticky routing: 一度フォールバックした会話は約1時間フォールバックモデルに固定 — 毎ターンの無駄な試行を回避
- SDKミドルウェアは全プラットフォーム対応(サーバーサイドはClaude API・Claude Platform on AWSのみ)
- Message Batchesではfallbacks非対応 — バッチ拒否アイテムは別途リトライが必要
Best Practice Updates
- Fable 5利用時はサーバーサイドフォールバック(Claude API/AWS)またはSDKミドルウェア(全プラットフォーム)の二択でフォールバックを必ず構成し、refusal率を監視ダッシュボードで可視化すべき
元記事の著作権は各著作者に帰属します。