Claude API
Claude APIにAutomatic Prompt Cachingが追加 — 単一cache_controlフィールドで自動キャッシュ前進
元記事を読む →Summary
Claude APIにAutomatic Prompt Caching機能が追加。リクエストボディのトップレベルに単一の`cache_control`フィールドを設定するだけで、システムが自動的に最後のキャッシュ可能ブロックにキャッシュブレークポイントを適用し、会話が成長するにつれて前進させる。マルチターン会話でメッセージ履歴を自動キャッシュしたい場合に最適で、手動ブレークポイント管理が不要に。Claude API・Azure AI Foundry(プレビュー)で利用可能、Amazon Bedrock/Google Vertex AIは今後対応予定。コスト最大90%削減、レイテンシ最大80%削減の効果。
Key Takeaways
- 単一の`cache_control`フィールドをリクエストボディのトップレベルに設定するだけで自動キャッシュ
- システムが最後のキャッシュ可能ブロックに自動でブレークポイントを適用し、会話成長に伴い前進
- ブロックレベルキャッシュ制御との併用も可能で、粗粒度・細粒度の両方で最適化
- マルチターン会話・長時間セッションに最適
- Claude API・Azure AI Foundry(プレビュー)で先行提供、Bedrock/Vertex AIは後日対応
- コスト最大90%削減・レイテンシ最大80%削減
- Claude Codeでは`--exclude-dynamic-system-prompt-sections`フラグでクロスユーザーキャッシュ効率を改善
Best Practice Updates
- マルチターン会話を扱うClaude API実装は手動のキャッシュブレークポイント管理から`cache_control`トップレベル指定への移行を検討し、キャッシュヒット率の運用負荷を削減すべき
元記事の著作権は各著作者に帰属します。