Claude API
Opus 4.8 API新機能詳細: プロンプトキャッシュ最小長1,024トークン引き下げ・stop_details公式ドキュメント化・Lean System Prompt
元記事を読む →Summary
Claude Opus 4.8のAPI詳細機能が公式ドキュメントで公開。(1)プロンプトキャッシュ最小長がOpus 4.7から引き下げられ1,024トークンに。短いプロンプトでもキャッシュエントリ作成が可能になり、繰り返し呼び出しのコスト効率が向上。(2)stop_detailsオブジェクトがrefusal応答時に公式ドキュメント化。拒否カテゴリ(cyber・bio・null)と人間可読な説明を返し、アプリケーション内で拒否クラス別のルーティング(再試行・代替モデル・ユーザー通知等)が可能に。Opus 4.7から利用可能だったが正式なドキュメント化は今回が初。(3)Claude Code v2.1.154でLean System Promptが Haiku・Sonnet・Opus 4.7以前を除く全モデルのデフォルトに。より簡潔なシステムプロンプトでトークン効率が向上。(4)Adaptive thinkingの改善: 同一effortレベルでの無駄なthinkingトークン削減、ツールトリガリングの改善(必要なツール呼び出しのスキップ減少)、コンパクション後の長コンテキスト品質向上。
Key Takeaways
- プロンプトキャッシュ最小長1,024トークン — 短いプロンプトでもキャッシュ可能に
- stop_details公式ドキュメント化 — 拒否カテゴリ別のアプリケーション内ルーティングが正式サポート
- Lean System Prompt がデフォルト化 — トークン効率向上
- Adaptive thinking改善 — 無駄なthinkingトークン削減・ツールトリガリング改善
Best Practice Updates
- プロンプトキャッシュ最小長1,024トークンにより短いシステムプロンプトでもキャッシュ活用可能 — バッチ処理・並列エージェントのコスト最適化に寄与
- stop_detailsを活用し拒否応答のカテゴリ別ハンドリングをアプリケーションに組み込むべき
元記事の著作権は各著作者に帰属します。