Claude API
Claude API更新(6月2日): Advisor Tool `max_tokens`パラメータ追加 — アドバイザー出力を制限しレイテンシとコストを最適化
元記事を読む →Summary
6月2日のClaude Platform更新で、Advisor Toolに`max_tokens`パラメータが追加。アドバイザーモデル(Opus)の出力を呼び出しごとにキャップし、フルレングスのアドバイザー応答を必要としないワークロードでのレイテンシと出力トークンコストを削減。`tools[].max_tokens`でアドバイザーツール定義時に設定。Advisor Toolパターン(Sonnet/Haikuエグゼキューター+Opusアドバイザー)のコスト最適化が一層容易に。
Key Takeaways
- Advisor Toolの`max_tokens`でアドバイザー出力長を呼び出しごとに制御可能に — 不要に長いアドバイザー応答によるトークンコスト・レイテンシを削減
- BrowseComp・SWE-benchで実証されたAdvisor Toolパターンのコスト効率がさらに向上
- エージェント設計でAdvisor Tool利用時は、タスクの性質に応じた`max_tokens`設定(短いガイダンス: 1,024、詳細な計画: 4,096等)を推奨
Best Practice Updates
- Advisor Toolの`max_tokens`パラメータを活用し、アドバイザーモデルの出力制限でコスト・レイテンシを最適化すべき
元記事の著作権は各著作者に帰属します。