← Back to News
Claude API

Claude API更新(6月2日): Advisor Tool `max_tokens`パラメータ追加 — アドバイザー出力を制限しレイテンシとコストを最適化

元記事を読む →

Summary

6月2日のClaude Platform更新で、Advisor Toolに`max_tokens`パラメータが追加。アドバイザーモデル(Opus)の出力を呼び出しごとにキャップし、フルレングスのアドバイザー応答を必要としないワークロードでのレイテンシと出力トークンコストを削減。`tools[].max_tokens`でアドバイザーツール定義時に設定。Advisor Toolパターン(Sonnet/Haikuエグゼキューター+Opusアドバイザー)のコスト最適化が一層容易に。

Key Takeaways

  • Advisor Toolの`max_tokens`でアドバイザー出力長を呼び出しごとに制御可能に — 不要に長いアドバイザー応答によるトークンコスト・レイテンシを削減
  • BrowseComp・SWE-benchで実証されたAdvisor Toolパターンのコスト効率がさらに向上
  • エージェント設計でAdvisor Tool利用時は、タスクの性質に応じた`max_tokens`設定(短いガイダンス: 1,024、詳細な計画: 4,096等)を推奨

Best Practice Updates

  • Advisor Toolの`max_tokens`パラメータを活用し、アドバイザーモデルの出力制限でコスト・レイテンシを最適化すべき

元記事の著作権は各著作者に帰属します。