API Usage
Claude API利用のベストプラクティス集です。
Adaptive Thinkingを標準設定にする
Opus 4.6とSonnet 4.6では`thinking: {type: "adaptive"}`が推奨思考モード。Claudeが動的に思考の深さを判断し、コストを自動最適化する。
Source →effortパラメータでbudget_tokensを置き換える
`effort`パラメータがGA(一般提供)となり、ベータヘッダー不要。新モデルでは`budget_tokens`の代わりに`effort`を使用して思考の深さを制御する。
Source →長時間会話にはCompaction APIを活用する
Compaction API(ベータ)によりサーバーサイドでコンテキストを要約し、事実上無限の会話が可能。エージェントやカスタマーサポートbotに最適。
Source →コスト最適化のためSonnet 4.6を最初に検証する
Sonnet 4.6はコーディング性能が大幅に向上し、多くのユースケースでOpusが不要に。まずSonnetで要件を満たせるか検証してからOpusへの切り替えを検討する。
Source →Fast Modeでレイテンシを最適化する
`speed: "fast"`パラメータでOpusモデルの出力を最大2.5倍高速化。モデル品質は同一。リアルタイム応答が必要なチャットアプリケーションに最適。
Source →Search Results機能でRAGの引用を改善する
Search Result Content BlocksがGAとなり、RAGアプリケーションでの自然な引用と適切なソース帰属が可能に。
Source →バッチ処理にはMessage Batches APIを使用する
Message Batches APIにより大量クエリを非同期処理し、標準APIの50%のコストで実行可能。テストスイート分析やドキュメント生成に最適。
Source →MCPサーバー構築ではStreamable HTTPトランスポートを採用する
MCPサーバーをリモートサービスとして運用する場合、Streamable HTTPトランスポートが推奨。スケーラビリティとプロダクション環境での安定性が向上。
Source →Haiku 3からHaiku 4.5への移行を即座に計画する
Claude Haiku 3(`claude-3-haiku-20240307`)は2026年4月19日に廃止予定。`claude-haiku-4-5-20251001`への移行が必要。Haiku 4.5は性能が大幅に向上しており移行メリットが大きい。
Source →バッチ処理・大規模タスクはオフピーク時間帯に実行する
2026年3月27日よりピーク時間帯(平日5am-11am PT)のスロットリングが導入された。重要なバッチ処理はオフピーク時間帯にスケジューリングすることで影響を軽減可能。
Source →Models APIのcapabilitiesフィールドでモデル選択を動的に行う
`GET /v1/models`および`GET /v1/models/{model_id}`エンドポイントに`max_input_tokens`、`max_tokens`、`capabilities`オブジェクトが追加された。モデル選択ロジックをハードコードせず、データ駆動型に設計できる。
Source →Extended Thinkingのdisplayフィールドでストリーミングを高速化する
`thinking.display: "omitted"`を設定すると思考コンテンツを省略してレスポンスを高速ストリーミングできる。`signature`は保持されるためマルチターン継続が可能。ユーザー向けUIではレイテンシ最適化に、デバッグ時のみ思考内容を表示する設計を推奨。
Source →