Claude API
Opus 4.7早期ユーザーレビュー — コーディング性能は高評価もトークン効率と安定性に課題
元記事を読む →Summary
複数のテックメディアがOpus 4.7の早期レビューを公開。コーディングタスクでの性能向上(SWE-bench Verified 87.6%、Pro 64.3%)と高解像度Vision(3.75MP)は高く評価される一方、新トークナイザーによるトークン消費増加(最大35%)、一部ユーザーでの「攻撃的」な応答スタイル、基本的な事実確認ミスが懸念点として報告。Techzine Globalは「Mythosではないがそれで良い」と評価し、安全性と能力のバランスを肯定。Gizmodoは「Mythosがいかに優れているかを思い出させるリリース」と辛辣。全体として、長時間エージェント作業の信頼性向上は実証されているが、既存Opus 4.6ユーザーの即時移行には注意が必要との評価が大勢。
Key Takeaways
- コーディング性能: SWE-bench Verified 87.6%、Pro 64.3%で一般公開モデル最高
- 高解像度Vision: 3.75MP(従来比3倍超)が専門分野で差別化
- 懸念: 新トークナイザーで最大35%トークン増、一部で「攻撃的」応答スタイル
- Techzine Global: 「Mythosではないがそれで良い」— 安全性と能力のバランスを肯定
- Gizmodo: 「Mythosの素晴らしさを思い出させるリリース」
- 長時間エージェント作業の信頼性は確実に向上(Devin・Solve Intelligence事例)
- 既存Opus 4.6からの即時移行には慎重なA/Bテストを推奨
Best Practice Updates
- Opus 4.7移行は段階的に実施しOpus 4.6との品質・コスト比較を行う
- 長時間エージェント用途(数時間規模)ではOpus 4.7の信頼性向上が最も恩恵が大きい
元記事の著作権は各著作者に帰属します。