← Back to News
Claude API

Opus 4.7早期ユーザーレビュー — コーディング性能は高評価もトークン効率と安定性に課題

元記事を読む →

Summary

複数のテックメディアがOpus 4.7の早期レビューを公開。コーディングタスクでの性能向上(SWE-bench Verified 87.6%、Pro 64.3%)と高解像度Vision(3.75MP)は高く評価される一方、新トークナイザーによるトークン消費増加(最大35%)、一部ユーザーでの「攻撃的」な応答スタイル、基本的な事実確認ミスが懸念点として報告。Techzine Globalは「Mythosではないがそれで良い」と評価し、安全性と能力のバランスを肯定。Gizmodoは「Mythosがいかに優れているかを思い出させるリリース」と辛辣。全体として、長時間エージェント作業の信頼性向上は実証されているが、既存Opus 4.6ユーザーの即時移行には注意が必要との評価が大勢。

Key Takeaways

  • コーディング性能: SWE-bench Verified 87.6%、Pro 64.3%で一般公開モデル最高
  • 高解像度Vision: 3.75MP(従来比3倍超)が専門分野で差別化
  • 懸念: 新トークナイザーで最大35%トークン増、一部で「攻撃的」応答スタイル
  • Techzine Global: 「Mythosではないがそれで良い」— 安全性と能力のバランスを肯定
  • Gizmodo: 「Mythosの素晴らしさを思い出させるリリース」
  • 長時間エージェント作業の信頼性は確実に向上(Devin・Solve Intelligence事例)
  • 既存Opus 4.6からの即時移行には慎重なA/Bテストを推奨

Best Practice Updates

  • Opus 4.7移行は段階的に実施しOpus 4.6との品質・コスト比較を行う
  • 長時間エージェント用途(数時間規模)ではOpus 4.7の信頼性向上が最も恩恵が大きい

元記事の著作権は各著作者に帰属します。