Anthropic
Claudeの品質退行に対するユーザー反発が拡大 — Anthropicは「effort mediumデフォルト化」を認めるも透明性不足を批判
元記事を読む →Summary
Fortune・VentureBeat・The Register等主要メディアが4月14日、Anthropic Claudeの性能退行に対する開発者・ヘビーユーザーからの反発が拡大していると報じた。AMD AI責任者Stella Laurenzo氏の6,852セッション分析(4月2日公開)で「Claudeの推論深度が2月から約67%急落」「Claude Codeがコード修正前に読む回数が6.6→2.0に低下」「premature stopping・simplistic behaviorが増加」が報告されたことが契機。Anthropic側はClaude Code責任者Boris Cherny氏が「ユーザーフィードバックを受けてデフォルトeffortを`medium`に引き下げた」と認めたが、「変更をユーザーに強調しなかった」点が透明性欠如として批判されている。VentureBeatは「nerfing」疑惑としてリポート、The Registerは「Claude is getting worse, according to Claude」と皮肉的見出し。競合(OpenAI等)は「Anthropicがcompute capacityを十分確保できず戦略的ミスを犯した」と主張、Anthropicは「smaller compute curve」で運営との内部メモが流出。Anthropic自身の直近のインフラ多様化(CoreWeave・Google TPU・AWS Trainium三系統)と需要急増($30B ARR)の文脈で、品質と供給のトレードオフが顕在化。
Key Takeaways
- Claude品質退行: AMD Stella Laurenzo氏の6,852セッション分析で67%推論深度低下を報告
- Read:Edit比率6.6→2.0、premature stopping・simplistic behaviorの増加が指標
- Boris Cherny氏がデフォルトeffortの`medium`引き下げを公式に認める
- 変更をユーザーに明示しなかった「透明性欠如」が批判対象
- VentureBeatが「nerfing」疑惑、The Registerが「Claude is getting worse, according to Claude」と報道
- OpenAI収益責任者が「Anthropicのcompute確保戦略ミス」と内部メモで主張
- Anthropic内部メモでも「smaller compute curve」運営を認識
- $30B ARR・連続障害・品質退行の三重圧力でインフラ供給逼迫が顕在化
Best Practice Updates
- effort設定は明示的に制御(`/effort high`でmid-session切り替え、重要タスクはhigh/max指定)
- `/stats`でRead:Edit比率・stop-hook違反・推論ループをセッション単位で監視
- 品質退行の兆候検知にはStella Laurenzo氏のGitHub Issue #42796のスクリプトを参考
- 本番ワークフローではマルチプロバイダー(Bedrock/Vertex AI/CoreWeave)構成で可用性と品質の両方をヘッジ
- 重要な長期タスクはOpus 4.6+Advisor Toolや、コスト許容範囲ならOpus 4.6を明示指定
- Anthropicの公式communicationと独立分析(AMD Laurenzo・Simon Willison・Zvi Mowshowitz)の両方を品質判断材料に
元記事の著作権は各著作者に帰属します。