Claudeの品質退行に対するユーザー反発が拡大 — Anthropicは「effort mediumデフォルト化」を認めるも透明性不足を批判

Summary

Fortune・VentureBeat・The Register等主要メディアが4月14日、Anthropic Claudeの性能退行に対する開発者・ヘビーユーザーからの反発が拡大していると報じた。AMD AI責任者Stella Laurenzo氏の6,852セッション分析（4月2日公開）で「Claudeの推論深度が2月から約67%急落」「Claude Codeがコード修正前に読む回数が6.6→2.0に低下」「premature stopping・simplistic behaviorが増加」が報告されたことが契機。Anthropic側はClaude Code責任者Boris Cherny氏が「ユーザーフィードバックを受けてデフォルトeffortを`medium`に引き下げた」と認めたが、「変更をユーザーに強調しなかった」点が透明性欠如として批判されている。VentureBeatは「nerfing」疑惑としてリポート、The Registerは「Claude is getting worse, according to Claude」と皮肉的見出し。競合（OpenAI等）は「Anthropicがcompute capacityを十分確保できず戦略的ミスを犯した」と主張、Anthropicは「smaller compute curve」で運営との内部メモが流出。Anthropic自身の直近のインフラ多様化（CoreWeave・Google TPU・AWS Trainium三系統）と需要急増（$30B ARR）の文脈で、品質と供給のトレードオフが顕在化。

Key Takeaways

▸ Claude品質退行: AMD Stella Laurenzo氏の6,852セッション分析で67%推論深度低下を報告
▸ Read:Edit比率6.6→2.0、premature stopping・simplistic behaviorの増加が指標
▸ Boris Cherny氏がデフォルトeffortの`medium`引き下げを公式に認める
▸ 変更をユーザーに明示しなかった「透明性欠如」が批判対象
▸ VentureBeatが「nerfing」疑惑、The Registerが「Claude is getting worse, according to Claude」と報道
▸ OpenAI収益責任者が「Anthropicのcompute確保戦略ミス」と内部メモで主張
▸ Anthropic内部メモでも「smaller compute curve」運営を認識
▸ $30B ARR・連続障害・品質退行の三重圧力でインフラ供給逼迫が顕在化

Best Practice Updates

✓ effort設定は明示的に制御（`/effort high`でmid-session切り替え、重要タスクはhigh/max指定）
✓ `/stats`でRead:Edit比率・stop-hook違反・推論ループをセッション単位で監視
✓ 品質退行の兆候検知にはStella Laurenzo氏のGitHub Issue #42796のスクリプトを参考
✓ 本番ワークフローではマルチプロバイダー（Bedrock/Vertex AI/CoreWeave）構成で可用性と品質の両方をヘッジ
✓ 重要な長期タスクはOpus 4.6＋Advisor Toolや、コスト許容範囲ならOpus 4.6を明示指定
✓ Anthropicの公式communicationと独立分析（AMD Laurenzo・Simon Willison・Zvi Mowshowitz）の両方を品質判断材料に

Same Day Signals

すべて見る →