Anthropic Institute「When AI builds itself」公開 — AIの再帰的自己改善リスクを警告、フロンティアAI開発の協調的一時停止を提唱

Summary

Anthropic Instituteが6月4日、Marina Favaro（内部リサーチ責任者）とJack Clark（共同創業者）の共著レポート「When AI builds itself」を公開。公開ベンチマークとAnthropic内部未公開データを用いてAIの再帰的自己改善（recursive self-improvement）リスクを定量的に分析。主要データ: (1)2026年5月時点でAnthropicのコードベースにマージされたコードの80%以上がClaude製（2025年2月のClaude Code研究プレビュー開始時は一桁台前半）、(2)2026年Q2にエンジニア1人あたりの1日コードマージ量が2024年比8倍に増加（人間が指揮・レビューしClaudeが執筆する分業）、(3)Claude Opus 4が2025年5月に平均3倍の高速化を達成、2026年4月にはMythos Previewが52倍に到達。レポートは「再帰的自己改善はまだ達成されておらず不可避でもないが、ほとんどの機関が準備する前に到来する可能性がある」と結論。政策提言として、複数国の複数フロンティアラボが同条件で停止に合意し、停止を相互検証できるメカニズムの構築を前提とした「フロンティアAI開発の一時停止オプション」を提唱。Anthropic Instituteは今後、政策立案者・AI研究者との議論を主催し、検証システムの設計に協力すると表明。国際的に大きな反響を呼び、批評家からは$965B評価額のIPO直前のタイミングで「競合を抑制する戦略」との指摘もあるが、Wharton教授は「マーケティングと真摯な信念の両方がある」と分析。

Key Takeaways

▸ Anthropicコードベースの80%以上がClaude製（16ヶ月で一桁台→80%超） — AIによるAI開発加速の最も具体的な定量データ
▸ エンジニア1人あたり8倍のコード生産性（2024年比、Q2 2026） — ただし「行数は不完全な指標」とAnthropic自身が注記
▸ Mythos Previewが52倍の高速化を達成（Claude Opus 4の3倍から17倍以上の加速） — 再帰的自己改善のフィードバックループの初期兆候
▸ 「協調的一時停止」には複数ラボ・複数国の合意と停止の相互検証メカニズムが前提 — 一社の自発的制限ではなく業界全体のガバナンスフレームワークが必要
▸ IPO直前のタイミングに「競合抑制戦略」との批判 — Sam Altmanの過去の「恐怖マーケティング」批判が再浮上

Best Practice Updates

✓ AIエージェント設計ではAnthropicの内部データ（80% AI製コード・8倍生産性）が示すAI自律化加速を前提に、(1)エージェントの自己修正・自己拡張に対するガードレール（kill switch・human-in-the-loop checkpoints）を必須設計要素に、(2)エージェント出力の品質レビュープロセスを強化すべき

Same Day Signals

すべて見る →