2026年4月17日（金） Anthropic

UK AISI、Claude Mythos Previewのサイバー能力評価を公開 — 「前例のない攻撃能力」と警告

Summary

英国AI Safety Institute（AISI）がClaude Mythos Previewのサイバー能力に関する評価結果を公開。エキスパートレベルのCTFタスクで73%の成功率を記録し、32ステップのエンタープライズ攻撃シミュレーション（偵察からネットワーク完全掌握まで、人間のエキスパートで約20時間相当）を史上初めて完全自律で完了したAIシステムとなった。AISIは「フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増している」と評価。ただし評価環境にはライブディフェンダーやEDRが不在であり、硬化されたエンタープライズネットワークへの侵入を意味するものではないと注意。

Key Takeaways

▸ エキスパートレベルCTFタスクで73%成功率（従来のモデルでは達成不可能だった難度）
▸ 32ステップのエンタープライズ攻撃シミュレーション「The Last Ones」を史上初めて完全自律クリア
▸ AISIの評価: フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増
▸ 評価環境にはEDR・ライブディフェンダー不在のため、実環境への直接適用には注意が必要
▸ Gary Marcus氏がSubstackで独立分析を公開、業界全体で評価手法の議論が活発化

Best Practice Updates

✓ AI駆動攻撃の急速な能力向上（4ヶ月倍増ペース）を脅威モデリングに織り込む
✓ AISI評価結果を自社セキュリティレビューの基準更新に活用

Same Day Signals

すべて見る →

元記事の著作権は各著作者に帰属します。