Anthropic
UK AISI、Claude Mythos Previewのサイバー能力評価を公開 — 「前例のない攻撃能力」と警告
元記事を読む →Summary
英国AI Safety Institute(AISI)がClaude Mythos Previewのサイバー能力に関する評価結果を公開。エキスパートレベルのCTFタスクで73%の成功率を記録し、32ステップのエンタープライズ攻撃シミュレーション(偵察からネットワーク完全掌握まで、人間のエキスパートで約20時間相当)を史上初めて完全自律で完了したAIシステムとなった。AISIは「フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増している」と評価。ただし評価環境にはライブディフェンダーやEDRが不在であり、硬化されたエンタープライズネットワークへの侵入を意味するものではないと注意。
Key Takeaways
- エキスパートレベルCTFタスクで73%成功率(従来のモデルでは達成不可能だった難度)
- 32ステップのエンタープライズ攻撃シミュレーション「The Last Ones」を史上初めて完全自律クリア
- AISIの評価: フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増
- 評価環境にはEDR・ライブディフェンダー不在のため、実環境への直接適用には注意が必要
- Gary Marcus氏がSubstackで独立分析を公開、業界全体で評価手法の議論が活発化
Best Practice Updates
- AI駆動攻撃の急速な能力向上(4ヶ月倍増ペース)を脅威モデリングに織り込む
- AISI評価結果を自社セキュリティレビューの基準更新に活用
元記事の著作権は各著作者に帰属します。