← Back to News
Anthropic

UK AISI、Claude Mythos Previewのサイバー能力評価を公開 — 「前例のない攻撃能力」と警告

元記事を読む →

Summary

英国AI Safety Institute(AISI)がClaude Mythos Previewのサイバー能力に関する評価結果を公開。エキスパートレベルのCTFタスクで73%の成功率を記録し、32ステップのエンタープライズ攻撃シミュレーション(偵察からネットワーク完全掌握まで、人間のエキスパートで約20時間相当)を史上初めて完全自律で完了したAIシステムとなった。AISIは「フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増している」と評価。ただし評価環境にはライブディフェンダーやEDRが不在であり、硬化されたエンタープライズネットワークへの侵入を意味するものではないと注意。

Key Takeaways

  • エキスパートレベルCTFタスクで73%成功率(従来のモデルでは達成不可能だった難度)
  • 32ステップのエンタープライズ攻撃シミュレーション「The Last Ones」を史上初めて完全自律クリア
  • AISIの評価: フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増
  • 評価環境にはEDR・ライブディフェンダー不在のため、実環境への直接適用には注意が必要
  • Gary Marcus氏がSubstackで独立分析を公開、業界全体で評価手法の議論が活発化

Best Practice Updates

  • AI駆動攻撃の急速な能力向上(4ヶ月倍増ペース)を脅威モデリングに織り込む
  • AISI評価結果を自社セキュリティレビューの基準更新に活用

元記事の著作権は各著作者に帰属します。