Anthropic
UK AISI、Claude Mythos Previewのサイバー能力評価を公開 — 「前例のない攻撃能力」と警告
元記事を読む(aisi.gov.uk) ↗Summary
英国AI Safety Institute(AISI)がClaude Mythos Previewのサイバー能力に関する評価結果を公開。エキスパートレベルのCTFタスクで73%の成功率を記録し、32ステップのエンタープライズ攻撃シミュレーション(偵察からネットワーク完全掌握まで、人間のエキスパートで約20時間相当)を史上初めて完全自律で完了したAIシステムとなった。AISIは「フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増している」と評価。ただし評価環境にはライブディフェンダーやEDRが不在であり、硬化されたエンタープライズネットワークへの侵入を意味するものではないと注意。
Key Takeaways
- ▸ エキスパートレベルCTFタスクで73%成功率(従来のモデルでは達成不可能だった難度)
- ▸ 32ステップのエンタープライズ攻撃シミュレーション「The Last Ones」を史上初めて完全自律クリア
- ▸ AISIの評価: フロンティアAIのサイバー攻撃能力は4ヶ月ごとに倍増
- ▸ 評価環境にはEDR・ライブディフェンダー不在のため、実環境への直接適用には注意が必要
- ▸ Gary Marcus氏がSubstackで独立分析を公開、業界全体で評価手法の議論が活発化
Best Practice Updates
- ✓ AI駆動攻撃の急速な能力向上(4ヶ月倍増ペース)を脅威モデリングに織り込む
- ✓ AISI評価結果を自社セキュリティレビューの基準更新に活用
Same Day Signals
すべて見る →- Claude API Claude Opus 4.7リリース — xhigh effort・Task Budgets・高解像度Vision・サイバーセキュリティ差分訓練
- Claude Code Claude Code v2.1.111リリース — Opus 4.7 xhigh対応・/ultrareview・Auto Mode・対話式/effortスライダー
- Claude Code Claude Code v2.1.112リリース — Opus 4.7 Auto Modeのホットフィックス
- Anthropic Bloomberg特集: AnthropicがMythos AIを「危険すぎてリリースできない」と判断した経緯を公開
元記事の著作権は各著作者に帰属します。