2026年4月14日（火） Anthropic

Zvi Mowshowitz氏がClaude Mythos System Card詳細分析を公開 — 評価項目ごとに公開モデルとの差分を精査

Summary

AI安全研究者

✓ AI能力評価を内製する場合は「段階的ジャンプ」想定で評価項目を定期更新、SWE-bench・cyber offense benchmarkのカバレッジを拡大
✓ サードパーティAI安全研究者（Zvi・Simon Willison・Gary Marcus等）の独立分析を調達判断の情報ソースに組み込む

元記事の著作権は各著作者に帰属します。