Daily Log

2026年5月11日（月）

8 signals received

Claude API

Claude for Microsoft 365: Word・Excel・PowerPoint GA化 + Outlook Public Beta開始 — クロスアプリコンテキスト共有でOfficeワークフローを統合

Anthropicが5月7日にClaude for Microsoft 365 add-ins（Word・Excel・PowerPoint）をGA（一般提供）に昇格、同時にClaude for Outlookをパブリックベータとして公開。4月のベータから正式版に移行し、全有料プラン（Pro・Max・Team・Enterprise）で利用可能。最大の特徴はクロスアプリコンテキスト共有：Outlookでメールを要約→Excelで分析→PowerPointでプレゼン作成という一連の作業で、Claudeが全アプリ間の会話コンテキストを自動的に引き継ぐ。Outlookベータはメール起草・返信・会議招待をClaude側で生成し、送信はユーザーが手動クリック（Mail.Send権限は未取得）。Microsoft AppSourceから即時インストール可能、Windows・Mac・Web版Office対応。追加料金なし。

MCP

AWS MCP ServerがGA化 — AIコーディングエージェントから15,000+ AWS APIにセキュアアクセス

AWSが5月6日にAWS MCP Serverの一般提供（GA）を発表。AIコーディングエージェント（Claude Code・Kiro・Cursor等のMCP互換クライアント）にAWS 15,000+サービスAPIへのセキュアで監査可能なアクセスを提供するマネージドMCPサーバー。`call_aws`ツールで任意のAWS API操作（ファイルアップロード・長時間実行含む）を実行可能、`search_documentation`/`read_documentation`で最新AWS公式ドキュメントをクエリ時に取得。GA版ではIAMコンテキストキー（`aws:ViaAWSMCPService`）でAI操作を既存IAMポリシー内で分離制御可能に。ドキュメント検索は認証不要化。インタラクションあたりのトークン消費も削減。追加料金なし（使用AWSリソースの料金のみ）。CloudWatch・CloudTrailによるセキュリティ監査統制を提供。

Anthropic

Snyk × Anthropic パートナーシップ — AI生成コードの脆弱性をClaude統合で自動検出・優先順位付け・修正生成

Snykが5月7日にAnthropicのClaudeモデルをSnyk AI Security Platformに統合したことを発表。コード・依存関係・コンテナ・AI生成アーティファクト全体で脆弱性の自動発見・優先順位付け・開発者向けフィックス生成を実行可能に。Snyk 2026 State of Agentic AI Adoption Reportによれば本番コードの65-70%がAI生成で、ほぼ半数に脆弱性が含まれる。エージェントが出力するコードは従来のAppSecツールの範囲外で動作する問題がある。Anthropic Deputy CISO Jason Clinton氏は「検出ではなくアクション化がボトルネック」と指摘。Claude Security（コードベース全体のデータフロー追跡スキャン）とSnyk（依存関係・コンテナ・アーティファクト）を組み合わせた二層セキュリティ体制で、AI生成コードのセキュリティカバレッジを最大化する設計が推奨される。

Anthropic

Dragos報告: Claude AIがメキシコ水道インフラへのOTサイバー攻撃に悪用された初の詳細事例

産業サイバーセキュリティ企業Dragosが5月8日に公開した報告で、メキシコ・モンテレイの水道ユーティリティを標的とした2025年12月〜2026年2月のAI支援サイバー攻撃キャンペーンの全容が明らかになった。攻撃者はClaude CodeとOpenAI GPT-4.1を使用し、偵察・エクスプロイトカスタマイズ・権限昇格・認証情報収集を実行。Claudeが主要技術実行者としてマルウェアツーリングの生成・テスト・リファインをリアルタイムで行い、OT環境の重要インフラ価値を独自に特定してIT-OT境界突破経路を調査した。IT環境への侵害は成功したがOT侵入は失敗。AIモデルの安全性ガードレールが高度な攻撃者による悪用を完全には阻止できないことが初めて詳細に実証された事例であり、多層防御設計の重要性が改めて確認された。

Claude Code

Claude Code v2.1.132 — stdio MCPサーバーの10GB+メモリリーク修正・CLAUDE_CODE_SESSION_ID環境変数追加

Claude Code v2.1.132（5月6日リリース）でstdio MCPサーバーとの通信における無制限メモリ成長（10GB+のRSS膨張）を修正。stdio MCPサーバーがstdoutに非プロトコルデータを出力した際にメモリが無制限に膨張する問題で、MCP長時間セッション利用者に深刻な影響があった。接続成功後にtools/listが失敗するMCPサーバーが0ツールでサイレント表示される問題も修正（1回リトライし「connected · tools fetch failed」と表示するように改善）。新たに`CLAUDE_CODE_SESSION_ID`環境変数がBashツールのサブプロセスに追加され、外部スクリプト・CI/CDからセッションIDベースのログ追跡が可能に。ラップトップスリープ/ウェイク後のフルスクリーン空白画面、IDE（Cursor・VS Code・JetBrains）でのマウスホイールスクロール問題、外部SIGINTでのグレースフルシャットダウン未実行等、多数の安定性バグも修正。

Claude API

Anthropic Financial Services Agents — Wall Street向け10種Pre-built AIエージェント + Moody's MCPデータ統合を発表

Anthropicが5月5日のニューヨーク金融サービスブリーフィングで、金融業界向け10種のPre-built AIエージェントテンプレートを発表。リサーチ・クライアントカバレッジ5種（ピッチビルダー、ミーティングプレッパー、アーニングスレビューアー、モデルビルダー、マーケットリサーチャー）とファイナンス・オペレーション5種（バリュエーションレビューアー、GL照合、月次クローズ、ステートメントオーディター、KYCスクリーナー）で構成。Claude Cowork/Claude Codeプラグイン＋Managed Agents cookbookの三面展開で提供。同時にMoody'sとのMCPデータパートナーシップを発表し、600万企業・20億所有権リンクの信用格付けデータがClaude内ネイティブアプリとして統合された。JPMorgan CEO Jamie DimonがClaude Codeで20分でダッシュボードを構築し「非常に正確」と評価。銀行・保険・アセットマネジメント・フィンテック全領域をカバーする包括的な金融AIエージェント戦略の開始。

Claude API

Claude Managed Agents: Dreaming・Outcomes・Multi-agent Orchestration — Code with Claude SFで3大新機能を発表

Anthropicが5月6日のCode with Claude SFで、Claude Managed Agentsの3大新機能を発表。(1) **Dreaming**（リサーチプレビュー）: エージェントが過去のセッションを自律的に検査し、パターン抽出・メモリ整理・反復的ミスの特定を通じて自己改善する仕組み。夜間バッチ処理で翌営業日のエージェントパフォーマンスを向上させる。(2) **Outcomes**（パブリックベータ）: 成功基準をルーブリック形式で定義し、独立したグレーダーがエージェント出力を評価。基準未達時はグレーダーが修正ポイントを特定しエージェントが再試行。内部テストでタスク成功率が最大10ポイント向上（docx +8.4%・pptx +10.1%）。(3) **Multi-agent Orchestration**（パブリックベータ）: リードエージェントが大規模タスクをサブタスクに分解し、それぞれ専用のモデル・システムプロンプト・ツール・独立コンテキストウィンドウを持つ専門エージェントに委任。全ステップがClaude Consoleでトレーサブル。`managed-agents-2026-04-01`ベータヘッダーで利用可能。4月のMemory（パブリックベータ）と組み合わせてセッション間学習が完結する設計。

Claude Code

Claude Code CI Auto-Fix・Code Review Fleet — PRの自動CI修復と多層マルチエージェントコードレビューが本番利用可能に

Code with Claude SF（5月6日）で発表されたClaude Codeの2大新機能が本番利用段階に。(1) **CI Auto-Fix**: GitHub/GitLab CIパイプラインの失敗を自動検出し、失敗ログとレビューコメントを分析してコード修正をコミット・プッシュ。修正不能な場合は試行内容を説明し人間にエスカレーション。protectedブランチへのpush・auto-mergeはデフォルト無効で無限ループ防止設計を備える。(2) **Code Review Fleet**: 複数の専門エージェントがPR変更をフルコードベースのコンテキストで並列分析し、ロジックエラー・セキュリティ脆弱性・エッジケース・リグレッションを検出。検出結果はGitHub PRにインラインコメントとして投稿され、重要度タグ（🔴 Important / 🟡 Nit / 🟣 Pre-existing）で分類。偽陽性フィルタリングのための検証ステップを内蔵。`REVIEW.md`でレビュー基準・重要度定義・スキップルールをリポジトリ単位でカスタマイズ可能。Team・Enterpriseでリサーチプレビュー提供中。Anthropic社内全チームが利用中で、レビューあたり平均$15-25のコスト。`@claude review`コメントでPR上から手動トリガーも可能。