Cloudflare Agent Memory本番運用ガイド：ガバナンス・保持期間・検索設計

CloudflareのAgents Weekで示されたAgent MemoryとAI Gatewayの方向性は、エージェント開発の優先順位を大きく変えました。メモリは会話体験の付加価値ではなく、業務品質を左右する基盤機能になっています。

ただし、本番運用で必要なのは「覚えること」そのものではありません。何を保存し、誰が参照でき、いつ破棄されるかを制御できることです。ここが曖昧なまま実装すると、精度より先にセキュリティ事故とコスト増が到来します。

本番メモリは“機能”ではなく“ライフサイクル”

実運用では、メモリを1つのDBに貯めるだけでは破綻します。最低でも次の流れを明示します。

この流れがないと、会話ログがそのまま負債になります。

重要なのは、類似度検索の前にポリシー判定を置くことです。関連していても、見せてはいけない情報は返さない設計が必須です。

メモリレコードには本文だけでなく、運用のためのメタデータを持たせます。

lineageがないと、事故時に影響範囲を追えません。

一律の保存期間は危険です。

業務ごとに「残す価値」と「残す危険」が違います。

永続メモリは便利ですが、検索上限を決めないと推論コストが静かに膨らみます。

SLOとしては、検索p95遅延、再利用率、取り出したメモリの有効利用率を追うと劣化を早期検知できます。

「手動で消せる」は統制になりません。再現可能な運用手順まで含めて設計します。

30日: 現行コンテキストの利用実態計測 60日: 書き込みポリシーと選択的検索を導入 90日: メモリ汚染・過剰参照の演習とRunbook整備

Agent Memoryは精度向上の装置であると同時に、リスクを増幅しうる装置です。保存・検索・廃棄を政策的に管理し、予算と監査を接続できるチームが、長期的に強いエージェント基盤を作れます。