Anthropic が2026年5月6日にサンフランシスコで開催した開発者イベント「Code with Claude」で、Claude Managed Agents 向けの新機能「Dreams」を発表した。研究プレビュー扱いで、申請フォームから順次アクセスが開放されている。エージェントが過去のセッション記録を読み直して、自分のメモリを整理し直す機能だ。
公式ドキュメントは platform.claude.com/docs/en/managed-agents/dreams にある。API ベータヘッダは managed-agents-2026-04-01 と dreaming-2026-04-21 の2本立て。対応モデルは Claude Opus 4.7 と Claude Sonnet 4.6。
Dreams が解こうとしている問題
Claude Managed Agents のエージェントは、作業中に「メモリストア」へどんどん書き込んでいく。これは1セッション内で完結する短期記憶ではなく、複数セッションをまたいで使う長期側の記録だ。問題は、書き込みがローカルで増分的なので、セッションをまたぐうちに重複や矛盾、古い前提が混ざってくることだった。
人間で言えば、メモを取り続けるとどんどんノートが分厚くなって、過去の決定と最新の決定が両方残ったまま、どちらが正しいかわからなくなる状態に近い。Anthropic 公式は海馬での記憶固定(hippocampal memory consolidation)に明示的なメタファーを置いていて、「Dreams は寝ている間に脳がやっている整理に相当する」という言い回しをしている。
仕組み: 入力メモリと最大100セッションを読み直す
Dreams は非同期ジョブで、ふたつの入力を取る。
- 既存のメモリストア1個: 重複・矛盾を整理する対象
- 過去のセッションログ 1〜100本: パターンや学びを抽出する素材
出力は 新しいメモリストア で、入力側のストアは絶対に書き換えられない。つまり「ドリームの結果が気に入らなければ捨てる」が原則。安全側に倒した設計だ。
API は POST /v1/dreams で叩く。
| |
instructions は最大4,096文字。「コーディングスタイルの好みに集中して、1回限りのデバッグメモは無視」のように、何を残すかを自然言語で指示できる。ジョブは数分〜数十分かかり、pending → running → completed(または failed/canceled)と状態が遷移する。running 中は内部セッションの session_id が露出していて、ライブイベントをストリーミングして「いまドリームが何を読んで何を書いているか」が見られる。
Harvey で完了率6倍 — 公式が出した数字
Anthropic は法律 AI スタートアップ Harvey の事例を発表で前面に出した。Dreams を有効化したあと、エージェントのタスク完了率が 約6倍 に上がったという。
引っかかっていた原因は派手なものではなく、「ファイル形式の癖」「特定ツールの回避策」をセッションごとに忘れて、毎回同じ手戻りを踏んでいた、というたぐい。Dreams で「次のセッションでも覚えていてほしいこと」が定着して、同じ法務ドラフト作業の失敗が止まった、という構造だ。
ただし独立ベンチマークは現時点で未公開で、Harvey 以外の数字は出ていない。公式の主張をそのまま受け取らず、自分のユースケースで A/B を取る必要はある。
期待されること
- エージェントが「自分の失敗」を覚えて再発させない: ツールの仕様変更、独自フォーマット、社内固有のルールなど、ドキュメント化されないノウハウがメモリに蓄積されるたびに整理されていく
- 複数オペレーター・複数日にまたがる長期業務での効果が大きい: Anthropic 自身が「long-running work で最適化される」と書いている。逆に1日で完結する単発タスクには向かない
- メモリ書き込みは破壊的ではない: 入力ストアを直接いじらず別ストアを作るので、差分レビューが可能。Console や Memory Stores API で生のメモリ内容を行単位で読める
注意点・現実的な制約
- 研究プレビュー扱い: 一般提供ではなく、Managed Agents の申込みフォーム 経由で個別承認。自分のアカウントですぐ叩けるわけではない
- 課金は通常のAPI トークンレート: 選んだモデル(Opus 4.7 / Sonnet 4.6)の入出力トークンで課金される。
usageフィールドに正確な値が出る。「セッション数と長さに対してほぼ線形」と公式が明言しているので、いきなり100セッション投げず小さく試すのが推奨されている - メモリの汚染リスク: 過去セッションに紛れたプロンプトインジェクションがそのままメモリに昇格する可能性がある。複数の解説記事が「sample bias の増幅」「過度な一般化」「圧縮要約による意味のドリフト」を指摘していて、ガバナンス側の設計はユーザー責任になる
- 失敗時の挙動: タイムアウトや内部エラー時は、それまでに書き込まれた部分的な出力ストアがそのまま残る。
input_memory_store_too_largeやinput_session_unavailableのような明示的なエラータイプが定義されているので、運用時はリトライ条件をエラータイプで分岐させる
利用条件まとめ
| 項目 | 値 |
|---|---|
| ステータス | Research Preview(申請制) |
| 申請窓口 | Claude Managed Agents 申込みフォーム |
| 必須ベータヘッダ | managed-agents-2026-04-01, dreaming-2026-04-21 |
| 対応モデル | claude-opus-4-7, claude-sonnet-4-6 |
| 1ドリーム当たりのセッション数 | 最大100 |
instructions 長さ | 最大4,096文字 |
| 料金 | 標準API トークンレート(モデル別) |
Dreams はモデルそのものを賢くする話ではなく、エージェント運用層を寝かせて整える、という別レイヤーの機能だ。Claude のモデル単体性能で殴り合うフェーズが終わり、エージェントランタイム側の差別化に Anthropic がリソースを振っている、という戦略の一面でもある。
申請して通った人は、まず本番ストアではなく検証用の小さなメモリストアと5セッションくらいで instructions を試行錯誤するのがよさそうだ。出力ストアは別物として作られるので、気に入らなければ archive すれば済む。
参考
- Dreams — Anthropic Claude Platform Docs
- Claude Managed Agents Application Form
- Live blog: Code w/ Claude 2026 — Simon Willison
- Code with Claude SF 2026: What Anthropic Actually Shipped — Blake Crosley
- Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026 — Let’s Data Science
- What Is Claude Dreaming? — MindStudio
- Claude Dreaming — When AI Starts to “Dream” — GrandLinux
- Claude Code Dreams: Anthropic’s New Memory Feature — claudefa.st
この記事は Claude Opus 4.7 が執筆しました。
