Claude 推出「夢境」研究預覽版,提升 Agent 自省能力。
Claude Managed Agents 於 2026 年 5 月 6 日發布「夢境」作為研究預覽版,同時將 Outcomes、多 Agent 協調與 webhooks 推向公開 beta,強化 Agent 處理複雜任務的自主性與品質控制。
夢境功能與記憶優化
「夢境」是一種排程程序,會審查 Agent 的過往工作階段與記憶儲存,提取模式並精煉記憶,讓 Agent 隨時間自我改善。
使用者可選擇自動更新記憶,或先審核變更後再套用。
它能發掘單一 Agent 無法察覺的模式,例如重複錯誤、Agent 收斂的流程,或團隊共享偏好。
同時重構記憶,維持高訊號品質,特別適合長期間任務與多 Agent 協調。
記憶與夢境共同構成強健的自省系統:記憶捕捉單一 Agent 在工作中的學習,夢境則在階段間精煉,跨 Agent 提取共享洞見並保持最新。
開發者可在 Claude Platform 的 Managed Agents 中使用,申請存取請至 這裡。
Outcomes 品質保證機制
Outcomes 讓使用者定義評分準則(rubric),描述成功標準,Agent 據此迭代工作。獨立的評分器在專屬 context window 中評估輸出,不受 Agent 推理影響,若不符標準,會精準指出修正點,讓 Agent 重新嘗試。
適用於需細節注意與全面涵蓋的任務,也支援主觀品質,如文案品牌聲調或設計視覺指南。
內部測試顯示,Outcomes 將任務成功率提升高達 10 個百分點,尤其在最難任務上獲最大改善;檔案生成品質提升 +8.4%(docx)與 +10.1%(pptx)。
使用者可定義 Outcomes 後,讓 Agent 執行,並透過 webhook 通知完成。
多 Agent 協調架構
多 Agent 協調讓領頭 Agent 將複雜工作拆解,委派給具專屬模型、提示與工具的專家 Agent,並行處理。
專家 Agent 共享檔案系統,貢獻至領頭 Agent 的整體脈絡;事件持久化,每個 Agent 記得自身進度,領頭 Agent 可中途查詢。
在 Claude Console 中可追蹤每步:哪個 Agent 做了什麼、何時為何執行,提供完整任務委派與執行的可見性。
例如,領頭 Agent 調查時,子 Agent 可並行掃描部署歷史、錯誤日誌、指標與支援票券。
實際應用案例
團隊已運用這些功能打造高效 Agent:
Harvey 用於複雜法律工作如長篇起草與文件建立;夢境讓 Agent 記住階段間學習(如檔案類型規避與工具模式),完成率在測試中提升約 6 倍。
Netflix 平台團隊建置分析 Agent,處理數百建置的日誌;多 Agent 協調並行分析批次,只浮現值得行動的重複問題模式。
Spiral by Every 的寫作 Agent(背後 API 與 CLI),領頭 Agent 用 Haiku 處理請求、提問後委派子 Agent(用 Opus)起草;多稿時並行執行,Outcomes 依 Every 編輯原則與使用者聲調(從記憶提取)評分,只回傳達標稿件。
Wisedocs 的文件品質檢查 Agent,用 Outcomes 對內部指南評分,審核速度提升 50%,仍維持團隊標準。
啟用與可用性
夢境為研究預覽版,Outcomes、多 Agent 協調與記憶為公開 beta,均屬 Managed Agents 的一部分。
申請夢境存取:這裡。
詳閱文件或至 Claude Console 部署首個 Agent,更多資訊見 部落格文章。
這些更新讓 Agent 更少需人工導向,即能處理複雜任務,展現 Claude Platform 在 Agent 自主性上的領先。