Listen

Description

PostHog Code 與自動駕駛產品

昨天,我們正式推出了 PostHog Code 的 Beta 版本。

這是一款桌面應用程式,能在你的產品資料之上執行 Agentic 程式開發。

簡單的任務它會自動完成。至於棘手的問題,則會整理成一份優先順序清單,讓你進行決策。

我們開發它的初衷只有一個:實現「自動駕駛產品」。

我們如何定義自動駕駛

自動駕駛產品會自動產生 Prompt。

它能理解你的程式庫、資料以及使用者。它會在設定好的安全邊界內,主動提出並完成工作。

自動駕駛中的「自動」,並非指工程師可以完全撒手不管,而是指不再需要以「使用者的指令」作為工作的起點。



自動駕駛產品能讓那些 1% 的效能提升進入「巡航模式」。例如修復 Bug、改善 UX 問題、處理細微瑕疵以及優化轉換率。這些工作雖然會消耗工程師的時間,但通常不需要太多的策略性投入。

而這些工作需要 PostHog 內部的上下文資訊。

在平常的一週內,PostHog 的使用者會產生超過 10 萬筆失敗的查詢,以及約 150 萬個新的錯誤追蹤問題。每一個問題都是一個 Agent 可以處理的訊號。

處理這些訊號不僅僅是寫程式碼。Claude Code、Codex 等工具已經能很好地完成程式撰寫的部分。為了讓它們具備「自動駕駛」能力,我們在上方額外增加了 5 個要素:工具 (Tools)、技能 (Skills)、訊號 (Signals)、記憶 (Memory) 與評估 (Evaluation)。

我們的 AI 工程手冊深入探討了每一個要素,以下是精簡版本。

自動駕駛產品的解構

工具 (Tools) – Agent 能做什麼

工具是 Agent 可以執行的微小且具體的動作。在 PostHog,我們將其視為原子化的能力,例如 createinsight 或 readtaxonomy。後者承擔了許多繁重的工作,它讓 Agent 在撰寫查詢或儀表板 PR 之前,能先確認哪些事件與屬性是真實存在的。

技能 (Skills) – 如何完成工作

如果工具是刀叉,那麼技能就是食譜。技能將工具、文件與規則串聯成一套行動指南。你可以從我們自己的資料中看出差距:docs-search 是 PostHog MCP server 上呼叫次數最多的工具,每月約有 2.8 萬次呼叫。

PostHog Code 針對我們最常見的工作流程提供了對應的技能,例如埋設事件 (instrumenting events)、審核功能旗標 (auditing flags) 以及增加錯誤追蹤。撰寫技能的感覺就像在寫文件,大多數工程師寧願開發功能也不願寫文件。但對 Agent 來說,技能本身就是功能。

訊號 (Signals) – 何時該執行工作

工具與技能解決了「做什麼」的問題,而訊號則解決了「何時做」的問題。PostHog Code 運行在你的產品資料之上,因此模式本身就是 Prompt。原始的觀察結果會被分組、豐富化,並轉化為具體的計畫。你打開的是一份預先整理好的待辦清單,而不是在雜亂的收件匣中進行分類。

記憶 (Memory) – Agent 已經知道什麼

訊號代表「現在發生了什麼」,而記憶則代表「上次發生了什麼」。如果沒有記憶,Agent 就會重複執行已經做過的工作,並在每個星期二重複開啟同一個 PR。

評估 (Evaluation) – 它真的有效嗎?

沒有這個環節,迴圈就無法閉合。測試 AI Agent 與測試一般軟體完全不同,「執行時沒有報錯」並不代表通過測試。

PostHog Code 將評估排程為長時間執行的 Temporal 工作,因此檢查會在 PR 合併後的數小時或數天後執行。系統會重新查詢當初觸發訊號的同一個儀表板、漏斗、實驗或 LLM-as-a-judge 評估。

如果指標沒有改善,或者往錯誤的方向發展,Agent 就會還原變更或重新開啟該工作。

產品自主迴圈

將上述所有要素結合起來,就形成了一個我們稱之為「產品自主」的迴圈:

收集資料 → 聚類訊號 → 檢查記憶 → 通知工作人員 → 執行工作 → 審核並發布 → 評估 → 將結果寫回記憶。



你無法在通用的程式撰寫 Agent 中可靠地執行此流程,因為關鍵的訊號存在於其他地方。對許多公司來說,那個「其他地方」就是 PostHog。

它在 PostHog Code 中是如何運作的:

錯誤、重播 (replays) 與外部訊號會流入訊號管道,並被聚類為訊號報告。

每個進入你收件匣的任務都會根據緊急程度進行排序,並連結到背景 Agent 所完成的相關上下文與研究。



你可以挑選值得處理的任務,並為每個任務選擇合適的模型與 harness。

分割視窗的「指揮中心」(Command Center) 最多可同時處理 9 個 Agent——我們的工程師稱之為「多巴胺模式」(你用過就會明白為什麼)。

長時間的工作會在雲端執行,因此你的筆電效能不會受到影響。



PostHog 端預設為整合狀態。一鍵埋設功能可以將事件、旗標與實驗直接放入你的程式碼中,無需手動輸入樣板程式碼。

PostHog MCP 負責處理影響力衡量、錯誤除錯與儀表板建立。你可以插入其他的 MCP server 來執行更多動作,或是在開發過程中提取額外的上下文資訊。

為什麼你需要這個

當例行工作自動化後,你就有更多空間處理重要事務。你可以自行 Prompt 任務、在完整的產品資料上下文中進行開發,並在自動駕駛工作進行的同時,持續發布新功能。

產品工程師不斷告訴我們,這就是缺失的那一塊拼圖——一個真正理解你的程式庫與產品的 Agent。

這就是我們正在打造的產品。歡迎加入候補名單,體驗試駕。