Listen

Description

Boris Cherny:Claude Code 之後,寫程式正在變成「管理 Agent」

Boris Cherny 是 Anthropic 內部 Claude Code 的創建者,從一個三人小團隊的孵化專案做起,把「在 IDE 裡按 Tab 自動補全一行程式碼」這件事徹底升級成「讓 Agent 把整個專案寫完」。Claude Code 在 2026 年初已經超過十億美元年化營收,被 Anthropic 自己稱為「史上從研究預覽到十億美元產品最快的一次」。

這次訪談來自 Sequoia 2026 年的 AI Ascent 大會,主持人是紅杉合夥人 Lauren Reeder。



原始影片:https://www.youtube.com/watch?v=SlGRN8jh2RI

要點速覽

Boris 整個 2026 年沒寫過一行程式碼,每天合併幾十個 PR,單日紀錄是 150 個,但他承認這是「為了試試模型能跑多遠」。

Claude Code 早期半年沒有 PMF,做出來時 Boris 自己只用它寫 10% 的程式碼,是 Opus 4 在 2025 年 5 月發布之後才開始指數成長,每一代新模型都讓曲線再往上拐一下。

Boris 現在大部分工作從手機完成,Claude App 裡常駐 5 到 10 個 session、幾百個 Agent,夜裡有幾千個在跑深度任務,核心調度模式叫 Loop,做法是讓 Claude 透過 cron 起一個定時循環。

Anthropic 內部已經沒有手寫程式碼:所有 SQL、所有產品程式碼都由模型生成,員工的 Claude 之間透過 Slack 互相溝通,把對方的不確定問題直接 ping 過去問。

關於「SaaS 的終結」,Boris 借用 Hamilton Helmer 的「七種護城河」框架:切換成本和流程效力這兩種會被 AI 抹平,因為模型可以幫你遷移、可以自己迭代流程;網路效應、規模經濟、獨占資源這些不變。

他給出的最重要歷史類比是印刷術,認為軟體構建會像識字一樣普及,最合適寫會計軟體的是會計師而不是工程師,因為程式開發是簡單部分,懂業務才是難的部分。

Anthropic 的真正領先不在技術,在組織流程:模型大家都能用,但內部組織怎麼改造、Claude 怎麼互相溝通、整個公司怎麼把所有手寫程式碼替換掉,這才是產品差距。



【1】Claude Code 是怎麼從一個三人孵化專案做出來的

Boris 說他是「誤打誤撞」做出 Claude Code 的。2024 年底他加入了 Anthropic 內部一個叫 Anthropic Labs 的孵化器,團隊只有幾個人,一開始的產物就是 Claude Code、MCP 和 Claude Desktop App 這三件東西。這個團隊一度被解散,2026 年初又重組,由 Mike Krieger 牽頭。

註: Mike Krieger 是 Instagram 共同創辦人兼前 CTO,2024 年 5 月加入 Anthropic 擔任首席產品官,2026 年 1 月起進入 Labs 團隊,和 Ben Mann 一起負責實驗性產品孵化。

Boris 描述他當時為什麼想做程式開發這件事,用的是 Anthropic 內部很常用的一個詞:「product overhang」。這個詞可以翻譯成「產品懸置 (Product Overhang,指模型能力已經具備但尚未被產品化)」,意思是模型已經能做一堆事情,但還沒有任何產品把這些能力展現出來。

我們當時看程式開發領域,2024 年底最先進的狀態就是按 Tab 鍵。打開 IDE,按一下 Tab,模型給你補一行。這是 Sonnet 3.5 第一次讓人能做的事情。但當時的感覺是,我們其實可以走得更遠,模型幾乎已經準備好下一步了。我們不需要再做 Tab 補全,可以直接讓 Agent 把整段程式碼都寫了。

但做出來之後,前六個月幾乎沒什麼人用。Boris 說最初版本「基本不能用」,連他自己也只用它寫 10% 的程式碼。即便對外發布,也沒有指數級成長。真正的爆發點是 2025 年 5 月 Opus 4 發布。從那之後,每一代新模型都讓曲線再往上拐一次,從 Opus 4 到 4.5、4.6,再到現在的 4.7。

他承認整個過程其實是一場違背常規 PMF (產品市場匹配) 邏輯的賭注:

我們其實是在做一個初期完全不具備 PMF 的東西。我們很清楚它前六個月不會有 PMF,因為我們是在為下一代模型做開發。我們從始至終就是這個思路。

註: PMF 是 Product-Market Fit,產品市場匹配。Anthropic 整個產品邏輯就是賭「模型能力會漲到一個點」,提前把那個點對應的產品做出來,這和典型 SaaS 的「先驗證需求再做產品」是反著的。



【2】「程式開發已經被解決」,但這是 Boris 個人的版本

Lauren 問他公開說過的「程式開發已經被解決」是什麼意思。Boris 在台上做了一次現場調查,讓全場觀眾舉手示意:「誰 100% 還在親自寫程式碼」、「誰 100% 已經完全不寫了」、「誰介於兩者之間」。最後的現場分布大致是「50% 解決」。但對 Boris 自己,比例是 100%。

他給的解釋是 Claude Code 的程式庫(已經因為洩漏事件被外界看過)就是 TypeScript 和 React,沒什麼秘密。選 TypeScript 和 React 的原因是這兩個東西在模型訓練資料裡非常常見,屬於「on-distribution (分布內資料)」。當時模型還沒那麼聰明,框架選擇關係到模型能寫多少。現在模型已經強到可以拿不熟悉的語言現學現用,但 2024 年底必須挑模型最熟的堆疊。

正因為選了模型最熟的堆疊,團隊很早就過了一個臨界點:模型開始寫 100% 的程式碼。Boris 說這件事在去年 10 月、11 月就發生了。

現在我每天大概合併幾十個 PR。上週有一天我合了 150 個,那是個紀錄,我就是想看看能不能把它推到極限。

但他也明確承認,這條結論並不普世:還有很大很複雜的程式庫、還有模型不擅長的小眾語言。他給出的一句答案有點「等就完事了」的味道。

通常的答案就是等下一代模型。

註: Boris 這段說法的樣本明顯有偏。他用的是 TypeScript+React 這種主流堆疊,自己的程式庫已經成熟,還在 Anthropic 內部用著內部專屬模型 Mythos 來 dogfood (吃自己的狗糧,指內部試用自己的產品)。「程式開發已被解決」對他成立,但替換到一個三十年的 C++ 老系統、一個 SAP ABAP 專案,或者一個遊戲引擎團隊,結論會非常不同。

【3】手機裡跑著幾百個 Agent:Boris 的工作流

Boris 說他六個月前在 Twitter 上分享過一次個人工作流,發的時候沒覺得有什麼稀奇,結果出乎意料地火。從那以後他的方式又變了:現在大多數工作從手機完成。

具體方式是 Claude App 左側有個 code 標籤,他常駐 5 到 10 個 session。每個 session 裡又開著一堆 Agent,加起來通常有幾百個在跑。晚上還會再起幾千個做更深的任務。

他說目前最常用的不是子 Agent,而是一種叫 Loop 的簡單模式:讓 Claude 用 cron 起一個定時任務,可以每分鐘、每五分鐘、或者每天跑一次。

我大概有幾十個 Loop 一直在跑。一個負責盯著我的 PR,自動修 CI、自動 rebase;一個負責讓 CI 整體保持健康,比如某個測試 flaky (時好時壞不穩定) 了它就去修;還有一個每 30 分鐘從 Twitter 上把別人對 Claude Code 的回饋拉一遍、聚類、整理給我。

他還提到 Anthropic 剛發的 Routines,這個產品其實是把同樣的 Loop 模式從本地搬到伺服器上,關掉筆電它也照常跑。

他對這件事的判斷是:「Loop 是未來。」

註: CI 是 Continuous Integration,持續整合。Boris 描述的這套工作流核心其實很簡單:更早地放棄「親自下指令」。他做的事情是讓一群 Claude 不停地幹活,而他自己只在 Slack 上接收報告。從產品視角看,Routines 把 Loop 從客戶端模式變成 Anthropic 自己託管的服務,調度本身要開始消耗他們的伺服器資源,定價模型遲早要變。



【4】通才崛起:團隊裡每一個角色都在寫程式碼

Boris 說他的判斷是「通才會比今天多得多」。

他先把「通才」分了兩種:第一種是工程通才,比如一個人同時寫 iOS、Web 和伺服器端,今天大家說的 generalist 多半是這種。第二種是更值得關注的跨學科通才,一個產品工程師同時也很懂設計,或者既能做產品也能做資料科學。

他說這件事在 Claude Code 團隊內部已經在發生:

我們團隊的工程經理、產品經理、設計師、資料科學家、財務、使用者研究員,每一個人都在寫程式碼。每個人都還在某件事上是專家,但也都在寫程式碼了。

他沒有展開「為什麼這是好事」,但暗含的邏輯是:當寫程式碼的邊際成本接近於零,那些原本被排除在工程之外的角色(財務、設計、研究)就有了直接出工程產物的能力,分工的邊界自然會模糊。

註: 這…