@dotey：Boris Cherny：Claude Code 之後，寫程式正在變成「管理 Agent」 Boris Cherny 是 Anthropic 內部 Cla…

Description

Boris Cherny：Claude Code 之後，寫程式正在變成「管理 Agent」

Boris Cherny 是 Anthropic 內部 Claude Code 的創建者，從一個三人小團隊的孵化專案做起，把「在 IDE 裡按 Tab 自動補全一行程式碼」這件事徹底升級成「讓 Agent 把整個專案寫完」。Claude Code 在 2026 年初已經超過十億美元年化營收，被 Anthropic 自己稱為「史上從研究預覽到十億美元產品最快的一次」。

這次訪談來自 Sequoia 2026 年的 AI Ascent 大會，主持人是紅杉合夥人 Lauren Reeder。

原始影片：https://www.youtube.com/watch?v=SlGRN8jh2RI

要點速覽

Boris 整個 2026 年沒寫過一行程式碼，每天合併幾十個 PR，單日紀錄是 150 個，但他承認這是「為了試試模型能跑多遠」。

Claude Code 早期半年沒有 PMF，做出來時 Boris 自己只用它寫 10% 的程式碼，是 Opus 4 在 2025 年 5 月發布之後才開始指數成長，每一代新模型都讓曲線再往上拐一下。

Boris 現在大部分工作從手機完成，Claude App 裡常駐 5 到 10 個 session、幾百個 Agent，夜裡有幾千個在跑深度任務，核心調度模式叫 Loop，做法是讓 Claude 透過 cron 起一個定時循環。

Anthropic 內部已經沒有手寫程式碼：所有 SQL、所有產品程式碼都由模型生成，員工的 Claude 之間透過 Slack 互相溝通，把對方的不確定問題直接 ping 過去問。

關於「SaaS 的終結」，Boris 借用 Hamilton Helmer 的「七種護城河」框架：切換成本和流程效力這兩種會被 AI 抹平，因為模型可以幫你遷移、可以自己迭代流程；網路效應、規模經濟、獨占資源這些不變。

他給出的最重要歷史類比是印刷術，認為軟體構建會像識字一樣普及，最合適寫會計軟體的是會計師而不是工程師，因為程式開發是簡單部分，懂業務才是難的部分。

Anthropic 的真正領先不在技術，在組織流程：模型大家都能用，但內部組織怎麼改造、Claude 怎麼互相溝通、整個公司怎麼把所有手寫程式碼替換掉，這才是產品差距。

【1】Claude Code 是怎麼從一個三人孵化專案做出來的

Boris 說他是「誤打誤撞」做出 Claude Code 的。2024 年底他加入了 Anthropic 內部一個叫 Anthropic Labs 的孵化器，團隊只有幾個人，一開始的產物就是 Claude Code、MCP 和 Claude Desktop App 這三件東西。這個團隊一度被解散，2026 年初又重組，由 Mike Krieger 牽頭。

註： Mike Krieger 是 Instagram 共同創辦人兼前 CTO，2024 年 5 月加入 Anthropic 擔任首席產品官，2026 年 1 月起進入 Labs 團隊，和 Ben Mann 一起負責實驗性產品孵化。

Boris 描述他當時為什麼想做程式開發這件事，用的是 Anthropic 內部很常用的一個詞：「product overhang」。這個詞可以翻譯成「產品懸置 (Product Overhang，指模型能力已經具備但尚未被產品化)」，意思是模型已經能做一堆事情，但還沒有任何產品把這些能力展現出來。

我們當時看程式開發領域，2024 年底最先進的狀態就是按 Tab 鍵。打開 IDE，按一下 Tab，模型給你補一行。這是 Sonnet 3.5 第一次讓人能做的事情。但當時的感覺是，我們其實可以走得更遠，模型幾乎已經準備好下一步了。我們不需要再做 Tab 補全，可以直接讓 Agent 把整段程式碼都寫了。

但做出來之後，前六個月幾乎沒什麼人用。Boris 說最初版本「基本不能用」，連他自己也只用它寫 10% 的程式碼。即便對外發布，也沒有指數級成長。真正的爆發點是 2025 年 5 月 Opus 4 發布。從那之後，每一代新模型都讓曲線再往上拐一次，從 Opus 4 到 4.5、4.6，再到現在的 4.7。

他承認整個過程其實是一場違背常規 PMF (產品市場匹配) 邏輯的賭注：

我們其實是在做一個初期完全不具備 PMF 的東西。我們很清楚它前六個月不會有 PMF，因為我們是在為下一代模型做開發。我們從始至終就是這個思路。

註： PMF 是 Product-Market Fit，產品市場匹配。Anthropic 整個產品邏輯就是賭「模型能力會漲到一個點」，提前把那個點對應的產品做出來，這和典型 SaaS 的「先驗證需求再做產品」是反著的。

【2】「程式開發已經被解決」，但這是 Boris 個人的版本

Lauren 問他公開說過的「程式開發已經被解決」是什麼意思。Boris 在台上做了一次現場調查，讓全場觀眾舉手示意：「誰 100% 還在親自寫程式碼」、「誰 100% 已經完全不寫了」、「誰介於兩者之間」。最後的現場分布大致是「50% 解決」。但對 Boris 自己，比例是 100%。

他給的解釋是 Claude Code 的程式庫（已經因為洩漏事件被外界看過）就是 TypeScript 和 React，沒什麼秘密。選 TypeScript 和 React 的原因是這兩個東西在模型訓練資料裡非常常見，屬於「on-distribution (分布內資料)」。當時模型還沒那麼聰明，框架選擇關係到模型能寫多少。現在模型已經強到可以拿不熟悉的語言現學現用，但 2024 年底必須挑模型最熟的堆疊。

正因為選了模型最熟的堆疊，團隊很早就過了一個臨界點：模型開始寫 100% 的程式碼。Boris 說這件事在去年 10 月、11 月就發生了。

現在我每天大概合併幾十個 PR。上週有一天我合了 150 個，那是個紀錄，我就是想看看能不能把它推到極限。

但他也明確承認，這條結論並不普世：還有很大很複雜的程式庫、還有模型不擅長的小眾語言。他給出的一句答案有點「等就完事了」的味道。

通常的答案就是等下一代模型。

註： Boris 這段說法的樣本明顯有偏。他用的是 TypeScript+React 這種主流堆疊，自己的程式庫已經成熟，還在 Anthropic 內部用著內部專屬模型 Mythos 來 dogfood (吃自己的狗糧，指內部試用自己的產品)。「程式開發已被解決」對他成立，但替換到一個三十年的 C++ 老系統、一個 SAP ABAP 專案，或者一個遊戲引擎團隊，結論會非常不同。

【3】手機裡跑著幾百個 Agent：Boris 的工作流

Boris 說他六個月前在 Twitter 上分享過一次個人工作流，發的時候沒覺得有什麼稀奇，結果出乎意料地火。從那以後他的方式又變了：現在大多數工作從手機完成。

具體方式是 Claude App 左側有個 code 標籤，他常駐 5 到 10 個 session。每個 session 裡又開著一堆 Agent，加起來通常有幾百個在跑。晚上還會再起幾千個做更深的任務。

他說目前最常用的不是子 Agent，而是一種叫 Loop 的簡單模式：讓 Claude 用 cron 起一個定時任務，可以每分鐘、每五分鐘、或者每天跑一次。

我大概有幾十個 Loop 一直在跑。一個負責盯著我的 PR，自動修 CI、自動 rebase；一個負責讓 CI 整體保持健康，比如某個測試 flaky (時好時壞不穩定) 了它就去修；還有一個每 30 分鐘從 Twitter 上把別人對 Claude Code 的回饋拉一遍、聚類、整理給我。

他還提到 Anthropic 剛發的 Routines，這個產品其實是把同樣的 Loop 模式從本地搬到伺服器上，關掉筆電它也照常跑。

他對這件事的判斷是：「Loop 是未來。」

註： CI 是 Continuous Integration，持續整合。Boris 描述的這套工作流核心其實很簡單：更早地放棄「親自下指令」。他做的事情是讓一群 Claude 不停地幹活，而他自己只在 Slack 上接收報告。從產品視角看，Routines 把 Loop 從客戶端模式變成 Anthropic 自己託管的服務，調度本身要開始消耗他們的伺服器資源，定價模型遲早要變。

【4】通才崛起：團隊裡每一個角色都在寫程式碼

Boris 說他的判斷是「通才會比今天多得多」。

他先把「通才」分了兩種：第一種是工程通才，比如一個人同時寫 iOS、Web 和伺服器端，今天大家說的 generalist 多半是這種。第二種是更值得關注的跨學科通才，一個產品工程師同時也很懂設計，或者既能做產品也能做資料科學。

他說這件事在 Claude Code 團隊內部已經在發生：

我們團隊的工程經理、產品經理、設計師、資料科學家、財務、使用者研究員，每一個人都在寫程式碼。每個人都還在某件事上是專家，但也都在寫程式碼了。

他沒有展開「為什麼這是好事」，但暗含的邏輯是：當寫程式碼的邊際成本接近於零，那些原本被排除在工程之外的角色（財務、設計、研究）就有了直接出工程產物的能力，分工的邊界自然會模糊。

註：這…

@dotey：Boris Cherny：Claude Code 之後，寫程式正在變成「管理 Agent」 Boris Cherny 是 Anthropic 內部 Cla…

Listen

Description

Want to check another podcast?