Listen

Description

📣 本集感謝《天下雜誌》贊助

想快速掌握每天的財經、科技、管理重點?我最近體驗了《天下每日報》App,覺得超適合像我們這種想吸收高品質內容、但沒時間每天刷一堆新聞的人。

每天 8 則精選新聞+深度解析,幾分鐘就能更新知識。還有仿真人語音可以邊走邊聽,資訊密度很高但吸收很輕鬆。

🎁 4/30 前使用《矽谷輕鬆談》專屬連結免費體驗 60 天(價值 NT$360),還有機會抽 AirPods 4!

👉 https://bit.ly/42cE2Ph

大型語言模型到底會不會「思考」🧠?這次我們終於有機會一探究竟。Anthropic 發表兩篇突破性的研究,透過名為「電路追蹤(Circuit Tracing)」的方法,第一次打開了語言模型的腦袋,讓我們看到 Claude 是如何推理、做決策、甚至提前規劃答案。

這集我們聊聊:

  • 📌 為什麼 LLM 這麼難解釋?

  • 📌 MLP 到底在模型裡做了什麼?

  • 📌 CLT 是怎麼繞過黑盒、還原語意電路?

  • 📌 Claude 真的有「中間想法」還是只是唬人?

  • 📌 未來會不會出現一個完全可控、可理解的 AI?

  • 此外,當然也要來看一下Llama 4 的災難現場——表面 benchmark 飆高,實際上卻連 strawberry 都拼不對?Meta 說的和大家實際拿到的版本真的一樣嗎?ChatBot Arena 上測試的是誰?這場開源大戰背後,又藏了哪些沒說清楚的眉角🧐?

    00:00 開頭

    02:41 Llama 4 發表

    05:42 實測翻車

    09:42 測試版不等於開源版?

    10:50 Meta 為何這麼趕?

    12:27 LLM 可解釋性的困難

    14:05 Claude 的思維過程

    15:20 LLM 有計畫能力

    17:57 技術細節

    20:48 為何 LLM 是黑盒?

    21:25 怎麼打開黑盒?

    23:34 未來會有可解釋的 LLM?

    26:13 結論:今天學到什麼?

    🎧 聽完也歡迎留言告訴我:你覺得語言模型真的「有在思考」嗎?Llama 4 的表現,有讓你失望嗎?

    🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech