Listen

Description

本期内容

今期围绕一个核心问题展开:AI 的影响正在从工具层渗透到就业、政策和经济结构。我们聊了 GPT-5.4 合并多个模型分支后的真正意义,也拆解了一个让工程师警醒的现实:LLM 代码可信不等于正确。科技就业数据比两次重大危机都难看,而 Anthropic 与政府的博弈,正在重塑整个行业的控制权逻辑。最后一篇关于 AGI 经济学的论文,给了一个更冷静的框架:渐进式自动化的终点,是需求的爆炸,而不只是岗位的消失。

本期要点

- GPT-5.4 把推理、代码和工具调用整合进一个模型,最值得关注的是它在跨工具工作流场景下的改进,而非跑分

- LLM 生成的代码在性能关键路径上可能存在根本性算法错误,"能跑通"远不是合格的验收标准

- 美国科技行业过去一年减少五万七千个岗位,跌幅已超过 2008 年金融危机和 2020 年疫情期间

- Anthropic 与国防部的博弈可能推动政府转向开源模型,重塑整个行业的服务条件和控制权格局

- AGI 最可能的经济路径是让某些劳动成本趋近于零并引发需求爆炸,而非简单替代人类工作

参考资料

Introducing GPT-5.4 — https://openai.com/index/introducing-gpt-5-4/

Your LLM Doesn't Write Correct Code. It Writes Plausible Code. — https://katanaquant.com(Hacker News 原帖)

科技就业数据分析(Joey Politano) — https://apricitas.substack.com

Dean Ball on open models and government control — https://www.interconnects.ai

Where things stand with the Department of War — https://www.anthropic.com/news/where-stand-department-war

Statement from Dario Amodei on our discussions with the Department of War — https://www.anthropic.com/news/statement-department-of-war

Some Simple Economics of AGI(arXiv) — https://arxiv.org

Import AI #447(Jack Clark) — https://importai.substack.com

---

BearTalk 狗熊有话说播客,始于 2012 年。

订阅地址:https://beartalking.com/page/podcast