本期内容
今期围绕一个核心问题展开:AI 的影响正在从工具层渗透到就业、政策和经济结构。我们聊了 GPT-5.4 合并多个模型分支后的真正意义,也拆解了一个让工程师警醒的现实:LLM 代码可信不等于正确。科技就业数据比两次重大危机都难看,而 Anthropic 与政府的博弈,正在重塑整个行业的控制权逻辑。最后一篇关于 AGI 经济学的论文,给了一个更冷静的框架:渐进式自动化的终点,是需求的爆炸,而不只是岗位的消失。
本期要点
- GPT-5.4 把推理、代码和工具调用整合进一个模型,最值得关注的是它在跨工具工作流场景下的改进,而非跑分
- LLM 生成的代码在性能关键路径上可能存在根本性算法错误,"能跑通"远不是合格的验收标准
- 美国科技行业过去一年减少五万七千个岗位,跌幅已超过 2008 年金融危机和 2020 年疫情期间
- Anthropic 与国防部的博弈可能推动政府转向开源模型,重塑整个行业的服务条件和控制权格局
- AGI 最可能的经济路径是让某些劳动成本趋近于零并引发需求爆炸,而非简单替代人类工作
参考资料
Introducing GPT-5.4 — https://openai.com/index/introducing-gpt-5-4/
Your LLM Doesn't Write Correct Code. It Writes Plausible Code. — https://katanaquant.com(Hacker News 原帖)
科技就业数据分析(Joey Politano) — https://apricitas.substack.com
Dean Ball on open models and government control — https://www.interconnects.ai
Where things stand with the Department of War — https://www.anthropic.com/news/where-stand-department-war
Statement from Dario Amodei on our discussions with the Department of War — https://www.anthropic.com/news/statement-department-of-war
Some Simple Economics of AGI(arXiv) — https://arxiv.org
Import AI #447(Jack Clark) — https://importai.substack.com
---
BearTalk 狗熊有话说播客,始于 2012 年。
订阅地址:https://beartalking.com/page/podcast