Listen

Description

本期内容

AI 能力在快速整合,OpenAI 一口气把推理、编程、Agent 全塞进 GPT-5.4;与此同时,一个结构性的安全发现悄悄出现:推理模型因为思考链可见,反而比黑盒模型更难撒谎。本期还聊了 AI 代码安全、本地 Agent 沙盒工具,以及一个更冷静的问题:当模型能力不再稀缺,OpenAI 的护城河到底在哪里。听完这期,你会对"给 AI 更多权限"这件事有更清醒的判断框架。

本期要点

- GPT-5.4 把推理、编程、Agent 工作流整合进单一模型,产品分层逻辑越来越像 Adobe 的专业版策略

- 推理模型的思考链可被审视,OpenAI 研究发现这让模型"说谎成本"大幅升高,是目前最有效的 AI 监督结构

- Codex Security 主张用深度上下文理解代替模式匹配,瞄准 Agent 写代码速度超过人工审计速度的真实问题

- Benedict Evans 拆解 OpenAI 竞争优势:技术已被追上,品牌优势会被侵蚀,分发能力才是持久护城河

- Agent Safehouse 用 macOS 原生沙盒隔离本地 Agent 运行环境,"给多大能力就配多扎实的约束"是它的核心主张

参考资料

Introducing GPT-5.4 — https://openai.com/index/introducing-gpt-5-4/

Reasoning models struggle to control their chains of thought, and that's good — https://openai.com/index/reasoning-models-chain-of-thought-controllability/

Codex Security: now in research preview — https://openai.com/index/codex-security-now-in-research-preview/

How will OpenAI compete? — https://www.ben-evans.com(Benedict Evans 个人博客)

Agent Safehouse — https://agent-safehouse.dev

---

BearTalk 狗熊有话说播客,始于 2012 年。

订阅地址:https://beartalking.com/page/podcast