本期内容
AI 能力在快速整合,OpenAI 一口气把推理、编程、Agent 全塞进 GPT-5.4;与此同时,一个结构性的安全发现悄悄出现:推理模型因为思考链可见,反而比黑盒模型更难撒谎。本期还聊了 AI 代码安全、本地 Agent 沙盒工具,以及一个更冷静的问题:当模型能力不再稀缺,OpenAI 的护城河到底在哪里。听完这期,你会对"给 AI 更多权限"这件事有更清醒的判断框架。
本期要点
- GPT-5.4 把推理、编程、Agent 工作流整合进单一模型,产品分层逻辑越来越像 Adobe 的专业版策略
- 推理模型的思考链可被审视,OpenAI 研究发现这让模型"说谎成本"大幅升高,是目前最有效的 AI 监督结构
- Codex Security 主张用深度上下文理解代替模式匹配,瞄准 Agent 写代码速度超过人工审计速度的真实问题
- Benedict Evans 拆解 OpenAI 竞争优势:技术已被追上,品牌优势会被侵蚀,分发能力才是持久护城河
- Agent Safehouse 用 macOS 原生沙盒隔离本地 Agent 运行环境,"给多大能力就配多扎实的约束"是它的核心主张
参考资料
Introducing GPT-5.4 — https://openai.com/index/introducing-gpt-5-4/
Reasoning models struggle to control their chains of thought, and that's good — https://openai.com/index/reasoning-models-chain-of-thought-controllability/
Codex Security: now in research preview — https://openai.com/index/codex-security-now-in-research-preview/
How will OpenAI compete? — https://www.ben-evans.com(Benedict Evans 个人博客)
Agent Safehouse — https://agent-safehouse.dev
---
BearTalk 狗熊有话说播客,始于 2012 年。
订阅地址:https://beartalking.com/page/podcast