Listen

Description

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。

今天的主题是:

DeepCode: Open Agentic Coding

Summary

近期大语言模型(LLMs)的发展催生了功能强大的编程智能体,使得代码助手有能力进化为真正的代码工程师。然而,现有方法在实现高保真文档到代码库的自动生成(例如从科学论文到代码)方面仍面临重大挑战,其根本原因在于信息过载与 LLM 上下文容量瓶颈之间的冲突

为此,本文提出 DeepCode,一个完全自主的框架,通过系统化的信息流管理从根本上解决这一问题。DeepCode 将代码库合成视为信道优化问题,通过协调四类信息操作,在有限上下文预算下最大化任务相关信号:

  1. 源信息压缩(source compression):通过蓝图蒸馏(blueprint distillation)压缩输入文档;
  2. 结构化索引(structured indexing):利用状态化代码记忆(stateful code memory)进行高效索引;
  3. 条件知识注入(conditional knowledge injection):通过检索增强生成(retrieval-augmented generation)注入相关知识;
  4. 闭环错误修正(closed-loop error correction):自动检测与纠正生成错误。

在 PaperBench 基准测试上的大量评估表明,DeepCode 达到了最先进(SOTA)性能,显著超越了领先的商业智能体如 Cursor 和 Claude Code,并在关键重现性指标上超过了顶尖机构的博士级人类专家。

通过系统地将论文规范转化为可生产部署的高质量实现,DeepCode 为**自主科学复现(autonomous scientific reproduction)**奠定了新的基础,能够加速科研验证与发现的进程。

原文链接:https://arxiv.org/abs/2512.07921