Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
DeepCode: Open Agentic Coding
Summary
近期大语言模型(LLMs)的发展催生了功能强大的编程智能体,使得代码助手有能力进化为真正的代码工程师。然而,现有方法在实现高保真文档到代码库的自动生成(例如从科学论文到代码)方面仍面临重大挑战,其根本原因在于信息过载与 LLM 上下文容量瓶颈之间的冲突。
为此,本文提出 DeepCode,一个完全自主的框架,通过系统化的信息流管理从根本上解决这一问题。DeepCode 将代码库合成视为信道优化问题,通过协调四类信息操作,在有限上下文预算下最大化任务相关信号:
在 PaperBench 基准测试上的大量评估表明,DeepCode 达到了最先进(SOTA)性能,显著超越了领先的商业智能体如 Cursor 和 Claude Code,并在关键重现性指标上超过了顶尖机构的博士级人类专家。
通过系统地将论文规范转化为可生产部署的高质量实现,DeepCode 为**自主科学复现(autonomous scientific reproduction)**奠定了新的基础,能够加速科研验证与发现的进程。
原文链接:https://arxiv.org/abs/2512.07921