Look for any podcast host, guest or anyone
Showing episodes and shows of

Alessio Fanelli

Shows

跨国串门儿计划
跨国串门儿计划#340.:对话李飞飞与Justin Johnson:超越语言模型,构建理解三维世界的AI新前沿📝 本期播客简介本期我们克隆了知名播客《Latent Space》的深度对话,主持人Alessio Fanelli和Wix邀请到World Labs的两位联合创始人——人工智能领域的先驱李飞飞教授和她的前学生Justin Johnson。李飞飞教授是斯坦福大学以人为本人工智能研究院的创始联席主任,也是ImageNet的奠基人,而Justin Johnson则曾任Meta和密歇根大学教授。他们将带我们深入探讨“世界模型”和“空间智能”这一A I领域的下一个前沿。 对话中,两位嘉宾分享了他们如何从ImageNet时代一路走来,共同创立World Labs,致力于构建一个能理解、推理和生成三维世界的模型。他们隆重介绍了公司首款产品Marble,这是一个能将文本或图片转化为可交互、可编辑三维世界的生成模型,其应用场景横跨游戏、电影、视觉特效、设计乃至机器人训练。节目深入探讨了深度学习中算力规模化的历史、A I“理解”物理规律与“拟合模式”的差异,以及为何空间智能被低估,它与语言智能如何互补共存。这不仅是一场关于前沿技术的讨论,更是一次对A I未来方向的深刻思考,揭示了从像素到空间智能的广阔前景。翻译克隆自:After LLMs: Spatial Intelligence and World Models — Fei-Fei Li & Justin Johnson, World Labs👨‍⚕️ 本期嘉宾李飞飞教授:斯坦福大学以人为本人工智能研究院的创始联席主任,ImageNet的奠基人。Justin Johnson:World Labs联合创始人,曾任Meta和密歇根大学教授,李飞飞教授的学生。⏱️ 时间戳00:00 开场 & 播客简介World Labs的诞生与愿景02:10 深度学习的历史与算力规模化:从CPU到GPU的飞跃02:34 World Labs的首款产品Marble:三维世界的生成模型03:44 师生情谊:李飞飞与Justin Johnson的缘起04:00 AlexNet与ImageNet时代:AI从数据中心走向现实世界的转折点05:15 世界模型的“AlexNet时刻”:数据与算力的爆发式增长AI研究的生态与未来06:44 开放科学与产业界:AI生态系统的多样性与挑战08:01 商业压力下的学术研究:资源失衡与人才流失的担忧10:57 学术界的新定位:探索“古怪想法”与基础理论12:36 “古怪想法”的例子:下一代硬件与神经网络架构的结合从像素到空间智能:技术演进之路14:53 图像字幕生成:从Andrej到Justin的合作历程15:46 讲述图像故事的梦想:从ImageNet到密集字幕生成21:49 空间智能与语言智能的异同:像素与三维世界的本质区别22:12 像素最大化:文本作为物理实体在现实世界的表现23:25 AI对物理规律的“理解”:拟合模式与因果定律的差异25:50 模型“理解”物理的重要性:取决于应用场景Marble:空间智能的首次亮相30:22 Marble的定位:空间智能愿景的第一步31:14 Marble的功能:多模态输入、可编辑性与多样化输出32:03 Marble的应用场景:游戏、视觉特效、电影与机器人训练33:03 精确的摄像机控制:三维空间感的自然产物34:05 Marble的原子单位:高斯splats与实时渲染35:34 动力学与物理属性:未来Marble 2的潜力37:26 Splats的密度与分辨率:移动设备与VR头显的限制38:13 具身智能与机器人训练:Marble在模拟环境中的巨大潜力40:29 设计领域:Marble在室内设计、厨房改造中的意外应用空间智能的深层思考41:29 空间智能的定义:在空间中推理、理解、移动和交互的能力42:52 空间智能与语言智能的互补性:牛顿定律与具身经验45:12 视觉被低估:人类感知与空间智能的进化优势47:15 Winograd Schema Challenge:语言模型在空间智能上的局限48:03 语言模型与空间智能的协同工作:多模态输入与通用模型49:01 AI能否从零发现物理定律:地心说与牛顿定律的抽象层次51:21 不同的学习范式:假设、实验与心智理论52:34 序列到序列模型与Transformer:技术架构的演进55:27 招募人才与未来展望🌟 精彩内容💡 深度学习的算力飞跃与世界模型Justin Johnson指出,深度学习的发展史就是算力规模化的历史,从AlexNet到今天,显卡性能提升千倍,模型训练算力更是百万倍增长。这为处理海量视觉和空间数据,构建“世界模型”奠定了基础。“我觉得深度学习的整个发展史,在某种意义上就是一部算力规模化的历史。”🚀 Marble:空间智能的首次亮相World Labs推出了首款产品Marble,一个能将文本或图片转化为可交互、可编辑三维世界的生成模型。它不仅是迈向空间智能宏大愿景的第一步,也已在游戏、电影、视觉特效、设计和机器人训练等领域展现出巨大潜力。“Marble一方面是朝着空间智能这个宏大愿景迈进的世界模型,另一方面,我们也有意将它设计成一个大家今天就能实际使用的产品。”🧠 空间智能与语言智能的互补李飞飞教授强调,空间智能与语言智能是互补的。空间智能是让你在三维空间中进行推理、理解、移动和交互的能力,而人类的感知和空间智能是经过亿万年进化优化的,却常被低
2025-11-2859 minLatent Space: The AI Engineer Podcast2025-10-3000 min跨国串门儿计划
跨国串门儿计划#128. 当AI学会“思考”:从Claude看RL、推理、工具使用及伦理红线📝 本期播客简介本期我们克隆了:⚡️Multi-Turn RL for Multi-Hour Agents — with Will Brown, Prime Intellect本期《Latent Space》节目,主持人Alessio Fanelli (Decibel联合创始人兼CTO)和SWYX (SmallAI创始人)邀请到Prime Intellect的Will Brown,共同深入探讨Anthropic最新发布的Claude 3.5 Sonnet及Opus模型。节目聚焦于新模型在推理能力、工具调用、“思维扩展”功能上的进化,以及从强调纯推理到更注重智能体实用能力的转变。Will Brown分享了关于模型奖励机制滥用(Reward Hacking)、AI安全测试争议(如铀材料搜索的例子)、以及通过强化学习(特别是GRPO)提升模型工具使用的主动性和有效性的见解。讨论还延伸到大语言模型权限管理、评估体系的未来以及学术研究在AI发展中的关键作用。感谢minimax提供的语音克隆技术支持,我们采用了minimax的speech-02模型进行声音复刻。通过minimax目前业界领先的语音克隆技术,我们能够精准还原原播客主持人和嘉宾的声音特征、情感色彩和语调变化,让您在聆听中文内容的同时,依然能感受到原声音的独特魅力。👨‍⚕️ 本期嘉宾Will Brown,来自Prime Intellect。AI研究者,在强化学习(RL)、AI智能体、模型评估和代码生成领域有深入研究。近期参与发表了关于GRPO(梯度反向策略优化)的研究成果,致力于提升AI模型在复杂任务(如多轮工具调用)中的表现和可靠性。🌟 精彩内容Claude 3.5特性解析: 深入讨论Claude 3.5 Sonnet与Opus在推理、工具调用和“思维扩展”功能上的最新进展。智能体与推理的平衡: 从追求纯推理高分到构建实用AI智能体的行业趋势转变,强调工具调用和多轮对话等实用功能。工具使用与奖励机制: 探讨AI模型如何学习主动使用工具,以及如何通过强化学习(如GRPO)克服奖励机制滥用(Reward Hacking)等问题,例如模型假装使用工具或过度完成任务。AI安全与伦理争议: 剖析Claude模型安全测试中的争议案例(如“暗网搜铀材料”的段子),讨论AI权限管理、模型行为的解读及其社会责任。“思维预算”与成本控制: 讨论模型推理的“思考预算”概念,以及开发者如何在模型输出质量、成本和延迟间进行权衡。强化学习的挑战与前沿: Will Brown分享其团队在GRPO及多轮强化学习方面的研究,以及LLM作为评估者(Referee)判断回答质量和工具使用有效性的潜力。AI评估体系的未来: 探讨当前AI评估方法的局限性,以及学术界在构建更公正、更科学的评估体系中的关键作用和机遇。🌐 播客信息补充翻译克隆自:⚡️Multi-Turn RL for Multi-Hour Agents — with Will Brown, Prime Intellect本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用 AI 进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
2025-05-3034 minNon mi capisci2025-04-1200 minUnsupervised Learning with Jacob Effron2025-03-281h 01Total Party Kast2025-03-191h 08Glasp Talk2024-10-081h 08InProd2024-04-0342 minChinaTalk2024-02-181h 20ChinaTalk2024-02-181h 20Made IT - Storie Italiane di Successo2023-10-0946 minThe AI Daily Brief: Artificial Intelligence News and Analysis2023-08-0457 minChangelog Master Feed2023-06-1459 minPractical AI2023-06-1459 minLatent Space: The AI Engineer Podcast2023-02-2351 minThe Generation Hustle Podcast2023-01-1757 minStoria d\'Italia2021-12-201h 08Il Cortocircuito2021-04-091h 38The Alldus Podcast - AI in Action2021-03-2924 minIl Cortocircuito2020-12-181h 45Il Cortocircuito2019-02-091h 23