Listen

Description

深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构:零计算专家和快捷连接MoE,如何实现计算效率和代理能力的飞跃。同时,还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现,并分享其背后的稳定训练策略和基础设施保障。