Listen

Description

欢迎收听AI Radio FM - 科技频道!本期节目,我们将深入探讨SANA-Video,一个能在RTX 5090 GPU上高效运行,生成长达一分钟、720p高分辨率视频的突破性小型扩散模型。我们将揭秘其两大核心创新:线性Diffusion Transformer和恒定内存KV缓存的块线性注意力机制,以及它如何以极低的训练成本,实现比现有SOTA模型快16倍的惊人速度和卓越性能。从训练策略到实时部署,SANA-Video正在重新定义视频生成领域的效率与可访问性。