Fala galera, nesse episódio eu explico o DeepSeek V3. Eu passei por todos os pontos tecnicos que chamaram atenção no paper, como Mixture of Experts, MLA, Multi Token Prediction, GRPO... Espero que gostem! :)
Link do grupo do wpp: https://chat.whatsapp.com/GNLhf8aCurbHQc9ayX5oCP
Paper do DeepSeek V3: https://arxiv.org/pdf/2412.19437v1
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai