Willem Meints, Chief AI Architect bij Aigency, bespreekt de technische innovaties achter DeepSeek in deze aflevering van AIToday Live. DeepSeek is een Chinees taalmodel dat de trainingskosten aanzienlijk heeft weten te verlagen.
Het model bestaat uit verschillende onderdelen, waaronder een chatbot-website, een onderliggend taalmodel en een speciaal reasoning model voor complexe taken. DeepSeek maakt gebruik van synthetische trainingsdata, efficiƫnter geheugengebruik en geautomatiseerde feedback om kosten te besparen.
De hosts bespreken de implicaties van deze ontwikkelingen voor de AI-industrie. De verlaging van trainingskosten kan leiden tot meer diversiteit in de ontwikkeling van taalmodellen.
Onderwerpen
Genoemde entiteiten: DeepSeek - GPT-4
AigencySchrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!