Listen

Description

Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : optimisation GPU guidée par la mesure, agents en production, accès ouvert sur arXiv, OCR compressif de Deepseek, droit d’auteur et œuvres assistées par IA, outils Weka pour le secteur public, et mouvements côté Google et Google Ads.On démarre par la performance GPU. Des chercheurs proposent d’intégrer des outils de profiling directement dans le raisonnement des modèles pour optimiser des noyaux GPU, ces petits programmes exécutés en parallèle sur la carte graphique. L’idée: instrumenter, mesurer puis ajuster automatiquement les choix d’implémentation pour réduire les goulots d’étranglement. Cette boucle mesure–raisonnement–action vise à mieux exploiter le parallélisme tout en conservant une vision globale des effets sur l’application. Les gains attendus intéressent le calcul scientifique, l’IA et tout flux massivement parallèle.Sur la mise en production des agents, les équipes s’éloignent des architectures multi-agents compliquées. La tendance est à un orchestrateur unique, un LLM qui prend les décisions de haut niveau et délègue à des outils déterministes ou à de plus petits modèles spécialisés. Un prototype de conseil financier a montré la fragilité des chaînes: après trois transferts d’agents, le contexte critique s’est perdu, entraînant des échecs en cascade. En pratique, un planificateur de 34 milliards de paramètres coordonnant un spécialiste de 7 milliards peut dépasser un modèle monolithique de 70 milliards sur certaines tâches tout en consommant moins de jetons. Côté performance, l’“inférence bifurquée” sépare le pré-remplissage (traité en parallèle) du décodage (séquentiel) avec des chemins d’exécution adaptés à chaque phase. Pour passer du prototype au réel, le déploiement progressif reste la voie prudente: validation en mode ombre, migration graduelle du trafic, maintien de solutions de secours et activation étape par étape. La gestion de l’état se complexifie: il faut des machines à états explicites qui suivent données, provenance et niveaux de confiance, avec des points de retour définis. Enfin, la sécurité impose un sandbox d’exécution pour les outils, des permissions limitées, des communications chiffrées et des journaux d’audit immuables.Côté accès ouvert, arXiv célèbre la Semaine de l’Accès Ouvert et appelle aux dons pour maintenir la diffusion gratuite de la recherche. On y trouve notamment “Semantic Intelligence: A Bio-Inspired Cognitive Framework for Embodied Agents”, un cadre cognitif inspiré du vivant pour des agents incarnés capables d’interagir physiquement avec leur environnement. arXiv offre des versions PDF ou HTML, des outils bibliographiques et, via arXivLabs, accueille des fonctionnalités co-développées dans l’esprit d’ouverture et de respect de la vie privée.Place maintenant à Deepseek et son OCR compressif pensé pour les LLM. Leur système compresse des documents textuels basés sur des images jusqu’à un facteur 10 tout en conservant, selon eux, 97 % de l’information. Il s’appuie sur DeepEncoder (380 M de paramètres) couplé à un générateur texte basé sur Deepseek3B-MoE avec 570 M de paramètres actifs. Pour la vision, il associe SAM de Meta (80 M) et CLIP (300 M), avec un compresseur 16x entre les deux. Exemple: une image 1 024×1 024 démarre à 4 096 tokens, SAM traite, le compresseur réduit à 256 tokens, puis CLIP prend le relais. Selon la résolution, 64 à 400 “tokens de vision” suffisent. Sur OmniDocBench, Deepseek dépasse GOT-OCR 2.0 avec 100 tokens contre 256, et bat MinerU 2.0 avec moins de 800 tokens là où ce dernier dépasse 6 000 par page. Les besoins varient: présentations simples avec 64 tokens, livres et rapports autour de 100, journaux complexes en “mode Gundam” jusqu’à 800. Le système gère ~100 langues, conserve le formatage ou produit du texte brut, et décrit des diagrammes, formules chimiques ou figures géométriques. En entraînement: 30 millions de pages PDF multilingues, dont 25 millions en chinois et anglais, 10 millions de diagrammes synthétiques, 5 millions de formules chimiques et 1 million de figures géométriques. En exploitation: plus de 200 000 pages/jour sur un seul Nvidia A100; avec 20 serveurs équipés de huit A100, jusqu’à 33 millions de pages quotidiennement. Codes et poids sont publics.Sur le terrain juridique, l’artiste Jason M. Allen conteste le refus d’enregistrement au droit d’auteur de son œuvre “Théâtre D’opéra Spatial”, créée avec Midjourney. Il invoque le seuil de créativité minimal défini par Feist (“étincelle de créativité”) et compare son travail à la photographie reconnue dans Burrow-Giles, soulignant plus de 600 invites pour concrétiser son intention. Il juge que la politique actuelle pénalise les méthodes assistées par IA et créerait des incohérences si appliquée à grande échelle.Pour les acteurs publics, Weka propose un écosystème numérique: Weka Intégral donne accès à plus de 10 000 fiches et 6 000 outils avec assistance téléphonique, couvrant marchés publics, RH, action sociale, finances, santé, éducation, urbanisme, culture et plus. Weka Ligne Expert offre des échanges téléphoniques illimités avec des spécialistes. Weka Smart, ce sont des masterclasses en direct et une plateforme pour sécuriser pratiques et décisions. Weka le Mag suit les transformations de l’action publique. Des web-conférences arrivent, notamment sur le positionnement du DGS face au maire et au président d’intercommunalité, et sur la cartographie des risques juridiques.Enfin, Google: les annonces de “mises à jour majeures” de l’algorithme de recherche ne se sont pas matérialisées récemment. Côté Google Ads, les comptes sans campagnes actives seront supprimés après six mois d’inactivité. La vue AI Max ajoute une colonne “sources” dans le rapport des termes de recherche pour mieux attribuer les clics. Une expérimentation évalue la valeur des nouveaux clients sans solliciter l’autorisation, un point qui soulève des questions de confidentialité et de contrôle des données.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !


Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.