Look for any podcast host, guest or anyone
Showing episodes and shows of

Nicolas Steinmetz

Shows

Big Data HebdoBig Data HebdoEpisode 215 : Le RAG en 2025 toujours d'actualité ?Dans cet épisode du Big Data Hebdo, on fait le point sur le RAG (Retrieval-Augmented Generation) : est-il toujours au cœur des usages d’IA générative en entreprise, ou dépassé par les nouveaux paradigmes comme l’agentic AI ?Paul, Jérôme, Nicolas et Vincent reviennent sur :Les fondamentaux du RAG : pourquoi est-il apparu ?Comment fonctionne techniquement un pipeline RAG ?Les erreurs à éviter quand on passe en productionLes bonnes pratiques : hybrid search, cache, feedback utilisateursCe qui change en 2025 : modularité, agentic RAG, graph RAG, et plus encore !Retrouvez les épiosodes et show notes sur https://bigdatah...2025-04-0757 minBig Data HebdoBig Data HebdoEpisode 214 : Plus vite et moins cher sur Snowflake avec IndeximaDans cet épisode du Big Data Hebdo, 🎙️ j’ai eu le plaisir d’échanger avec Nicolas Korchia de Indexima, qui nous dévoile comment leur solution révolutionne la performance des requêtes analytiques sur Snowflake⚡👉 Indexima for Snowflake analyse les requêtes en temps réel et génère automatiquement des agrégats optimisés avec les Dynamic Tables, réduisant drastiquement les temps de réponse et les coûts ! 💰💨Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-214-plus-vite-et-moins-cher-sur-snowflake-avec-indexima/-----------------Cette publication est sponsorisée par Datatask (http...2025-03-2151 minBig Data HebdoBig Data Hebdoepisode 213 : Timeseries et SQL avec Warp10🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io).📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake !Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-213-timeseries-et-sql-avec-warp10/2025-02-211h 00Big Data HebdoBig Data HebdoEpisode 212 Analytique en Cloud HybrideLe BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science.Florian partage son expérience sur les défis de migration, de FinOps, et l'intégration des IA génératives. Une discussion passionnante sur la modernisation des infrastructures et l'impact des nouvelles technologies dans les grandes organisations.Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode...2025-02-031h 18Big Data HebdoBig Data HebdoEpisode 211 - MotherduckLe BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne.Show notes sur http://bigdatahebdo.com/podcast/episode-211-motherduck/2025-01-2355 minBig Data HebdoBig Data HebdoEpisode 210 - Prédictions 2025Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr (https://cerenit.fr) et retrouvez-nous...2025-01-1744 minBig Data HebdoBig Data HebdoEpisode 209 : FoundationDB, brique élémentaire de Materia KV feat @MACIDans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ?  C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-209-foundationdb-labrique-elementaire-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...2024-11-221h 15Big Data HebdoBig Data HebdoEpisode 208 : Aux sources de FoundationDB feat @MACIDans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ?  C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-208-aux-sources-de-foundationdb-feat-maci-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...2024-11-1558 minBig Data HebdoBig Data HebdoEpisode 207 : Live au Salon Data & IA de Nantes 2024Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public.à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrwLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube2024-11-0135 minBig Data HebdoBig Data HebdoEpisode 206 : portes ouvertes chez OpenAILes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-206-portes-ouvertes-chez-openai/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube2024-10-1850 minBig Data HebdoBig Data HebdoEpisode 205 : Kestra avec Ludovic DehonLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-DehonRetrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube2024-09-271h 14Big Data HebdoBig Data HebdoEpisode 204 : 70 milliards de réflectionsLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube  ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer v...2024-09-1448 minBig Data HebdoBig Data HebdoEpisode 203 : Pas de trêve olympique pour les LLMsLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask p...2024-08-0148 minBig Data HebdoBig Data HebdoEpisode 202 : Data Architecture avec Frédéric Brossard de DcubeRetrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/  ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. Le générique a été composé et réalisé par Max2024-07-271h 12Big Data HebdoBig Data HebdoEpisode 201 : Snowflake Summit 24 - part 2 ML et Generative AIRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...2024-07-1656 minBig Data HebdoBig Data HebdoEpisode 200 : Snowflake Summit 24 part 1 Data-EngineeringRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...2024-07-0955 minBig Data HebdoBig Data HebdoEpisode 199 : Databricks Data & AI Summit 2024Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...2024-07-021h 07Big Data HebdoBig Data HebdoEpisode 198 : IA Gen et AnssiRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-06-2533 minBig Data HebdoBig Data HebdoEpisode 197 : GLADIA avec Jean-Louis QueguinerRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-06-111h 19Big Data HebdoBig Data HebdoEpisode 196 : python, duckdb, etc...Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-06-0435 minBig Data HebdoBig Data HebdoEpisode 195 : DBT avec Florian EidenRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-281h 13Big Data HebdoBig Data HebdoEpisode 194 : Self Service Data - Tristan Mayer - CastorDocRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-2156 minBig Data HebdoBig Data HebdoEpisode 193 : Microsoft Fabric avec Marie AubertRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-141h 06Big Data HebdoBig Data HebdoEpisode 192 : DuckDB et autres avec Christophe BlefariRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-101h 10Big Data HebdoBig Data HebdoEpisode 191 : Popsink avec Benjamin DjidiRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-04-291h 02Big Data HebdoBig Data HebdoEpisode 190 : Databricks DBRX avec Quentin AmbardRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...2024-04-2250 minBig Data HebdoBig Data HebdoEpisode 189 : la compta du futur et autres newsRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...2024-04-0859 minBig Data HebdoBig Data HebdoEpisode 188 : Data-Ops avec Matthieu RousseauRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...2024-03-2950 minBig Data HebdoBig Data HebdoEpisode 187 : La data chez Nickel avec Paul Marcombes2024-03-2058 minBig Data HebdoBig Data HebdoEpisode 186 : plus jQuery que TerraformRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...2024-03-091h 06Big Data HebdoBig Data HebdoEpisode 185 : C'est génial jusqu'au moment ou c'est plus génial* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda* IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1...2024-03-0153 minBig Data HebdoBig Data HebdoEpisode 184 : Pour une poignée de dollarsShownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/2024-02-1558 minBig Data HebdoBig Data HebdoEpisode 183 : Promptologues de l'infra### Promptologues* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt...2024-02-0935 minBig Data HebdoBig Data HebdoEpisode 182 : Zuck fabric une AGI avec des data-contractsShownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/2024-02-0347 minBig Data HebdoBig Data HebdoEpisode 181 : Le Maestro du GPT StoreShownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/2024-01-2652 minBig Data HebdoBig Data HebdoEpisode 180 : Quelques news pour démarrer 2024https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/2024-01-1744 minBig Data HebdoBig Data HebdoEpisode 179 : 2023 en revue et quelques prédictions pour 20242023-12-291h 28Big Data HebdoBig Data HebdoEpisode 178 : Q Re-invent tout AWS2023-12-121h 06Big Data HebdoBig Data HebdoEpisode 177 : Je ne sais pas### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY* LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex### data-engineering* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00...2023-12-0551 minBig Data HebdoBig Data HebdoEpisode 176 : Il n'y a pas que les modèles qui hallucinent### LLM fever* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résultats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter* Microsoft optimise Azure avec ses propres puces d’IA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/### Data-eng* data load tool (dlt) -> https://dlthub.com/* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/da...2023-11-2751 minBig Data HebdoBig Data HebdoEpisode 175 : Evaluateur de LLM* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/### Tools* Pijul -> https://pijul.org/* Pijul la théorie -> https://p...2023-11-2042 minBig Data HebdoBig Data HebdoEpisode 174 : OpenAI devday 2023* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih### LLM fever* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation* Quand la boîte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/### Data-Science* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden...2023-11-1349 minBig Data HebdoBig Data HebdoEpisode 173 : L'arbre qui cache la forêt aléatoire### Data-science* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41### Tools* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a* Fast, Git Friendly API Client -> https://www.usebruno.com2023-10-3048 minBig Data HebdoBig Data HebdoEpisode 172 : ça souffle toujours sur les LLMs### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08* K...2023-10-2346 minBig Data HebdoBig Data HebdoEpisode 171 : ChatGPT on lui parle polimentLinkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/2023-10-1644 minBig Data HebdoBig Data HebdoEpisode 170 : le Vent tourne pour les LLM### LLM* Mistral 7B is here! -> https://mistral.ai/product/* What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard* How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web* Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565* The iliad Group is making strategic investments in Artificial Intelligence -> https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_AI_260923_Eng_462ff3265c.pdf### Cloud and DBs* Announcing DuckDB 0.9.0 -> https...2023-10-1044 minBig Data HebdoBig Data HebdoEpisode 169 : LLM est un consultant comme les autres* Modern Data Stack Meetup : Streamlit + Kestra### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center* LLMs in Action: A Practical Guide for Software Architects and Developers -> https://www.linkedin.com/pulse/llms-action-practical-guide-software-architects-s%C3%A9bastien-brasseur?utm_source=share&utm_medium=member_ios&utm_campaign=share_via* Lantern — a PostgreSQL vector database for building AI applications -> https://docs.lantern.dev/blog/2023/09/13/hello-world### Data science* Announcing Py...2023-09-191h 11Big Data HebdoBig Data HebdoEpisode 168 : Si t'as pas ta vectordb en 2023...### Tools* Ruff -> https://beta.ruff.rs/docs/### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix* Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/### Database* Awesome DuckDB -> https://github.com/davidgasquez/awesome-duckdb### GenAI* RAG vs Finetuning — Which Is the Best Tool to Boost Your LLM Application? -> https://towardsdatascience.com/rag-vs-finetuning-which-is-the-best-tool-to-boost-your-llm-application-94654b1eaba7* Best pra...2023-09-051h 17Big Data HebdoBig Data HebdoEpisode 167 : SnowflakeDans cet épisode nous accueillons Ilyes Mehaddi de Snowflake pour nous parler de Snowflake Data Cloud et des annonces du SummitRetrouvez Ilyes sur le slack du bigdatahebdo ou alors sur son blogData Cloud World Tour : 5 octobre à Paris Recap du Summit 2023 par secteurs d’activités Recap des annonces du Summit 2023 SponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.2023-07-271h 39Big Data HebdoBig Data HebdoEpisode 155 : Bilan et prédictions de début d'année (en retard)OrateursAlexander : @alexanderdejaJérôme : @jxerome et ZeeneaNicolas: @nsteinmetz, CerenIT, Paris Time Series MeeupVincent : @vhe74, Affini-Tech et DatataskPaul : @paulpetonSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blo...2023-03-111h 13Big Data HebdoBig Data HebdoEpisode 151 : Nicolas @ Flovea et quelques News### Flovea### Time Series* Welcome to InfluxDB IOx: InfluxData’s New Storage Engine -> https://www.influxdata.com/blog/influxdb-engine/### Big Data* Mort d’Hadoop : le marché se trompe selon le TOSIT -> https://www.lemagit.fr/actualites/252525812/Mort-dHadoop-une-affirmation-prematuree-selon-le-TOSIT### DBT* Coalesce 2022 : dbt Semantic Layer -> https://www.prnewswire.com/news-releases/dbt-labs-launches-the-dbt-semantic-layer-enabling-greater-consistency-across-analytics-tools-301652226.html* Coalesce 2022 : replays -> https://www.youtube.com/playlist?list=PL0QYlrC86xQlj9UDGiEwhXQuSjuSyPJHl### Duckdb* Seattle data guy duckdb -> https://www.youtube.com/watch?v=vrjDyxWQTJ4&t=1732s* dbt-duckdb · PyPI -> https://pypi.org/project/dbt-duc...2022-12-051h 15Big Data HebdoBig Data HebdoEpisode 134 : Merry X-Mas les coquinous !Episode 134 : Merry X-Mas les coquinous !Un épisode de fin d'année et de news enregistré le 22/12/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP1342021-12-231h 13Big Data HebdoBig Data HebdoEpisode 133 : IaaS qu'il faut et plus encore en serverlessEpisode 133 : IaaS qu'il faut et plus encore en serverlessUn épisode de news enregistré le 10/12/2021.avec Alexander Dejanovski, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP1332021-12-171h 22Big Data HebdoBig Data HebdoEpisode 132 : Le No-Code est-il compatible avec le RegistryOps ?Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?Un épisode de news enregistré le 26/11/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP1322021-12-101h 25Big Data HebdoBig Data HebdoEpisode 131 : big data à 230 kb/sEpisode 131 : big data à 230 kb/sPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 12/11/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP1312021-12-031h 47Big Data HebdoBig Data HebdoEpisode 130 : Du DevSecOps administrativement souverainEpisode 130 : Du DevSecOps administrativement souverainPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 15/10/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP1302021-11-221h 56Big Data HebdoBig Data HebdoEpisode 129 : Tant qu'il IA du SQLUn épisode de news enregistré le 01/10/21 par Vincent Heuschling, Jérôme Mainaud, et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP1292021-10-311h 24Big Data HebdoBig Data HebdoEpisode 126 : Indexima, SQL, ML & optimisationUn épisode thématique enregistré le 16/07/2021. Nous recevons Nicolas Korchia pour nous parler d'Indexima. Indexima optimise les requêtes SQL entre les outils de Dataviz ou de BI et les Cloud data warehouses. Shownotes complètes sur : https://trkit.io/s/BDHEP1262021-07-251h 27Big Data HebdoBig Data HebdoEpisode 124 : Ultra bleu ou vert, c'est selonUn épisode de news enregistré le 18/06/21 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1242021-07-021h 42Big Data HebdoBig Data HebdoEpisode 123 : Data+AI Summit avec Quentin AmbardData+AI Summit avec Quentin Ambard de DatabricksEnregistré le 4/6/2021 par Quentin Ambard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1232021-06-231h 08Big Data HebdoBig Data HebdoEpisode 122 : Le défi de la data dans le monde de la voileLe défi de la data dans le monde de la voileEnregistré le 26/03/2021 par Olivier Douillard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1222021-06-111h 23Big Data HebdoBig Data HebdoEpisode 121 : Le défi de la data chez les experts comptablesLe défi de la data chez les experts comptablesEnregistré le12/03/2021 par Fabrice Heuvrard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP1212021-05-311h 16Big Data HebdoBig Data HebdoEpisode 120 : 50 ans de FTP et toujours pas à la retraite50 ans de FTP et toujours pas à la retraiteEnregistré le 07/05/2021 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP1202021-05-161h 55Big Data HebdoBig Data HebdoEpisode 119 - Le Cloud Native Developper fait-il autre chose que du Kubernetes ?Cloud Native Developper !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérôme Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1192021-04-161h 45Big Data HebdoBig Data HebdoEpisode 118 : Excel, à fond la fonctionExcel, à fond la fonction !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1182021-02-181h 55Big Data HebdoBig Data HebdoEpisode 117 : AWS avec Sébastien StormacqL'offre AWS avec les annonces "data" de Re-Invent 2020 par Sébastien StormacqEnregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1172021-02-071h 51Big Data HebdoBig Data HebdoEpisode 116 : Powerpoint la bdd du futurPowerpoint la base de données du futur !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1162021-01-191h 44Big Data HebdoBig Data HebdoEpisode 115 : CentOS est mort, vive CentOSCentOS est mort, vive CentOS !Enregistré le 18/12/2020 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaudet Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1152021-01-151h 36Big Data HebdoBig Data HebdoEpisode 114 : Bientôt un abonnement pour écouter BigData Hebdo ?Bientôt un abonnement pour écouter BigData Hebdo ?Episode de News enregistré le 4/12/2020 par Nicolas Steinmetz, Jérôme Mainaud, Alexander Dejanovski, et Vincent Heuschling Shownotes complètes sur : https://trkit.io/s/BDHEP1142020-12-311h 46Big Data HebdoBig Data HebdoEpisode 113 : Data Catalog et Data DiscoveryUn épisode thématique sur le data catalog, la data discovery et la gouvernance des données, enregistré le 20/11/20 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud, Sandrine Bernaud de Zeenea, et Sylvain L.Shownotes complètes sur : https://trkit.io/s/BDHEP1132020-12-271h 35Big Data HebdoBig Data HebdoEpisode 112 : Dans le radar des cool vendorsDans le radar des cool vendorsEpisode de News enregistré le 06/11/2020 par Nicolas Steinmetz et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP1122020-12-021h 20Big Data HebdoBig Data HebdoEpisode 110 : Du SQL à toutes les saucesDu SQL à toutes les saucesEpisode de News enregistré le 9/10/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP1102020-10-121h 39Big Data HebdoBig Data HebdoEpisode 109 : Un bras ça coute cher ...Un bras ça coute cher, mais pas autant qu'un flocon....Episode de News enregistré le 25/9/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1092020-10-111h 39Big Data HebdoBig Data HebdoEpisode 108 : Azure SynapseAzure synapse AnalyticsEnregistré le 11 septembre 2020 avec Fabien Adato et Paul Peton , Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP10!2020-09-131h 39Big Data HebdoBig Data HebdoEpisode 107 : 100 millions sinon rienQuelques news de rentréeEnregistré le septembre 2020 avec Alexander Dejanovski, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP107a2020-09-071h 36Big Data HebdoBig Data HebdoEpisode 106 : Hadoop et Cloudera, hier, aujourd'hui et demainQuelques news pour l'étéEnregistré le 24 Juillet 2020 avec Denis Fraval, Laurent Edel, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP1062020-08-181h 36Big Data HebdoBig Data HebdoEpisode 105 : summer newsQuelques news pour l'étéEnregistré le 10 Juillet 2020 par Vincent Heuschling , Jérôme Mainaud, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1052020-08-141h 18Big Data HebdoBig Data HebdoEpisode 103 : ConsulUne interview sur Consul enregistrée le 12 juin 2020Shownotes complètes sur : https://trkit.io/s/BDHEP103aAffini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Pierre Souchay : [@vizionr](https://twitter.com/vizionr)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com...2020-07-151h 15Big Data HebdoBig Data HebdoEpisode 101 : soit 5 en binaireShownotes complètes sur : https://trkit.io/s/BDHEP101 Affini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...2020-06-211h 19Big Data HebdoBig Data HebdoEpisode 100 : Anniversaire avec la communautéShownotes complètes sur : https://trkit.io/s/BDHEP100 Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...2020-06-043h 09Big Data HebdoBig Data HebdoEpisode 99 : Apache Pulsar et Kafka on PulsarOn parle de Apache Pulsar et Kafka on Pulsar avec nos invitésShownotes complètes sur : https://trkit.io/s/BDHEP99Steven : https://twitter.com/GwinizDuPierre : https://twitter.com/PierreZQuentin : https://twitter.com/waxzceVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plate...2020-05-061h 19Big Data HebdoBig Data HebdoEpisode 98 : Datastax, le retour à la communauté ?Shownotes complètes sur : https://trkit.io/s/BDHEP98Cedrick Lunven et Alexander Dejanovski nous parlent du rachat de the last pickle par Datastax* The Last Pickle Joining DataStax https://trkit.io/s/BDH-HecICs* Des Workshop online tous les mercredis (celui la jeudi)https://trkit.io/s/BDHBFNBJeCA* Posez vos questions à la communautéhttps://trkit.io/s/BDHdqLRTZpH* FF4J le projet OSS de Cedrick https://trkit.io/s/BDHUImVCBxr### Meetups et conférences Bigdatapero en stand by et probablement en r...2020-04-061h 19Big Data HebdoBig Data HebdoEpisode 94 : Data Lake HouseTHE DATA LAKEHOUSE ?https://www.moderndataanalytics.com/post/the-data-lakehouseWhat Is a Data Lakehouse?https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.htmlDBLog: A Generic Change-Data-Capture Frameworkhttps://medium.com/netflix-techblog/dblog-a-generic-change-data-capture-framework-69351fb9099bMySQL is the DBMS of the Year 2019https://db-engines.com/en/blog_post/83Keystone Real-time Stream Processing Platformhttps://netflixtechblog.com/keystone-real-time-stream-processing-platform-a3ee651812aInternals of Google Cloud Spannerhttps://thedataguy.in/internals-of-google-cloud-spanner/La CNIL publie un guide RGPD pour les développeurshttps://w...2020-02-261h 00Big Data HebdoBig Data HebdoEpisode 93 : Foundation DBFoundation DBhttps://github.com/apple/foundationdb/wiki/FoundationDB-Release-7.0-Planninghttps://pierrezemb.fr/posts/notes-about-foundationdb-------------------------------------------------------------DevFest du Bout du Monde 2020The DevFest, or 'Developers Festival', is a technical conferences for software developers. It is aimed to students, profesionals or simply curious technophile.https://devfest.duboutdumonde.bzh/-------------------------------------------------------------OvhCloud / Datahttps://www.ovhcloud.com/fr/public-cloud/data-analytics/-------------------------------------------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdo...2020-02-171h 45Big Data HebdoBig Data HebdoEpisode 92 : T'as lu le Codd ?Better Drivers for Cassandrahttps://www.datastax.com/blog/2020/01/better-drivers-for-cassandraInfluxDB 2.0 beta 1https://www.influxdata.com/blog/influxdb-2-0-open-source-beta-released/InfluxDB 2.0 beta 2https://www.influxdata.com/blog/release-announcement-influxdb-2-0-0-beta-2/When to Say No to Machine Learninghttps://medium.com/semi-random-thoughts/a-product-managers-guide-to-when-to-say-no-to-machine-learning-and-when-to-say-yes-1cd6d7884c7Using Prophet To Forecast Weather Data and Detect Anomalieshttps://towardsdatascience.com/using-prophet-to-forecast-weather-data-8e4fc6b8f8e5Kalman Filters for Software Engineershttps://towardsdatascience.com/kalman-filters-for-software-engineers-3d2a05dee465Pas mal de...2020-02-021h 24Big Data HebdoBig Data HebdoEpisode 91 : C'est en rachetant qu'on devient un géant-----------------------------Quelques newsGoogle May Buy Salesforce To Help Bolster Its Cloud Businesshttps://www.webpronews.com/google-may-buy-salesforce/The Apache Software Foundation Bloghttps://blogs.apache.org/foundation/entry/the-apache-news-round-up151 - Apache Libcloud 2.7.0 released http://libcloud.apache.org/ - Apache Libcloud 2.8.0 released https://libcloud.apache.org/ - Apache TVM (Incubating) 0.6.0 released https://tvm.apache.org/ - Apache Druid (incubating) 0.16.1 released http://druid.apache.org/ - Apache HBase 2.1.8 released http://hbase.apache.org/ - Apache Kafka 2.4.0 released http://kafka.apache.org/ - Apache Hivemall (Incubating) 0.6.0 released http://hivemall.incubator...2020-01-141h 27Big Data HebdoBig Data HebdoEpisode 90 : La FAQ de NOEL 2019LA FAQ de NOEL (Décembre 2019)Dans cet épisode on répond aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comA...2019-12-231h 20Big Data HebdoBig Data HebdoEpisode 87 : Un elephant peut en cacher un autreEpisode 87 pgday Paris 2020https://2020.pgday.paris/----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://bit.ly/Invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoAdrien : https://twitter.com/Adrien_nayratNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et Cerenit( http://affini-tech.com https://twi...2019-11-131h 19Big Data HebdoBig Data HebdoEpisode 85 : En direct du OVH Cloud SummitEpisode 85-------------------------------------------------------------OVH Cloud Summit -------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Vincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------2019-10-1226 minBig Data HebdoBig Data HebdoEpisode 83 : Le Z il n'y a rien au dessusEpisode 83--------------------Cobol, 60 ans, toujours aux commandeshttps://www.lemondeinformatique.fr/actualites/lire-cobol-60-ans-toujours-aux-commandes-76385.htmlAvec le z15, IBM renforce la protection sur les donnéeshttps://www.lemondeinformatique.fr/actualites/lire-avec-le-z15-ibm-renforce-la-protection-sur-les-donnees-76420.htmlFiche technique du z15https://www.ibm.com/downloads/cas/NN7GBPJ1IBM Introduces Next-Gen Z Mainframe: The z15; Wider Cores, More Cores, More Cache, Still 5.2 GHzhttps://fuse.wikichip.org/news/2659/ibm-introduces-next-gen-z-mainframe-the-z15-wider-cores-more-cores-more-cache-still-5-2-ghz/New in Docker Hub: Personal Access Tokenshttps://blog.docker.com/2019/09/docker-hub-new-personal-access-tokens/Procella: u...2019-09-241h 07Big Data HebdoBig Data HebdoEpisode 82 : Quand tu es idéaliste tu fais des listesEpisode 82 --------------------Time SeriesParis Time Series Meetup #1https://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/264517156Telegraf 1.12https://www.influxdata.com/blog/release-announcement-telegraf-1-12-0/--------------------SparkHow I test with Apache Spark?https://medium.com/@nastasia.saby/how-i-test-with-apache-spark-97b2bacf0b77--------------------DatabasesAnnouncing the first Postgres extension to run WebAssemblyhttps://medium.com/wasmer/announcing-the-first-postgres-extension-to-run-webassembly-561af2cfcb1Pivotal Greenplum 6, Now GA, Uses PostgreSQL to Reimagine Modern Analytics at Scalehttps://content.pivotal.io/blog/pivotal-greenplum-6...2019-09-1159 minBig Data HebdoBig Data HebdoEpisode 79 : du neuf et du moins neufTime seriesRedisTimeSeries Module Adds Time Series Database Features to Redishttps://www.infoq.com/news/2019/07/redis-time-series-moduleRedisTimeSeries GA – Making the 4th dimension truly immersivehttps://redislabs.com/blog/redistimeseries-ga-making-4th-dimension-truly-immersive/How Hulu Uses InfluxDB and Kafka to Scale to Over 1 Million Metrics a Secondhttps://medium.com/hulu-tech-blog/how-hulu-uses-influxdb-and-kafka-to-scale-to-over-1-million-metrics-a-second-1721476aaff5CassandraStreaming Cassandra at WePay - Part 1https://wecode.wepay.com/posts/streaming-cassandra-at-wepay-part-1Streaming Cassandra at WePay - Part 2https://wecode.wepay.com/posts/streaming-cassandra-at-wepay-part-2Cassandra Exports as a...2019-07-291h 28Big Data HebdoBig Data HebdoEpisode 75 : the clever, the safe and the uglyClever Cloud identity, reloadedhttps://www.clever-cloud.com/blog/company/2019/05/27/clever-cloud-new-logo/Big-data bombshell: MapR may shut down as investor pulls out after ‘extremely poor results’https://siliconangle.com/2019/05/30/mapr-may-shut-investor-pulls-following-extremely-poor-results/Update de MAPR https://mapr.com/blog/an-update-from-mapr/Dependabot is Now Free and It’s Amazinghttps://nimbleindustries.io/2019/05/26/dependabot-is-now-free-and-its-amazing/NoSQLSecurity for Elasticsearch is now freehttps://www.elastic.co/blog/security-for-elasticsearch-is-now-freeElasticsearch on Kubernetes: A new chapter beginshttps://www.elastic.co/blog/introducing-elastic-cloud-on-kubernetes-the-elasticsearch-operator-and-beyondErratum licence Elastic Canvashttps://www.el...2019-06-051h 36Big Data HebdoBig Data HebdoEpisode 74 : Le soldat wsl2 sauvera t’il la cogip ?Snips Open Sources Tracthttps://medium.com/snips-ai/snips-open-sources-tract-cdc50f437ef2AI Weekly: Google’s ethics council barely lasted a week, but there’s a thin silver lininghttps://venturebeat.com/2019/04/05/ai-weekly-googles-ethics-council-barely-lasted-a-week-but-theres-a-thin-silver-lining/Google ouvre un centre mondial dédié à la vie privée en Europehttp://www.lefigaro.fr/secteur/high-tech/google-ouvre-un-centre-mondial-dedie-a-la-vie-privee-en-europe-20190514Thoughtworks Technology Radar vol 20 - Avril 2019https://www.thoughtworks.com/radarData Lake + Data Warehouse in One Box using Snowflakehttps://blog.persistent.com/index.php/2019/05/07/data-lake-dwh-in-one-box-using-snowflake/Announcing WSL 2https://devblogs.microsof...2019-05-181h 04Big Data HebdoBig Data HebdoEpisode 73 : Si t'as pas le mode sombre t'as raté ta vieVenez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Elastic Stack 7.0.0 releasedhttps://www.elastic.co/blog/elastic-stack-7-0-0-releasedKafka : Migrer un consommateur vers Streams et Connecthttp://blog.ippon.fr/2019/04/29/rex-migrer-un-consommateur-vers-streams-et-connect/The PipelineDB Team Joins Confluenthttps://www.confluent.io/blog/pipelinedb-team-joins-confluenthttps://www.pipelinedb.com/blog/pipelinedb-is-joining-confluentIntroduction à Apache Pulsarhttps://speakerdeck.com/bbonnin/introduction-a-apache-pulsarFor Open Source, It's All About GitHub Nowhttps://www.wired.co...2019-05-041h 24Big Data HebdoBig Data HebdoEpisode 68 : KaaS la baraqueCloud et open sourceLa bataille entre vrai open source et faux open source s'intensifiehttps://www.zdnet.fr/actualites/la-bataille-entre-vrai-open-source-et-faux-open-source-s-intensifie-39881007.htmLes fournisseurs cloud, bourreaux de l'open source ?https://www.zdnet.fr/actualites/les-fournisseurs-cloud-bourreaux-de-l-open-source-39881337.htmLCC 205 - Interview analyse de l'industrie avec Sacha Laboureyhttps://lescastcodeurs.com/2019/02/21/lcc-205-interview-analyse-de-l-industrie-avec-sacha-labourey/KubernetesManaged Kubernetes Servicehttps://www.ovh.com/fr/kubernetes/Kubernetes as a Service : OVH dévoile sa nouvelle arme en version finalehttps://www.journaldunet.com/solutions/cloud-computing/1421810-kubernetes-as-a-service-ovh-devoile-son-offre-en-version-finale/Google Cloud Services Platform d...2019-03-041h 17Big Data HebdoBig Data HebdoEpisode 66 : Papa est de retourKafkaConfluent Raises a $125M Series D Funding Roundhttps://www.confluent.io/blog/confluent-raises-a-125m-series-d-funding-roundDatabasesInfluxDB 2.0 Alpha Release and the Road Aheadhttps://www.influxdata.com/blog/influxdb-2-0-alpha-release-and-the-road-ahead/Introducing the Next-Generation InfluxDB 2.0 Platformhttps://www.influxdata.com/blog/introducing-the-next-generation-influxdb-2-0-platform/Microsoft Acquires Citus Data: Creating the World’s Best Postgres Experience Togetherhttps://www.citusdata.com/blog/2019/01/24/microsoft-acquires-citus-data/Elastic Stack 6.6.0 Releasedhttps://www.elastic.co/blog/elastic-stack-6-6-0-released14 Things To Do When Setting Up a New Cassandra Clusterhttp://thelastpickle.com/blog/2019/01/30/ne...2019-02-041h 19Big Data HebdoBig Data HebdoEpisode 65 : La famille s'agranditDatabaseThe Guardian’s Migration from MongoDB to PostgreSQL on Amazon RDShttps://www.infoq.com/news/2019/01/guardian-mongodb-postgresqlSQL is Dead, Hail to Fluxhttp://bit.ly/2CrzERXInfrastructureBlog: APIServer dry-run and kubectl diffhttps://kubernetes.io/blog/2019/01/14/apiserver-dry-run-and-kubectl-diff/Infrastructure as real codehttps://gianarb.it/blog/infrastructure-as-real-codeDatascienceAn Introduction to the Machine Learning Platform as a Servicehttp://bit.ly/2AHpv2tWhy Dask ?http://docs.dask.org/en/latest/why.htmlRe...2019-01-211h 10Dev\'ObsDev'ObsDev'Obs #10 / Formation, Tests et InnovationAvec Nicolas Steinmetz, Romain Soufflet, Barthelemy Vessement et Guilhem LettronChapters:00:04:52 Qu'est-ce que pour toi le DevOps ?00:05:37 News00:15:32 La formation des équipes 00:46:52 Tests dans l'Infrastructure as Code 01:12:35 L'innovation en entreprise Voir Acast.com/privacy pour les informations sur la vie privée et l'opt-out.2018-10-151h 40DevObsDevObsDev'Obs #10 / Formation, Tests et InnovationAvec :Nicolas Steinmetz Romain SouffletBarthelemy VessementGuilhem LettronChapters:00:04:52 Qu'est-ce que pour toi le DevOps ?00:05:37 News00:15:32 La formation des équipes 00:46:52 Tests dans l'Infrastructure as Code 01:12:35 L'innovation en entreprise ★ Support this podcast ★ 2018-10-151h 40