podcast
details
.com
Print
Share
Look for any podcast host, guest or anyone
Search
Showing episodes and shows of
Jerome Mainaud
Shows
Big Data Hebdo
Episode 215 : Le RAG en 2025 toujours d'actualité ?
Dans cet épisode du Big Data Hebdo, on fait le point sur le RAG (Retrieval-Augmented Generation) : est-il toujours au cœur des usages d’IA générative en entreprise, ou dépassé par les nouveaux paradigmes comme l’agentic AI ?Paul, Jérôme, Nicolas et Vincent reviennent sur :Les fondamentaux du RAG : pourquoi est-il apparu ?Comment fonctionne techniquement un pipeline RAG ?Les erreurs à éviter quand on passe en productionLes bonnes pratiques : hybrid search, cache, feedback utilisateursCe qui change en 2025 : modularité, agentic RAG, graph RAG, et plus encore !Retrouvez les épiosodes et show notes sur https://bigdatah...
2025-04-07
57 min
Big Data Hebdo
episode 213 : Timeseries et SQL avec Warp10
🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io).📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake !Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-213-timeseries-et-sql-avec-warp10/
2025-02-21
1h 00
Big Data Hebdo
Episode 212 Analytique en Cloud Hybride
Le BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science.Florian partage son expérience sur les défis de migration, de FinOps, et l'intégration des IA génératives. Une discussion passionnante sur la modernisation des infrastructures et l'impact des nouvelles technologies dans les grandes organisations.Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode...
2025-02-03
1h 18
Big Data Hebdo
Episode 211 - Motherduck
Le BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne.Show notes sur http://bigdatahebdo.com/podcast/episode-211-motherduck/
2025-01-23
55 min
Big Data Hebdo
Episode 210 - Prédictions 2025
Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr (https://cerenit.fr) et retrouvez-nous...
2025-01-17
44 min
Message à caractère informatique
FoundationDB, brique élémentaire, de Warp à MateriaKV feat @bigdatahebdo
Voir sur Youtube Animé par Horacio Gonzalez - @LostInBrittany et Vincent Heuschling - @vhe74 de BigData Hebdo avec la participation de : Jérôme Mainaud - @jxerome Pierre Zemb - @PierreZ Steven Le Roux - @GwinizD Épisode enregistré le 30 octobre 2024 Chapitrage et liens 00:02:44 - Comment Clever Cloud se sert de FoundationDB 00:04:00 - FoundationDB comme backend de stockage pour Warp10 00:07:20 - FoundationDB comme futur backend de stockage pour Pulsar 00:13:45 - L'abstraction clé-valeur 00:17:50 - Virtualisation des bases de données logiques sur FoundationDB 00:20:15 - Mater...
2024-11-22
1h 12
Big Data Hebdo
Episode 209 : FoundationDB, brique élémentaire de Materia KV feat @MACI
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-209-foundationdb-labrique-elementaire-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...
2024-11-22
1h 15
Big Data Hebdo
Episode 208 : Aux sources de FoundationDB feat @MACI
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-208-aux-sources-de-foundationdb-feat-maci-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...
2024-11-15
58 min
Message à caractère informatique
Aux sources de FoundationDB feat @bigdatahebdo
Voir sur Youtube Animé par Horacio Gonzalez - @LostInBrittany et Vincent Heuschling - @vhe74 de BigData Hebdo avec la participation de : Jérôme Mainaud - @jxerome Pierre Zemb - @PierreZ Steven Le Roux - @GwinizD Épisode enregistré le 30 octobre 2024 Chapitrage et liens 03:00 - Le MACI pour le public du BigData Hebdo 05:10 - Le BigData Hebdo pour le public du MACI 07:15 - FoundationDB dans des épisodes précédentes de BigData Hebdo BigData Hebdo 93 - FoundationDB : https://bigdatahebdo.com/podcast/episode-93-foundation-db/ BigData Hebdo 160 - Live à DevoxxFR : https://b...
2024-11-15
56 min
Big Data Hebdo
Episode 207 : Live au Salon Data & IA de Nantes 2024
Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public.à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrwLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
2024-11-01
35 min
Big Data Hebdo
Episode 206 : portes ouvertes chez OpenAI
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-206-portes-ouvertes-chez-openai/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
2024-10-18
50 min
Big Data Hebdo
Episode 205 : Kestra avec Ludovic Dehon
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-DehonRetrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
2024-09-27
1h 14
Big Data Hebdo
Episode 204 : 70 milliards de réflections
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer v...
2024-09-14
48 min
Big Data Hebdo
Episode 203 : Pas de trêve olympique pour les LLMs
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask p...
2024-08-01
48 min
Big Data Hebdo
Episode 202 : Data Architecture avec Frédéric Brossard de Dcube
Retrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/ ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. Le générique a été composé et réalisé par Max
2024-07-27
1h 12
Big Data Hebdo
Episode 201 : Snowflake Summit 24 - part 2 ML et Generative AI
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...
2024-07-16
56 min
Big Data Hebdo
Episode 200 : Snowflake Summit 24 part 1 Data-Engineering
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...
2024-07-09
55 min
Big Data Hebdo
Episode 199 : Databricks Data & AI Summit 2024
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...
2024-07-02
1h 07
Big Data Hebdo
Episode 198 : IA Gen et Anssi
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-06-25
33 min
Big Data Hebdo
Episode 197 : GLADIA avec Jean-Louis Queguiner
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-06-11
1h 19
Big Data Hebdo
Episode 196 : python, duckdb, etc...
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-06-04
35 min
Big Data Hebdo
Episode 195 : DBT avec Florian Eiden
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-28
1h 13
Big Data Hebdo
Episode 194 : Self Service Data - Tristan Mayer - CastorDoc
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-21
56 min
Big Data Hebdo
Episode 193 : Microsoft Fabric avec Marie Aubert
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-14
1h 06
Big Data Hebdo
Episode 192 : DuckDB et autres avec Christophe Blefari
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-10
1h 10
Big Data Hebdo
Episode 191 : Popsink avec Benjamin Djidi
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-04-29
1h 02
Big Data Hebdo
Episode 190 : Databricks DBRX avec Quentin Ambard
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...
2024-04-22
50 min
Big Data Hebdo
Episode 189 : la compta du futur et autres news
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...
2024-04-08
59 min
Big Data Hebdo
Episode 188 : Data-Ops avec Matthieu Rousseau
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...
2024-03-29
50 min
Big Data Hebdo
Episode 187 : La data chez Nickel avec Paul Marcombes
2024-03-20
58 min
Big Data Hebdo
Episode 186 : plus jQuery que Terraform
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...
2024-03-09
1h 06
Big Data Hebdo
Episode 185 : C'est génial jusqu'au moment ou c'est plus génial
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda* IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1...
2024-03-01
53 min
Big Data Hebdo
Episode 184 : Pour une poignée de dollars
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
2024-02-15
58 min
Big Data Hebdo
Episode 183 : Promptologues de l'infra
### Promptologues* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt...
2024-02-09
35 min
Big Data Hebdo
Episode 182 : Zuck fabric une AGI avec des data-contracts
Shownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/
2024-02-03
47 min
Big Data Hebdo
Episode 181 : Le Maestro du GPT Store
Shownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/
2024-01-26
52 min
Big Data Hebdo
Episode 180 : Quelques news pour démarrer 2024
https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/
2024-01-17
44 min
Big Data Hebdo
Episode 179 : 2023 en revue et quelques prédictions pour 2024
2023-12-29
1h 28
Big Data Hebdo
Episode 178 : Q Re-invent tout AWS
2023-12-12
1h 06
Big Data Hebdo
Episode 177 : Je ne sais pas
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY* LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex### data-engineering* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00...
2023-12-05
51 min
Big Data Hebdo
Episode 176 : Il n'y a pas que les modèles qui hallucinent
### LLM fever* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résultats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter* Microsoft optimise Azure avec ses propres puces d’IA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/### Data-eng* data load tool (dlt) -> https://dlthub.com/* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/da...
2023-11-27
51 min
Big Data Hebdo
Episode 175 : Evaluateur de LLM
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/### Tools* Pijul -> https://pijul.org/* Pijul la théorie -> https://p...
2023-11-20
42 min
Big Data Hebdo
Episode 174 : OpenAI devday 2023
* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih### LLM fever* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation* Quand la boîte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/### Data-Science* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden...
2023-11-13
49 min
Big Data Hebdo
Episode 173 : L'arbre qui cache la forêt aléatoire
### Data-science* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41### Tools* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a* Fast, Git Friendly API Client -> https://www.usebruno.com
2023-10-30
48 min
Big Data Hebdo
Episode 172 : ça souffle toujours sur les LLMs
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08* K...
2023-10-23
46 min
Big Data Hebdo
Episode 171 : ChatGPT on lui parle poliment
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/
2023-10-16
44 min
Big Data Hebdo
Episode 170 : le Vent tourne pour les LLM
### LLM* Mistral 7B is here! -> https://mistral.ai/product/* What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard* How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web* Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565* The iliad Group is making strategic investments in Artificial Intelligence -> https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_AI_260923_Eng_462ff3265c.pdf### Cloud and DBs* Announcing DuckDB 0.9.0 -> https...
2023-10-10
44 min
Big Data Hebdo
Episode 169 : LLM est un consultant comme les autres
* Modern Data Stack Meetup : Streamlit + Kestra### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center* LLMs in Action: A Practical Guide for Software Architects and Developers -> https://www.linkedin.com/pulse/llms-action-practical-guide-software-architects-s%C3%A9bastien-brasseur?utm_source=share&utm_medium=member_ios&utm_campaign=share_via* Lantern — a PostgreSQL vector database for building AI applications -> https://docs.lantern.dev/blog/2023/09/13/hello-world### Data science* Announcing Py...
2023-09-19
1h 11
Big Data Hebdo
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 2/2)
Encore une fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### Sponsors...
2023-07-24
42 min
Big Data Hebdo
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 1/2)
Encore un fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette...
2023-07-15
1h 11
Big Data Hebdo
Episode 165 : Generative duck phone number
### Apéro* Voxxed Days Luxembourg ->* Numéros pour œuvres audiovisuelles -> https://www.arcep.fr/uploads/tx_gsavis/21-0532.pdf### ML* Gladia -> http://app.gladia.io/* Microsoft Orca 13B -> https://intelligence-artificielle.developpez.com/actu/345575/Microsoft-AI-presente-Orca-un-modele-a-13-milliards-de-parametres-qui-apprend-a-imiter-le-processus-de-raisonnement-des-grands-modeles-fondamentaux-ses-performances-egalent-celles-de-ChatGPT/* Image Joint Embedding Predictive Architecture -> Cette nouvelle IA de Meta serait capable de raisonner comme un humain (clubic.com)* Grounding et RAG -> Grounding LLMs - Microsoft Community Hub* Ask your own data -> https://methodidacte.org/2023/06/ajoutez-vos-donnees-a-chatgpt/### DB* Announcing MotherDuck -> https://motherduck.com/blog/ann...
2023-07-08
59 min
Big Data Hebdo
Episode 157 : ML avec OVH Cloud
Cette semaine on parle de ML avec OVH CloudComment OVH Cloud étoffe sa gamme deservice pour répondre aux challenges du ML dans le Cloud.AI Machine Learning @ OVHhttps://www.ovhcloud.com/fr/public-cloud/ai-machine-learning/Workshop écrit par Bastien pour travailler avec DBT sur OVH Cloudhttps://dbt-postgresql-metabase-workshop.pages.dev/ Invités :Elea Petton@eleapettonhttps://www.linkedin.com/in/elea-petton/Bastien Verdebout@BastienOvhhttps://www.linkedin.com/in/bastienverdebout/Equipe :Jérôme : @jxerome et Zee...
2023-03-30
1h 21
Big Data Hebdo
Episode 155 : Bilan et prédictions de début d'année (en retard)
OrateursAlexander : @alexanderdejaJérôme : @jxerome et ZeeneaNicolas: @nsteinmetz, CerenIT, Paris Time Series MeeupVincent : @vhe74, Affini-Tech et DatataskPaul : @paulpetonSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blo...
2023-03-11
1h 13
Big Data Hebdo
Episode 148 : Trino avec Victor Coustenoble
On reçoit cette dans cet épisode Victor Coustenoble pour nous parler de Trino.Rebranding PrestoSQL as Trino https://trino.io/blog/2020/12/27/announcing-trino.htmlHappy tenth birthday Trino!https://trino.io/blog/2022/08/08/trino-tenth-birthday.htmlTrino's tenth birthday celebration recaphttps://trino.io/blog/2022/09/12/tenth-birthday-celebration-recap.htmlA decade of query engine innovationhttps://trino.io/blog/2022/08/04/decade-innovation.htmlOrateursVictor : @victorcousteAlexander : @alexanderdejaVincent : @vhe74, Affini-Tech et DatataskJérôme : @jxerome et ZeeneaSponsorsCette publication est sponsorisée par A...
2022-09-22
1h 15
Big Data Hebdo
Episode 138 : Les gentils Cloud, la CNIL et F***DB
### La rubrique de l'indien* CVE-2021-44521 – Exploiting Apache Cassandra User-Defined Functions for Remote Code Execution -> https://jfrog.com/blog/cve-2021-44521-exploiting-apache-cassandra-user-defined-functions-for-remote-code-execution/### Cloud* AWS devriendrait-il gentil? -> https://www.elastic.co/blog/elastic-and-amazon-reach-agreement-on-trademark-infringement-lawsuit* AWS devriendrait-il gentil? -> https://venturebeat.com/2022/03/15/mongodb-and-aws-go-deep-to-help-customers-move-to-the-cloud/### Cloud Native* Kubernetes is complex because you want complex things -> https://home.robusta.dev/blog/kubernetes-is-complex-because-you-want-complex-things/* Programming languages: Go just received its biggest update ever -> https://www.zdnet.com/article/programming-languages-go-just-received-its-biggest-update-ever/* Introducing the Next Generation of K8ssandra! -> https://k8ssandra.io/blog/announcements/release/in...
2022-04-29
1h 01
Big Data Hebdo
Episode 137 : Cloud native intermittent developer
### Apero* A short history of the O’Reilly animals https://trkit.io/s/BDHEP137JWbM ### La rubrique de l'indien* The Apache Software Foundation Announces Open Source data orchestration platform Apache® Hop™ as a Top-Level Project https://trkit.io/s/BDHEP137wV2V ### Cloud Native* Clever Operator: The best of Kubernetes and Clever Cloud https://trkit.io/s/BDHEP137KKhZ * A Kubernetes Documentary Shares Google’s Open Source Story https://trkit.io/s/BDHEP137Wa5e ### Data-Gouv* open-metadata Open Standard for Metadata https://trkit.io/s/BDHEP13...
2022-03-25
52 min
Big Data Hebdo
Episode 135 : La Data dans Kubernetes avec Jérôme Petazzoni
Un épisode thématique enregistré le 07/01/2022 avec Jérome Petazzoni et Julien Laurenceau. Nous faisons le point sur la gestion de la data dans Kubernetes.Shownotes complètes sur : https://trkit.io/s/BDHEP135
2022-02-22
2h 03
Big Data Hebdo
Episode 134 : Merry X-Mas les coquinous !
Episode 134 : Merry X-Mas les coquinous !Un épisode de fin d'année et de news enregistré le 22/12/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP134
2021-12-23
1h 13
Big Data Hebdo
Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?
Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?Un épisode de news enregistré le 26/11/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP132
2021-12-10
1h 25
Big Data Hebdo
Episode 131 : big data à 230 kb/s
Episode 131 : big data à 230 kb/sPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 12/11/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP131
2021-12-03
1h 47
Big Data Hebdo
Episode 130 : Du DevSecOps administrativement souverain
Episode 130 : Du DevSecOps administrativement souverainPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 15/10/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP130
2021-11-22
1h 56
Big Data Hebdo
Episode 129 : Tant qu'il IA du SQL
Un épisode de news enregistré le 01/10/21 par Vincent Heuschling, Jérôme Mainaud, et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP129
2021-10-31
1h 24
Big Data Hebdo
Episode 128 : Infinidash 4.0
Un épisode de news enregistré le 17/09/21 par Vincent Heuschling, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP128
2021-09-24
1h 26
Big Data Hebdo
Episode 124 : Ultra bleu ou vert, c'est selon
Un épisode de news enregistré le 18/06/21 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP124
2021-07-02
1h 42
Big Data Hebdo
Episode 123 : Data+AI Summit avec Quentin Ambard
Data+AI Summit avec Quentin Ambard de DatabricksEnregistré le 4/6/2021 par Quentin Ambard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP123
2021-06-23
1h 08
Big Data Hebdo
Episode 122 : Le défi de la data dans le monde de la voile
Le défi de la data dans le monde de la voileEnregistré le 26/03/2021 par Olivier Douillard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP122
2021-06-11
1h 23
Big Data Hebdo
Episode 121 : Le défi de la data chez les experts comptables
Le défi de la data chez les experts comptablesEnregistré le12/03/2021 par Fabrice Heuvrard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP121
2021-05-31
1h 16
Big Data Hebdo
Episode 120 : 50 ans de FTP et toujours pas à la retraite
50 ans de FTP et toujours pas à la retraiteEnregistré le 07/05/2021 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP120
2021-05-16
1h 55
Big Data Hebdo
Episode 119 - Le Cloud Native Developper fait-il autre chose que du Kubernetes ?
Cloud Native Developper !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérôme Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP119
2021-04-16
1h 45
Big Data Hebdo
Episode 117 : AWS avec Sébastien Stormacq
L'offre AWS avec les annonces "data" de Re-Invent 2020 par Sébastien StormacqEnregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP117
2021-02-07
1h 51
Big Data Hebdo
Episode 116 : Powerpoint la bdd du futur
Powerpoint la base de données du futur !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP116
2021-01-19
1h 44
Big Data Hebdo
Episode 115 : CentOS est mort, vive CentOS
CentOS est mort, vive CentOS !Enregistré le 18/12/2020 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaudet Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP115
2021-01-15
1h 36
Big Data Hebdo
Episode 114 : Bientôt un abonnement pour écouter BigData Hebdo ?
Bientôt un abonnement pour écouter BigData Hebdo ?Episode de News enregistré le 4/12/2020 par Nicolas Steinmetz, Jérôme Mainaud, Alexander Dejanovski, et Vincent Heuschling Shownotes complètes sur : https://trkit.io/s/BDHEP114
2020-12-31
1h 46
Big Data Hebdo
Episode 113 : Data Catalog et Data Discovery
Un épisode thématique sur le data catalog, la data discovery et la gouvernance des données, enregistré le 20/11/20 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud, Sandrine Bernaud de Zeenea, et Sylvain L.Shownotes complètes sur : https://trkit.io/s/BDHEP113
2020-12-27
1h 35
Big Data Hebdo
Episode 111 : L'AI à 60 dollars
L'AI à 60 dollarsEpisode de News enregistré le 23/10/2020 par Alexander Dejanovski, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP111
2020-11-28
1h 39
Big Data Hebdo
Episode 110 : Du SQL à toutes les sauces
Du SQL à toutes les saucesEpisode de News enregistré le 9/10/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP110
2020-10-12
1h 39
Big Data Hebdo
Episode 109 : Un bras ça coute cher ...
Un bras ça coute cher, mais pas autant qu'un flocon....Episode de News enregistré le 25/9/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP109
2020-10-11
1h 39
Big Data Hebdo
Episode 108 : Azure Synapse
Azure synapse AnalyticsEnregistré le 11 septembre 2020 avec Fabien Adato et Paul Peton , Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP10!
2020-09-13
1h 39
Big Data Hebdo
Episode 107 : 100 millions sinon rien
Quelques news de rentréeEnregistré le septembre 2020 avec Alexander Dejanovski, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP107a
2020-09-07
1h 36
Big Data Hebdo
Episode 106 : Hadoop et Cloudera, hier, aujourd'hui et demain
Quelques news pour l'étéEnregistré le 24 Juillet 2020 avec Denis Fraval, Laurent Edel, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP106
2020-08-18
1h 36
Big Data Hebdo
Episode 105 : summer news
Quelques news pour l'étéEnregistré le 10 Juillet 2020 par Vincent Heuschling , Jérôme Mainaud, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP105
2020-08-14
1h 18
Big Data Hebdo
Episode 101 : soit 5 en binaire
Shownotes complètes sur : https://trkit.io/s/BDHEP101 Affini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...
2020-06-21
1h 19
Big Data Hebdo
Episode 100 : Anniversaire avec la communauté
Shownotes complètes sur : https://trkit.io/s/BDHEP100 Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...
2020-06-04
3h 09
Big Data Hebdo
Episode 99 : Apache Pulsar et Kafka on Pulsar
On parle de Apache Pulsar et Kafka on Pulsar avec nos invitésShownotes complètes sur : https://trkit.io/s/BDHEP99Steven : https://twitter.com/GwinizDuPierre : https://twitter.com/PierreZQuentin : https://twitter.com/waxzceVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plate...
2020-05-06
1h 19
Big Data Hebdo
Episode 98 : Datastax, le retour à la communauté ?
Shownotes complètes sur : https://trkit.io/s/BDHEP98Cedrick Lunven et Alexander Dejanovski nous parlent du rachat de the last pickle par Datastax* The Last Pickle Joining DataStax https://trkit.io/s/BDH-HecICs* Des Workshop online tous les mercredis (celui la jeudi)https://trkit.io/s/BDHBFNBJeCA* Posez vos questions à la communautéhttps://trkit.io/s/BDHdqLRTZpH* FF4J le projet OSS de Cedrick https://trkit.io/s/BDHUImVCBxr### Meetups et conférences Bigdatapero en stand by et probablement en r...
2020-04-06
1h 19
Big Data Hebdo
Episode 95 : Le futur de la data avec Paul Peton
Un episode sur la base d'articles écrits par Paul Peton : "De quoi le futur de la data sera-t-il fait ? (sous un intervalle de prévision assez large…)”https://link.medium.com/JJ9afimvw4“Choisir un environnement technique pour la Data Science” https://link.medium.com/0Dv7uSsvw4L'instant confiture : les réseaux de neuronesLOVELY ANALYTICS - Réseaux de neurones comment ça marche ?https://lovelyanalytics.com/2017/06/14/reseaux-de-neurones-comment-ca-marche/Une vidéo de Youen de Saagie allant jusqu’au Deep Learning : https://www.youtube.com/watch?v=6XqhY29uzlM...
2020-03-02
1h 35
Big Data Hebdo
Episode 94 : Data Lake House
THE DATA LAKEHOUSE ?https://www.moderndataanalytics.com/post/the-data-lakehouseWhat Is a Data Lakehouse?https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.htmlDBLog: A Generic Change-Data-Capture Frameworkhttps://medium.com/netflix-techblog/dblog-a-generic-change-data-capture-framework-69351fb9099bMySQL is the DBMS of the Year 2019https://db-engines.com/en/blog_post/83Keystone Real-time Stream Processing Platformhttps://netflixtechblog.com/keystone-real-time-stream-processing-platform-a3ee651812aInternals of Google Cloud Spannerhttps://thedataguy.in/internals-of-google-cloud-spanner/La CNIL publie un guide RGPD pour les développeurshttps://w...
2020-02-26
1h 00
Big Data Hebdo
Episode 92 : T'as lu le Codd ?
Better Drivers for Cassandrahttps://www.datastax.com/blog/2020/01/better-drivers-for-cassandraInfluxDB 2.0 beta 1https://www.influxdata.com/blog/influxdb-2-0-open-source-beta-released/InfluxDB 2.0 beta 2https://www.influxdata.com/blog/release-announcement-influxdb-2-0-0-beta-2/When to Say No to Machine Learninghttps://medium.com/semi-random-thoughts/a-product-managers-guide-to-when-to-say-no-to-machine-learning-and-when-to-say-yes-1cd6d7884c7Using Prophet To Forecast Weather Data and Detect Anomalieshttps://towardsdatascience.com/using-prophet-to-forecast-weather-data-8e4fc6b8f8e5Kalman Filters for Software Engineershttps://towardsdatascience.com/kalman-filters-for-software-engineers-3d2a05dee465Pas mal de...
2020-02-02
1h 24
Big Data Hebdo
Episode 91 : C'est en rachetant qu'on devient un géant
-----------------------------Quelques newsGoogle May Buy Salesforce To Help Bolster Its Cloud Businesshttps://www.webpronews.com/google-may-buy-salesforce/The Apache Software Foundation Bloghttps://blogs.apache.org/foundation/entry/the-apache-news-round-up151 - Apache Libcloud 2.7.0 released http://libcloud.apache.org/ - Apache Libcloud 2.8.0 released https://libcloud.apache.org/ - Apache TVM (Incubating) 0.6.0 released https://tvm.apache.org/ - Apache Druid (incubating) 0.16.1 released http://druid.apache.org/ - Apache HBase 2.1.8 released http://hbase.apache.org/ - Apache Kafka 2.4.0 released http://kafka.apache.org/ - Apache Hivemall (Incubating) 0.6.0 released http://hivemall.incubator...
2020-01-14
1h 27
Big Data Hebdo
Episode 90 : La FAQ de NOEL 2019
LA FAQ de NOEL (Décembre 2019)Dans cet épisode on répond aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comA...
2019-12-23
1h 20
Big Data Hebdo
Episode 87 : Un elephant peut en cacher un autre
Episode 87 pgday Paris 2020https://2020.pgday.paris/----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://bit.ly/Invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoAdrien : https://twitter.com/Adrien_nayratNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et Cerenit( http://affini-tech.com https://twi...
2019-11-13
1h 19
Big Data Hebdo
Episode 83 : Le Z il n'y a rien au dessus
Episode 83--------------------Cobol, 60 ans, toujours aux commandeshttps://www.lemondeinformatique.fr/actualites/lire-cobol-60-ans-toujours-aux-commandes-76385.htmlAvec le z15, IBM renforce la protection sur les donnéeshttps://www.lemondeinformatique.fr/actualites/lire-avec-le-z15-ibm-renforce-la-protection-sur-les-donnees-76420.htmlFiche technique du z15https://www.ibm.com/downloads/cas/NN7GBPJ1IBM Introduces Next-Gen Z Mainframe: The z15; Wider Cores, More Cores, More Cache, Still 5.2 GHzhttps://fuse.wikichip.org/news/2659/ibm-introduces-next-gen-z-mainframe-the-z15-wider-cores-more-cores-more-cache-still-5-2-ghz/New in Docker Hub: Personal Access Tokenshttps://blog.docker.com/2019/09/docker-hub-new-personal-access-tokens/Procella: u...
2019-09-24
1h 07
Big Data Hebdo
Episode 79 : du neuf et du moins neuf
Time seriesRedisTimeSeries Module Adds Time Series Database Features to Redishttps://www.infoq.com/news/2019/07/redis-time-series-moduleRedisTimeSeries GA – Making the 4th dimension truly immersivehttps://redislabs.com/blog/redistimeseries-ga-making-4th-dimension-truly-immersive/How Hulu Uses InfluxDB and Kafka to Scale to Over 1 Million Metrics a Secondhttps://medium.com/hulu-tech-blog/how-hulu-uses-influxdb-and-kafka-to-scale-to-over-1-million-metrics-a-second-1721476aaff5CassandraStreaming Cassandra at WePay - Part 1https://wecode.wepay.com/posts/streaming-cassandra-at-wepay-part-1Streaming Cassandra at WePay - Part 2https://wecode.wepay.com/posts/streaming-cassandra-at-wepay-part-2Cassandra Exports as a...
2019-07-29
1h 28
Big Data Hebdo
Episode 77 : Elassandra, mémoires géantes, et bases de données
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur et de plein d'autres choseshttp://www.elassandra.io/https://twitter.com/elassandraioPour en savoir plus c'est dans l'Episode 46Se préparer à la NVRAM : Intel 3D Xpoint débarque bientôthttps://www.zdnet.fr/actualites/se-preparer-a-la-nvram-intel-3d-xpoint-debarque-bientot-39882653.htmTiDB 2.1.7https://jepsen.io/analyses/tidb-2.1.7mattm/sql-style-guidehttps://github.com/mattm/sql-style-guide2019 Open Source Database Report: Top Databases, Public Cloud vs. On-Premise, Polyglot Persistencehttps://scaleg...
2019-07-02
1h 40
Big Data Hebdo
Episode 76 : L'As des Aces
Looker to Join Google Cloudhttps://looker.com/blog/looker-to-join-google-cloudRachat de Tableau par Salesforcehttps://techcrunch.com/2019/06/10/salesforce-is-buying-data-visualization-company-tableau-for-15-7b-in-all-stock-deal/https://realmoney.thestreet.com/investing/technology/salesforce-deal-for-tableau-takeaways-14986369Cassandra Meetup (canal historique)https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/261869169/Storm 2.0.0 Releasedhttps://storm.apache.org/2019/05/30/storm200-released.htmlWhy We’re Relicensing CockroachDBhttps://www.cockroachlabs.com/blog/oss-relicensing-cockroachdb/OVH avance d’un pied fermehttps://www.ovh.com/fr/blog/ovh-avance-dun-pied-ferme/Predictive CPU isolation of containers at Netflix...
2019-06-22
1h 29
Big Data Hebdo
Episode 74 : Le soldat wsl2 sauvera t’il la cogip ?
Snips Open Sources Tracthttps://medium.com/snips-ai/snips-open-sources-tract-cdc50f437ef2AI Weekly: Google’s ethics council barely lasted a week, but there’s a thin silver lininghttps://venturebeat.com/2019/04/05/ai-weekly-googles-ethics-council-barely-lasted-a-week-but-theres-a-thin-silver-lining/Google ouvre un centre mondial dédié à la vie privée en Europehttp://www.lefigaro.fr/secteur/high-tech/google-ouvre-un-centre-mondial-dedie-a-la-vie-privee-en-europe-20190514Thoughtworks Technology Radar vol 20 - Avril 2019https://www.thoughtworks.com/radarData Lake + Data Warehouse in One Box using Snowflakehttps://blog.persistent.com/index.php/2019/05/07/data-lake-dwh-in-one-box-using-snowflake/Announcing WSL 2https://devblogs.microsof...
2019-05-18
1h 04
Big Data Hebdo
Episode 73 : Si t'as pas le mode sombre t'as raté ta vie
Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Elastic Stack 7.0.0 releasedhttps://www.elastic.co/blog/elastic-stack-7-0-0-releasedKafka : Migrer un consommateur vers Streams et Connecthttp://blog.ippon.fr/2019/04/29/rex-migrer-un-consommateur-vers-streams-et-connect/The PipelineDB Team Joins Confluenthttps://www.confluent.io/blog/pipelinedb-team-joins-confluenthttps://www.pipelinedb.com/blog/pipelinedb-is-joining-confluentIntroduction à Apache Pulsarhttps://speakerdeck.com/bbonnin/introduction-a-apache-pulsarFor Open Source, It's All About GitHub Nowhttps://www.wired.co...
2019-05-04
1h 24
Big Data Hebdo
Episode 68 : KaaS la baraque
Cloud et open sourceLa bataille entre vrai open source et faux open source s'intensifiehttps://www.zdnet.fr/actualites/la-bataille-entre-vrai-open-source-et-faux-open-source-s-intensifie-39881007.htmLes fournisseurs cloud, bourreaux de l'open source ?https://www.zdnet.fr/actualites/les-fournisseurs-cloud-bourreaux-de-l-open-source-39881337.htmLCC 205 - Interview analyse de l'industrie avec Sacha Laboureyhttps://lescastcodeurs.com/2019/02/21/lcc-205-interview-analyse-de-l-industrie-avec-sacha-labourey/KubernetesManaged Kubernetes Servicehttps://www.ovh.com/fr/kubernetes/Kubernetes as a Service : OVH dévoile sa nouvelle arme en version finalehttps://www.journaldunet.com/solutions/cloud-computing/1421810-kubernetes-as-a-service-ovh-devoile-son-offre-en-version-finale/Google Cloud Services Platform d...
2019-03-04
1h 17
Big Data Hebdo
Episode 66 : Papa est de retour
KafkaConfluent Raises a $125M Series D Funding Roundhttps://www.confluent.io/blog/confluent-raises-a-125m-series-d-funding-roundDatabasesInfluxDB 2.0 Alpha Release and the Road Aheadhttps://www.influxdata.com/blog/influxdb-2-0-alpha-release-and-the-road-ahead/Introducing the Next-Generation InfluxDB 2.0 Platformhttps://www.influxdata.com/blog/introducing-the-next-generation-influxdb-2-0-platform/Microsoft Acquires Citus Data: Creating the World’s Best Postgres Experience Togetherhttps://www.citusdata.com/blog/2019/01/24/microsoft-acquires-citus-data/Elastic Stack 6.6.0 Releasedhttps://www.elastic.co/blog/elastic-stack-6-6-0-released14 Things To Do When Setting Up a New Cassandra Clusterhttp://thelastpickle.com/blog/2019/01/30/ne...
2019-02-04
1h 19
Big Data Hebdo
Episode 65 : La famille s'agrandit
DatabaseThe Guardian’s Migration from MongoDB to PostgreSQL on Amazon RDShttps://www.infoq.com/news/2019/01/guardian-mongodb-postgresqlSQL is Dead, Hail to Fluxhttp://bit.ly/2CrzERXInfrastructureBlog: APIServer dry-run and kubectl diffhttps://kubernetes.io/blog/2019/01/14/apiserver-dry-run-and-kubectl-diff/Infrastructure as real codehttps://gianarb.it/blog/infrastructure-as-real-codeDatascienceAn Introduction to the Machine Learning Platform as a Servicehttp://bit.ly/2AHpv2tWhy Dask ?http://docs.dask.org/en/latest/why.htmlRe...
2019-01-21
1h 10