Look for any podcast host, guest or anyone
Showing episodes and shows of

Alexander Dejanovski

Shows

Big Data HebdoBig Data Hebdoepisode 213 : Timeseries et SQL avec Warp10🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io).📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake !Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-213-timeseries-et-sql-avec-warp10/2025-02-211h 00Big Data HebdoBig Data HebdoEpisode 212 Analytique en Cloud HybrideLe BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science.Florian partage son expérience sur les défis de migration, de FinOps, et l'intégration des IA génératives. Une discussion passionnante sur la modernisation des infrastructures et l'impact des nouvelles technologies dans les grandes organisations.Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode...2025-02-031h 18Big Data HebdoBig Data HebdoEpisode 211 - MotherduckLe BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne.Show notes sur http://bigdatahebdo.com/podcast/episode-211-motherduck/2025-01-2355 minBig Data HebdoBig Data HebdoEpisode 210 - Prédictions 2025Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr (https://cerenit.fr) et retrouvez-nous...2025-01-1744 minBig Data HebdoBig Data HebdoEpisode 209 : FoundationDB, brique élémentaire de Materia KV feat @MACIDans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ?  C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-209-foundationdb-labrique-elementaire-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...2024-11-221h 15Big Data HebdoBig Data HebdoEpisode 208 : Aux sources de FoundationDB feat @MACIDans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ?  C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-208-aux-sources-de-foundationdb-feat-maci-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...2024-11-1558 minBig Data HebdoBig Data HebdoEpisode 207 : Live au Salon Data & IA de Nantes 2024Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public.à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrwLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube2024-11-0135 minBig Data HebdoBig Data HebdoEpisode 206 : portes ouvertes chez OpenAILes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-206-portes-ouvertes-chez-openai/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube2024-10-1850 minBig Data HebdoBig Data HebdoEpisode 205 : Kestra avec Ludovic DehonLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-DehonRetrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube2024-09-271h 14Big Data HebdoBig Data HebdoEpisode 204 : 70 milliards de réflectionsLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube  ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer v...2024-09-1448 minBig Data HebdoBig Data HebdoEpisode 203 : Pas de trêve olympique pour les LLMsLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask p...2024-08-0148 minBig Data HebdoBig Data HebdoEpisode 202 : Data Architecture avec Frédéric Brossard de DcubeRetrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/  ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. Le générique a été composé et réalisé par Max2024-07-271h 12Big Data HebdoBig Data HebdoEpisode 201 : Snowflake Summit 24 - part 2 ML et Generative AIRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...2024-07-1656 minBig Data HebdoBig Data HebdoEpisode 200 : Snowflake Summit 24 part 1 Data-EngineeringRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...2024-07-0955 minBig Data HebdoBig Data HebdoEpisode 199 : Databricks Data & AI Summit 2024Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...2024-07-021h 07Big Data HebdoBig Data HebdoEpisode 198 : IA Gen et AnssiRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-06-2533 minBig Data HebdoBig Data HebdoEpisode 197 : GLADIA avec Jean-Louis QueguinerRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-06-111h 19Big Data HebdoBig Data HebdoEpisode 196 : python, duckdb, etc...Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-06-0435 minBig Data HebdoBig Data HebdoEpisode 195 : DBT avec Florian EidenRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-281h 13Big Data HebdoBig Data HebdoEpisode 194 : Self Service Data - Tristan Mayer - CastorDocRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-2156 minBig Data HebdoBig Data HebdoEpisode 193 : Microsoft Fabric avec Marie AubertRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-141h 06Big Data HebdoBig Data HebdoEpisode 192 : DuckDB et autres avec Christophe BlefariRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-05-101h 10Big Data HebdoBig Data HebdoEpisode 191 : Popsink avec Benjamin DjidiRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...2024-04-291h 02Big Data HebdoBig Data HebdoEpisode 190 : Databricks DBRX avec Quentin AmbardRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...2024-04-2250 minBig Data HebdoBig Data HebdoEpisode 189 : la compta du futur et autres newsRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...2024-04-0859 minBig Data HebdoBig Data HebdoEpisode 188 : Data-Ops avec Matthieu RousseauRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...2024-03-2950 minBig Data HebdoBig Data HebdoEpisode 187 : La data chez Nickel avec Paul Marcombes2024-03-2058 minBig Data HebdoBig Data HebdoEpisode 186 : plus jQuery que TerraformRetrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...2024-03-091h 06Big Data HebdoBig Data HebdoEpisode 185 : C'est génial jusqu'au moment ou c'est plus génial* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda* IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1...2024-03-0153 minBig Data HebdoBig Data HebdoEpisode 184 : Pour une poignée de dollarsShownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/2024-02-1558 minBig Data HebdoBig Data HebdoEpisode 183 : Promptologues de l'infra### Promptologues* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt...2024-02-0935 minBig Data HebdoBig Data HebdoEpisode 182 : Zuck fabric une AGI avec des data-contractsShownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/2024-02-0347 minBig Data HebdoBig Data HebdoEpisode 181 : Le Maestro du GPT StoreShownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/2024-01-2652 minBig Data HebdoBig Data HebdoEpisode 180 : Quelques news pour démarrer 2024https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/2024-01-1744 minBig Data HebdoBig Data HebdoEpisode 179 : 2023 en revue et quelques prédictions pour 20242023-12-291h 28Big Data HebdoBig Data HebdoEpisode 178 : Q Re-invent tout AWS2023-12-121h 06Big Data HebdoBig Data HebdoEpisode 177 : Je ne sais pas### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY* LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex### data-engineering* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00...2023-12-0551 minBig Data HebdoBig Data HebdoEpisode 176 : Il n'y a pas que les modèles qui hallucinent### LLM fever* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résultats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter* Microsoft optimise Azure avec ses propres puces d’IA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/### Data-eng* data load tool (dlt) -> https://dlthub.com/* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/da...2023-11-2751 minBig Data HebdoBig Data HebdoEpisode 175 : Evaluateur de LLM* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/### Tools* Pijul -> https://pijul.org/* Pijul la théorie -> https://p...2023-11-2042 minBig Data HebdoBig Data HebdoEpisode 174 : OpenAI devday 2023* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih### LLM fever* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation* Quand la boîte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/### Data-Science* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden...2023-11-1349 minBig Data HebdoBig Data HebdoEpisode 173 : L'arbre qui cache la forêt aléatoire### Data-science* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41### Tools* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a* Fast, Git Friendly API Client -> https://www.usebruno.com2023-10-3048 minBig Data HebdoBig Data HebdoEpisode 172 : ça souffle toujours sur les LLMs### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08* K...2023-10-2346 minBig Data HebdoBig Data HebdoEpisode 171 : ChatGPT on lui parle polimentLinkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/2023-10-1644 minBig Data HebdoBig Data HebdoEpisode 170 : le Vent tourne pour les LLM### LLM* Mistral 7B is here! -> https://mistral.ai/product/* What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard* How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web* Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565* The iliad Group is making strategic investments in Artificial Intelligence -> https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_AI_260923_Eng_462ff3265c.pdf### Cloud and DBs* Announcing DuckDB 0.9.0 -> https...2023-10-1044 minBig Data HebdoBig Data HebdoEpisode 169 : LLM est un consultant comme les autres* Modern Data Stack Meetup : Streamlit + Kestra### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center* LLMs in Action: A Practical Guide for Software Architects and Developers -> https://www.linkedin.com/pulse/llms-action-practical-guide-software-architects-s%C3%A9bastien-brasseur?utm_source=share&utm_medium=member_ios&utm_campaign=share_via* Lantern — a PostgreSQL vector database for building AI applications -> https://docs.lantern.dev/blog/2023/09/13/hello-world### Data science* Announcing Py...2023-09-191h 11Big Data HebdoBig Data HebdoEpisode 168 : Si t'as pas ta vectordb en 2023...### Tools* Ruff -> https://beta.ruff.rs/docs/### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix* Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/### Database* Awesome DuckDB -> https://github.com/davidgasquez/awesome-duckdb### GenAI* RAG vs Finetuning — Which Is the Best Tool to Boost Your LLM Application? -> https://towardsdatascience.com/rag-vs-finetuning-which-is-the-best-tool-to-boost-your-llm-application-94654b1eaba7* Best pra...2023-09-051h 17Big Data HebdoBig Data HebdoEpisode 167 : SnowflakeDans cet épisode nous accueillons Ilyes Mehaddi de Snowflake pour nous parler de Snowflake Data Cloud et des annonces du SummitRetrouvez Ilyes sur le slack du bigdatahebdo ou alors sur son blogData Cloud World Tour : 5 octobre à Paris Recap du Summit 2023 par secteurs d’activités Recap des annonces du Summit 2023 SponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.2023-07-271h 39Big Data HebdoBig Data HebdoEpisode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 2/2)Encore une fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### Sponsors...2023-07-2442 minBig Data HebdoBig Data HebdoEpisode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 1/2)Encore un fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette...2023-07-151h 11Big Data HebdoBig Data HebdoEpisode 165 : Generative duck phone number### Apéro* Voxxed Days Luxembourg ->* Numéros pour œuvres audiovisuelles -> https://www.arcep.fr/uploads/tx_gsavis/21-0532.pdf### ML* Gladia -> http://app.gladia.io/* Microsoft Orca 13B -> https://intelligence-artificielle.developpez.com/actu/345575/Microsoft-AI-presente-Orca-un-modele-a-13-milliards-de-parametres-qui-apprend-a-imiter-le-processus-de-raisonnement-des-grands-modeles-fondamentaux-ses-performances-egalent-celles-de-ChatGPT/* Image Joint Embedding Predictive Architecture -> Cette nouvelle IA de Meta serait capable de raisonner comme un humain (clubic.com)* Grounding et RAG -> Grounding LLMs - Microsoft Community Hub* Ask your own data -> https://methodidacte.org/2023/06/ajoutez-vos-donnees-a-chatgpt/### DB* Announcing MotherDuck -> https://motherduck.com/blog/ann...2023-07-0859 minBig Data HebdoBig Data HebdoEpisode 164 : Que fabric santa Nadella ?Retour sur la MS Build 2023 avec Charles-Henri Sauget MVP Microsofthttps://learn.microsoft.com/en-us/fabric/get-started/microsoft-fabric-overviewSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [contact@cerenit.fr](mailto:contact@cerenit.fr) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Exp...2023-06-291h 22Big Data HebdoBig Data HebdoEpisode 163 : On fait de l'informatique pour ne pas avoir à parler aux gens* Google I/O '23 in under 10 minutes -> https://www.youtube.com/watch?v=hleLlcHwQLM&list=TLGGCy91ScdjTPYyNjA1MjAyMw&index=2* Google "We Have No Moat, And Neither Does OpenAI" -> https://www.semianalysis.com/p/google-we-have-no-moat-and-neither* Google demande à ses chercheurs d'arrêter de partager leurs travaux -> https://www.nextinpact.com/lebrief/71669/google-demande-a-ses-chercheurs-darreter-partager-leurs-travaux* Multilingual speech to text -> https://ai.facebook.com/blog/multilingual-model-speech-recognition/* Tableau Jumps Into Generative AI with Tableau GPT -> https://www.datanami.com/2023/05/09/tableau-jumps-into-generative-ai-with-tableau-gpt/* Sklearn Meets Large Language Models -> https://github.com/iryna-kondr/scikit-llmSponsors2023-06-0156 minBig Data HebdoBig Data HebdoEpisode 162 : WARP10 3.0 avec Mathias HerbertsWarp 10 sors dans sa version 3, Mathias Herberts est avec nous pour en parlerQuelques blogs de la société Senx sur Warp 10 : https://blog.senx.io/tag/warp-10-3-x/Mathias était déjà venu nous parler de Warp 10 dans l'épisode 72 (https://bigdatahebdo.com/podcast/episode-72-warp-10-avec-mathias-herberts/)Pour en savoir plus sur Foundation DB il y a l'épisode 93 (https://bigdatahebdo.com/podcast/episode-93-foundation-db/)Suivez Mathias Herberts sur Twitter : [@herberts](https://twitter.com/herberts)2023-05-241h 38Big Data HebdoBig Data HebdoEpisode 161 : La semaine dernière a été une année importante### Apéro* Nouveau métier dans l'IA: C3PO -> https://podcast.ausha.co/le-podcast-des-eclaireurs/c3po-ce-metier-qui-va-sauver-les-journalistes### GenAI* Microsoft JARVIS / HuggingGPT -> https://analyticsindiamag.com/microsoft-jarvis-is-the-path-towards-agi/* New ways to manage your data in ChatGPT -> https://openai.com/blog/new-ways-to-manage-your-data-in-chatgpt### Vector DB* What is a Vector Database? -> What is a Vector Database? - Zilliz Vector database learn* Chroma the AI-native open-source embedding database -> https://www.trychroma.com### Cloud* Augmentation Bigquery la suite -> ### Databases* MySQL Locking Reads -> ht...2023-05-091h 15Big Data HebdoBig Data HebdoEpisode 160 : BigdataHebdo Live à DevoxxFR 2023Merci à l'équipe DevoxxFR de nous avoir accueilli pour cet enregistrementMerci à nos auditeurs qui nous ont rejoins, pour leur contributions et leur bonne humeur.2023-05-0148 minBig Data HebdoBig Data HebdoEpisode 155 : Bilan et prédictions de début d'année (en retard)OrateursAlexander : @alexanderdejaJérôme : @jxerome et ZeeneaNicolas: @nsteinmetz, CerenIT, Paris Time Series MeeupVincent : @vhe74, Affini-Tech et DatataskPaul : @paulpetonSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blo...2023-03-111h 13Big Data HebdoBig Data HebdoEpisode 148 : Trino avec Victor CoustenobleOn reçoit cette dans cet épisode Victor Coustenoble pour nous parler de Trino.Rebranding PrestoSQL as Trino https://trino.io/blog/2020/12/27/announcing-trino.htmlHappy tenth birthday Trino!https://trino.io/blog/2022/08/08/trino-tenth-birthday.htmlTrino's tenth birthday celebration recaphttps://trino.io/blog/2022/09/12/tenth-birthday-celebration-recap.htmlA decade of query engine innovationhttps://trino.io/blog/2022/08/04/decade-innovation.htmlOrateursVictor : @victorcousteAlexander : @alexanderdejaVincent : @vhe74, Affini-Tech et DatataskJérôme : @jxerome et ZeeneaSponsorsCette publication est sponsorisée par A...2022-09-221h 15Big Data HebdoBig Data HebdoEpisode 138 : Les gentils Cloud, la CNIL et F***DB### La rubrique de l'indien* CVE-2021-44521 – Exploiting Apache Cassandra User-Defined Functions for Remote Code Execution -> https://jfrog.com/blog/cve-2021-44521-exploiting-apache-cassandra-user-defined-functions-for-remote-code-execution/### Cloud* AWS devriendrait-il gentil? -> https://www.elastic.co/blog/elastic-and-amazon-reach-agreement-on-trademark-infringement-lawsuit* AWS devriendrait-il gentil? -> https://venturebeat.com/2022/03/15/mongodb-and-aws-go-deep-to-help-customers-move-to-the-cloud/### Cloud Native* Kubernetes is complex because you want complex things -> https://home.robusta.dev/blog/kubernetes-is-complex-because-you-want-complex-things/* Programming languages: Go just received its biggest update ever -> https://www.zdnet.com/article/programming-languages-go-just-received-its-biggest-update-ever/* Introducing the Next Generation of K8ssandra! -> https://k8ssandra.io/blog/announcements/release/in...2022-04-291h 01Big Data HebdoBig Data HebdoEpisode 137 : Cloud native intermittent developer### Apero* A short history of the O’Reilly animals https://trkit.io/s/BDHEP137JWbM ### La rubrique de l'indien* The Apache Software Foundation Announces Open Source data orchestration platform Apache® Hop™ as a Top-Level Project https://trkit.io/s/BDHEP137wV2V ### Cloud Native* Clever Operator: The best of Kubernetes and Clever Cloud https://trkit.io/s/BDHEP137KKhZ * A Kubernetes Documentary Shares Google’s Open Source Story https://trkit.io/s/BDHEP137Wa5e ### Data-Gouv* open-metadata Open Standard for Metadata https://trkit.io/s/BDHEP13...2022-03-2552 minBig Data HebdoBig Data HebdoEpisode 133 : IaaS qu'il faut et plus encore en serverlessEpisode 133 : IaaS qu'il faut et plus encore en serverlessUn épisode de news enregistré le 10/12/2021.avec Alexander Dejanovski, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP1332021-12-171h 22Big Data HebdoBig Data HebdoEpisode 131 : big data à 230 kb/sEpisode 131 : big data à 230 kb/sPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 12/11/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP1312021-12-031h 47Big Data HebdoBig Data HebdoEpisode 130 : Du DevSecOps administrativement souverainEpisode 130 : Du DevSecOps administrativement souverainPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 15/10/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP1302021-11-221h 56Big Data HebdoBig Data HebdoEpisode 128 : Infinidash 4.0Un épisode de news enregistré le 17/09/21 par Vincent Heuschling, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1282021-09-241h 26Big Data HebdoBig Data HebdoEpisode 124 : Ultra bleu ou vert, c'est selonUn épisode de news enregistré le 18/06/21 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1242021-07-021h 42Big Data HebdoBig Data HebdoEpisode 123 : Data+AI Summit avec Quentin AmbardData+AI Summit avec Quentin Ambard de DatabricksEnregistré le 4/6/2021 par Quentin Ambard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1232021-06-231h 08Big Data HebdoBig Data HebdoEpisode 122 : Le défi de la data dans le monde de la voileLe défi de la data dans le monde de la voileEnregistré le 26/03/2021 par Olivier Douillard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1222021-06-111h 23Big Data HebdoBig Data HebdoEpisode 119 - Le Cloud Native Developper fait-il autre chose que du Kubernetes ?Cloud Native Developper !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérôme Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1192021-04-161h 45Big Data HebdoBig Data HebdoEpisode 118 : Excel, à fond la fonctionExcel, à fond la fonction !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1182021-02-181h 55Big Data HebdoBig Data HebdoEpisode 117 : AWS avec Sébastien StormacqL'offre AWS avec les annonces "data" de Re-Invent 2020 par Sébastien StormacqEnregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1172021-02-071h 51Big Data HebdoBig Data HebdoEpisode 116 : Powerpoint la bdd du futurPowerpoint la base de données du futur !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1162021-01-191h 44Big Data HebdoBig Data HebdoEpisode 115 : CentOS est mort, vive CentOSCentOS est mort, vive CentOS !Enregistré le 18/12/2020 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaudet Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1152021-01-151h 36Big Data HebdoBig Data HebdoEpisode 114 : Bientôt un abonnement pour écouter BigData Hebdo ?Bientôt un abonnement pour écouter BigData Hebdo ?Episode de News enregistré le 4/12/2020 par Nicolas Steinmetz, Jérôme Mainaud, Alexander Dejanovski, et Vincent Heuschling Shownotes complètes sur : https://trkit.io/s/BDHEP1142020-12-311h 46Big Data HebdoBig Data HebdoEpisode 111 : L'AI à 60 dollarsL'AI à 60 dollarsEpisode de News enregistré le 23/10/2020 par Alexander Dejanovski, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP1112020-11-281h 39Big Data HebdoBig Data HebdoEpisode 109 : Un bras ça coute cher ...Un bras ça coute cher, mais pas autant qu'un flocon....Episode de News enregistré le 25/9/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1092020-10-111h 39Big Data HebdoBig Data HebdoEpisode 107 : 100 millions sinon rienQuelques news de rentréeEnregistré le septembre 2020 avec Alexander Dejanovski, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP107a2020-09-071h 36Big Data HebdoBig Data HebdoEpisode 105 : summer newsQuelques news pour l'étéEnregistré le 10 Juillet 2020 par Vincent Heuschling , Jérôme Mainaud, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP1052020-08-141h 18Big Data HebdoBig Data HebdoEpisode 101 : soit 5 en binaireShownotes complètes sur : https://trkit.io/s/BDHEP101 Affini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...2020-06-211h 19Big Data HebdoBig Data HebdoEpisode 100 : Anniversaire avec la communautéShownotes complètes sur : https://trkit.io/s/BDHEP100 Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...2020-06-043h 09Big Data HebdoBig Data HebdoEpisode 98 : Datastax, le retour à la communauté ?Shownotes complètes sur : https://trkit.io/s/BDHEP98Cedrick Lunven et Alexander Dejanovski nous parlent du rachat de the last pickle par Datastax* The Last Pickle Joining DataStax https://trkit.io/s/BDH-HecICs* Des Workshop online tous les mercredis (celui la jeudi)https://trkit.io/s/BDHBFNBJeCA* Posez vos questions à la communautéhttps://trkit.io/s/BDHdqLRTZpH* FF4J le projet OSS de Cedrick https://trkit.io/s/BDHUImVCBxr### Meetups et conférences Bigdatapero en stand by et probablement en r...2020-04-061h 19Big Data HebdoBig Data HebdoEpisode 91 : C'est en rachetant qu'on devient un géant-----------------------------Quelques newsGoogle May Buy Salesforce To Help Bolster Its Cloud Businesshttps://www.webpronews.com/google-may-buy-salesforce/The Apache Software Foundation Bloghttps://blogs.apache.org/foundation/entry/the-apache-news-round-up151 - Apache Libcloud 2.7.0 released http://libcloud.apache.org/ - Apache Libcloud 2.8.0 released https://libcloud.apache.org/ - Apache TVM (Incubating) 0.6.0 released https://tvm.apache.org/ - Apache Druid (incubating) 0.16.1 released http://druid.apache.org/ - Apache HBase 2.1.8 released http://hbase.apache.org/ - Apache Kafka 2.4.0 released http://kafka.apache.org/ - Apache Hivemall (Incubating) 0.6.0 released http://hivemall.incubator...2020-01-141h 27Big Data HebdoBig Data HebdoEpisode 90 : La FAQ de NOEL 2019LA FAQ de NOEL (Décembre 2019)Dans cet épisode on répond aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comA...2019-12-231h 20Big Data HebdoBig Data HebdoEpisode 80 : Ne met pas ta bigdata dans un SANHadoopHewlett Packard Enterprise fait l’acquisition de MapRhttps://www.zdnet.fr/actualites/hewlett-packard-enterprise-fait-l-acquisition-de-mapr-39888799.htmZookeeper 3.5https://zookeeper.apache.org/doc/r3.5.5/releasenotes.htmlhttps://zookeeper.apache.org/releases.html"DatabasePresto Unlimitedhttp://prestodb.github.io/blog/2019/08/05/presto-unlimited-mpp-database-at-scaleWarp10 2.1https://blog.senx.io/warp-10-version-2-1/La big data sur du virtualiséhttps://bigdatahebdo.slack.com/archives/C18M2REM7/p1565118704017000CouchDB 3 & 4https://mail-archives.apache.org/mod_mbox/couchdb-dev/201901.mbox/%3C8EBBB4D1-C555-49DB...2019-08-161h 36Big Data HebdoBig Data HebdoEpisode 77 : Elassandra, mémoires géantes, et bases de donnéesNous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur et de plein d'autres choseshttp://www.elassandra.io/https://twitter.com/elassandraioPour en savoir plus c'est dans l'Episode 46Se préparer à la NVRAM : Intel 3D Xpoint débarque bientôthttps://www.zdnet.fr/actualites/se-preparer-a-la-nvram-intel-3d-xpoint-debarque-bientot-39882653.htmTiDB 2.1.7https://jepsen.io/analyses/tidb-2.1.7mattm/sql-style-guidehttps://github.com/mattm/sql-style-guide2019 Open Source Database Report: Top Databases, Public Cloud vs. On-Premise, Polyglot Persistencehttps://scaleg...2019-07-021h 40Big Data HebdoBig Data HebdoEpisode 76 : L'As des AcesLooker to Join Google Cloudhttps://looker.com/blog/looker-to-join-google-cloudRachat de Tableau par Salesforcehttps://techcrunch.com/2019/06/10/salesforce-is-buying-data-visualization-company-tableau-for-15-7b-in-all-stock-deal/https://realmoney.thestreet.com/investing/technology/salesforce-deal-for-tableau-takeaways-14986369Cassandra Meetup (canal historique)https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/261869169/Storm 2.0.0 Releasedhttps://storm.apache.org/2019/05/30/storm200-released.htmlWhy We’re Relicensing CockroachDBhttps://www.cockroachlabs.com/blog/oss-relicensing-cockroachdb/OVH avance d’un pied fermehttps://www.ovh.com/fr/blog/ovh-avance-dun-pied-ferme/Predictive CPU isolation of containers at Netflix...2019-06-221h 29Big Data HebdoBig Data HebdoEpisode 74 : Le soldat wsl2 sauvera t’il la cogip ?Snips Open Sources Tracthttps://medium.com/snips-ai/snips-open-sources-tract-cdc50f437ef2AI Weekly: Google’s ethics council barely lasted a week, but there’s a thin silver lininghttps://venturebeat.com/2019/04/05/ai-weekly-googles-ethics-council-barely-lasted-a-week-but-theres-a-thin-silver-lining/Google ouvre un centre mondial dédié à la vie privée en Europehttp://www.lefigaro.fr/secteur/high-tech/google-ouvre-un-centre-mondial-dedie-a-la-vie-privee-en-europe-20190514Thoughtworks Technology Radar vol 20 - Avril 2019https://www.thoughtworks.com/radarData Lake + Data Warehouse in One Box using Snowflakehttps://blog.persistent.com/index.php/2019/05/07/data-lake-dwh-in-one-box-using-snowflake/Announcing WSL 2https://devblogs.microsof...2019-05-181h 04Big Data HebdoBig Data HebdoEpisode 73 : Si t'as pas le mode sombre t'as raté ta vieVenez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Elastic Stack 7.0.0 releasedhttps://www.elastic.co/blog/elastic-stack-7-0-0-releasedKafka : Migrer un consommateur vers Streams et Connecthttp://blog.ippon.fr/2019/04/29/rex-migrer-un-consommateur-vers-streams-et-connect/The PipelineDB Team Joins Confluenthttps://www.confluent.io/blog/pipelinedb-team-joins-confluenthttps://www.pipelinedb.com/blog/pipelinedb-is-joining-confluentIntroduction à Apache Pulsarhttps://speakerdeck.com/bbonnin/introduction-a-apache-pulsarFor Open Source, It's All About GitHub Nowhttps://www.wired.co...2019-05-041h 24Big Data HebdoBig Data HebdoEpisode 66 : Papa est de retourKafkaConfluent Raises a $125M Series D Funding Roundhttps://www.confluent.io/blog/confluent-raises-a-125m-series-d-funding-roundDatabasesInfluxDB 2.0 Alpha Release and the Road Aheadhttps://www.influxdata.com/blog/influxdb-2-0-alpha-release-and-the-road-ahead/Introducing the Next-Generation InfluxDB 2.0 Platformhttps://www.influxdata.com/blog/introducing-the-next-generation-influxdb-2-0-platform/Microsoft Acquires Citus Data: Creating the World’s Best Postgres Experience Togetherhttps://www.citusdata.com/blog/2019/01/24/microsoft-acquires-citus-data/Elastic Stack 6.6.0 Releasedhttps://www.elastic.co/blog/elastic-stack-6-6-0-released14 Things To Do When Setting Up a New Cassandra Clusterhttp://thelastpickle.com/blog/2019/01/30/ne...2019-02-041h 19Big Data HebdoBig Data HebdoEpisode 60 : J'peux pas j'ai Nouvelle Zelande-----------------------------HadoopCloudera and Hortonworks merger means Hadoop’s influence is declininghttps://venturebeat.com/2018/10/06/cloudera-and-hortonworks-merger-means-hadoops-influence-is-declining/-----------------------------DatabaseSnowflakehttps://www.frenchweb.fr/cloud-450-millions-de-dollars-pour-la-licorne-franco-americaine-snowflake/338077NewSQL database systems are failing to guarantee consistency, and I blame Spannerhttp://dbmsmusings.blogspot.com/2018/09/newsql-database-systems-are-failing-to.htmlGoogle Cloud Spanner: the good, the bad and the uglyhttps://medium.com/@LightspeedHQ/google-cloud-spanner-the-good-the-bad-and-the-ugly-5795f37a7684Microsoft updates its planet-scale Cosmos DB database servicehttps://techcrunch.com/2018/09/24/microsoft-updates-its-planet-scale-cosmos-db-database-service/?guccounter=1Spotify cstarhttp://thelastpickle.com/blog/2018/10/01/introduction-to-cstar.ht...2018-10-251h 13Big Data HebdoBig Data HebdoEpisode 58 : Data-Astro-ScienceDatabaseFoundationDB, a very interesting NoSQL database owned by Apple, is now an open-source projecthttps://www.geekwire.com/2018/foundationdb-interesting-nosql-database-owned-apple-now-open-source-project/https://www.foundationdb.org/blog/foundationdb-is-open-source/Anna: A KVS for any scalehttps://blog.acolyer.org/2018/03/27/anna-a-kvs-for-any-scale/DataStax Enterprise 6.0https://docs.datastax.com/en/dse/6.0/dse-admin/datastax_enterprise/newFeatures.htmlMonitorer l’inconnu, 1000 * 100 series par jour (Quentin Adam DevoxxFR)https://www.youtube.com/watch?v=74LI4yqcI0g-----------------------------Data (astro) ScienceLes prochaines découvertes d’astronomie sont probablement cachées dans les vieill...2018-06-2453 minBig Data HebdoBig Data HebdoEpisode 57 : C'est comme prévoir que t'auras pas de succès !Troll of the week : Patrick McFadinhttps://twitter.com/PatrickMcFadin/status/984467651752841219?s=20"Most everyone doing something at scale is probably using #cassandra" Oh. Except for @EpicGames and @FortniteGame They went with MongoDB.Here's the postmortem: https://www.epicgames.com/fortnite/en-US/news/postmortem-of-service-outage-at-3-4m-ccuAerospike 3.99.0.3https://jepsen.io/analyses/aerospike-3-99-0-3Effectively-once semantics in Apache Pulsarhttps://streaml.io/blog/pulsar-effectively-once/Introducing Pulsar Functionshttps://streaml.io/blog/pulsar-functions/Leaving the Nest: Heron donated to Apache Software Foundationhttps://blog.twitter...2018-04-191h 27Big Data HebdoBig Data HebdoEpisode 54 : CockroachDB avec Julien AnguenotJulien Anguenot d'Iland Cloud - https://www.iland.com/ - nous parle de CockroachDB - https://www.cockroachlabs.com/ - le clone open source de Cloud Spanner - https://cloud.google.com/spanner/) qu'il a mis en production en complément d'Apache Cassandra, pour des besoins internes.Julien et Alexander participeront en tant que speakers au prochain Paris Cassandra Meetup le 31 Janvier 2018 chez Deezer : https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/246902065/On a ouvert un Slack : bigdatahebdo.slack.cominvitation par DM @bigdatahebdo ou sur contact@bigdatahebdo.comLisez le blog D'affini-Techh...2018-01-221h 13Big Data HebdoBig Data HebdoEpisode 53 : 2017 reviewMetrics : 10500 écoutes en 2017 (moyenne à 617 écoutes)17 episodes en 2017 (vs 14 en 2016, et 10 en 2015)Top 2017 : Episode 38 : SQL is back (Spanner / CockroachDB)Episode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBEpisode 43 : DevoxxFr, Kafka, AWS, Microsoft CosmosDB, AMLEpisode 36 : AI ApocalypseTop overall : Episode 35 : Microsoft U-SQL avec Michel CaradecEpisode 28 : Quelques news de rentréeEpisode 38 : SQL is backEpisode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBLes mots les plus cités dans les show notes : Apache25Kafka25Googl...2018-01-131h 02Big Data HebdoBig Data HebdoEpisode 52 : Cosmos speaks CassandraReaper 1.0 Has Been Released!http://thelastpickle.com/blog/2017/11/14/reaper-10-announcement.htmlDear Cassandra Developers, welcome to Azure #CosmosDB!https://azure.microsoft.com/en-us/blog/dear-cassandra-developers-welcome-to-azure-cosmosdb/https://venturebeat.com/2017/11/15/microsoft-updates-cosmos-db-with-cassandra-support-better-availability-guarantees/Introducing Azure Databrickshttps://databricks.com/blog/2017/11/15/introducing-azure-databricks.html?utm_content=63154906&utm_medium=social&utm_source=twitterGoogle Cloud Spanner goes multi-regionhttp://www.zdnet.com/article/google-cloud-spanner-goes-multi-region/Transactions in Apache Kafkahttps://www.confluent.io/blog/transactions-apache-kafka/KSQL Developer Preview november updatehttps://www.confluent.io/blog/november-update-ksql-developer-preview-available/Looking Ahead to...2017-12-151h 12Big Data HebdoBig Data HebdoEpisode 51 : Apache Beam avec Jean-Baptiste Onofréhttp://beam.incubator.apache.org/Vous pouvez retouver Jean-Baptiste :http://blog.nanthrax.net/https://github.com/jbonofrehttps://twitter.com/jbonofre https://www.linkedin.com/in/jean-baptiste-onofr%C3%A9-a0739317Lisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com2017-11-181h 09Big Data HebdoBig Data HebdoEpisode 48 : no views ?Cassandra : Proposal to retroactively mark materialized views experimentalhttps://lists.apache.org/thread.html/d81a61da48e1b872d7599df4edfa8e244d34cbd591a18539f724796f@%3Cdev.cassandra.apache.org%3ECassandra pluggable storage enginehttps://lists.apache.org/thread.html/0540e793ec58eb97d8afe294635279d16e0191f9b613ad3edd710181@%3Cdev.cassandra.apache.org%3Ecouchbasehttps://www.couchbase.com/products/data-platformGoogle Cloud Dataprep - Data Handling Made Easierhttps://medium.com/google-cloud/google-cloud-dataprep-data-handling-made-easier-79d7c35fbbe7et l’épisode que nous avions enregistré sur...2017-10-1038 minBig Data HebdoBig Data HebdoEpisode 46 : ElassandraNous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur. http://www.elassandra.io/https://twitter.com/elassandraioLe github du projethttps://github.com/strapdata/elassandraLa société Strapdata http://www.strapdata.comLe talk du C* Summit 2016 : "Elassandra: Elasticsearch as C* Secondary Index"https://www.youtube.com/watch?v=0WuLZTvA3YMet les slides associés : https://fr.slideshare.net/DataStax/elassandra-elasticsearch-as-a-cassandra-secondary-index-rmi-trouville-vincent-royer-independent-c-summit-2016Instaclustr propose Elassandrahttp://www.marketwired.com/press-release/instaclustr-first-to-offer-managed-service-for-elassandra-and-kibana-2217532.htm2017-09-041h 12Big Data HebdoBig Data HebdoEpisode 39 : Quelques News, Kafka, Hoodie, Google Next, ScillaDB, IA, GDPRConfluent raises $50M to continue growing commercial arm of Apache Kafkahttps://techcrunch.com/2017/03/07/confluent-raises-50m-to-continue-growing-commercial-arm-of-apache-kafka/How Kafka Redefined Data Processing for the Streaming Agehttps://www.datanami.com/2017/03/07/kafka-redefined-data-processing-streaming-age/Hoodie: Uber Engineering’s Incremental Processing Framework on Hadoophttps://eng.uber.com/hoodie/Analysis: It’s Amazon Web Services’ world – Google Cloud is just living in ithttp://siliconangle.com/blog/2017/03/08/analysis-amazon-web-services-world-google-cloud-just-living/Welcome Kaggle to Google Cloudhttps://cloudplatform.googleblog.com/2017/03/welcome-Kaggle-to-Google-Cloud.htmlGoogle Next 17https://blog.google/topics/google-cloud/100-announcements-google-cloud-next-17/Google C...2017-03-251h 18Big Data HebdoBig Data HebdoEpisode 36 : AI ApocalypsePour ce premier épisode de 2017, un gros focus sur l'IA et ses enjeux :The Great A.I. Awakeninghttp://mobile.nytimes.com/2016/12/14/magazine/the-great-ai-awakening.htmlUne I.A. remplace 34 employés d’une assurance au Japonhttp://www.numerama.com/tech/221747-une-i-a-remplace-34-employes-dune-assurance-au-japon.htmlLemonade Sets New World Record https://medium.com/@dschreiber/lemonade-sets-new-world-record-706ef8674110#.ze3xl0y97Washington s’inquiète des conséquences de l’IA sur le monde du travailhttp://www.numerama.com/politique/219002-washington-sinquiete-des-consequences-de-lia-sur-le-monde-du-travail.html3 000 véhicules autonomes remplaceraient tous les taxis de New Yorkhttp://www...2017-01-161h 17Big Data HebdoBig Data HebdoEpisode 34 : Serverless MonsterAmazon goes all in on AI and Big Data at AWS:Reinvent 2016http://www.techrepublic.com/article/amazon-goes-all-in-on-ai-and-big-data-at-aws-reinvent-2016/AWS EC2 Instances Updateshttps://aws.amazon.com/fr/blogs/aws/ec2-instance-type-update-t2-r4-f1-elastic-gpus-i3-c5Custom silicon, 9PB storage boxes, and 25Gb Ethernet – just another day in AWS hardwarehttp://www.theregister.co.uk/2016/11/30/aws_hardware/Amazon Athenahttps://aws.amazon.com/fr/athena/https://aws.amazon.com/fr/athena/pricing/https://prestodb.io/Run IoT applications seamlessly across the AWS cloud and local deviceshttps://aws.am...2016-12-0257 minBig Data HebdoBig Data HebdoEpisode 33 : des news venues du Cloud...Datastax acquires DataScale and announces Datastax Managed Cloudhttp://www.datastax.com/2016/11/announcing-datastax-managed-cloudMicrosoft's data announcements, and what they meanhttp://www.zdnet.com/article/microsofts-data-announcements-and-what-they-mean/Announcing GPUs for Google Cloud Platform https://cloudplatform.googleblog.com/2016/11/announcing-GPUs-for-Google-Cloud-Platform.htmlRetour sur le Spark Summit Europe 2016http://blog.ippon.fr/2016/11/08/retour-sur-le-spark-summit-europe-2016/https://www.youtube.com/user/TheApacheSpark/playlistsApache Spark: Config Cheatsheethttp://c2fo.io/c2fo/spark/aws/emr/2016/07/06/apache-spark-config-cheatsheet//Hortonworks comes to the Amazon AWS cloudhttp://www...2016-11-251h 00