podcast
details
.com
Print
Share
Look for any podcast host, guest or anyone
Search
Showing episodes and shows of
Alexander Dejanovski
Shows
Big Data Hebdo
episode 213 : Timeseries et SQL avec Warp10
🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io).📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake !Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-213-timeseries-et-sql-avec-warp10/
2025-02-21
1h 00
Big Data Hebdo
Episode 212 Analytique en Cloud Hybride
Le BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science.Florian partage son expérience sur les défis de migration, de FinOps, et l'intégration des IA génératives. Une discussion passionnante sur la modernisation des infrastructures et l'impact des nouvelles technologies dans les grandes organisations.Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode...
2025-02-03
1h 18
Big Data Hebdo
Episode 211 - Motherduck
Le BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne.Show notes sur http://bigdatahebdo.com/podcast/episode-211-motherduck/
2025-01-23
55 min
Big Data Hebdo
Episode 210 - Prédictions 2025
Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr (https://cerenit.fr) et retrouvez-nous...
2025-01-17
44 min
Big Data Hebdo
Episode 209 : FoundationDB, brique élémentaire de Materia KV feat @MACI
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-209-foundationdb-labrique-elementaire-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...
2024-11-22
1h 15
Big Data Hebdo
Episode 208 : Aux sources de FoundationDB feat @MACI
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-208-aux-sources-de-foundationdb-feat-maci-----------------Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .CerenIT (https://ww...
2024-11-15
58 min
Big Data Hebdo
Episode 207 : Live au Salon Data & IA de Nantes 2024
Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public.à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrwLes shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
2024-11-01
35 min
Big Data Hebdo
Episode 206 : portes ouvertes chez OpenAI
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-206-portes-ouvertes-chez-openai/Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
2024-10-18
50 min
Big Data Hebdo
Episode 205 : Kestra avec Ludovic Dehon
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-DehonRetrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
2024-09-27
1h 14
Big Data Hebdo
Episode 204 : 70 milliards de réflections
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer v...
2024-09-14
48 min
Big Data Hebdo
Episode 203 : Pas de trêve olympique pour les LLMs
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask p...
2024-08-01
48 min
Big Data Hebdo
Episode 202 : Data Architecture avec Frédéric Brossard de Dcube
Retrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/ ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. Le générique a été composé et réalisé par Max
2024-07-27
1h 12
Big Data Hebdo
Episode 201 : Snowflake Summit 24 - part 2 ML et Generative AI
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...
2024-07-16
56 min
Big Data Hebdo
Episode 200 : Snowflake Summit 24 part 1 Data-Engineering
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...
2024-07-09
55 min
Big Data Hebdo
Episode 199 : Databricks Data & AI Summit 2024
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...
2024-07-02
1h 07
Big Data Hebdo
Episode 198 : IA Gen et Anssi
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-06-25
33 min
Big Data Hebdo
Episode 197 : GLADIA avec Jean-Louis Queguiner
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-06-11
1h 19
Big Data Hebdo
Episode 196 : python, duckdb, etc...
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-06-04
35 min
Big Data Hebdo
Episode 195 : DBT avec Florian Eiden
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-28
1h 13
Big Data Hebdo
Episode 194 : Self Service Data - Tristan Mayer - CastorDoc
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-21
56 min
Big Data Hebdo
Episode 193 : Microsoft Fabric avec Marie Aubert
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-14
1h 06
Big Data Hebdo
Episode 192 : DuckDB et autres avec Christophe Blefari
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-05-10
1h 10
Big Data Hebdo
Episode 191 : Popsink avec Benjamin Djidi
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...
2024-04-29
1h 02
Big Data Hebdo
Episode 190 : Databricks DBRX avec Quentin Ambard
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...
2024-04-22
50 min
Big Data Hebdo
Episode 189 : la compta du futur et autres news
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...
2024-04-08
59 min
Big Data Hebdo
Episode 188 : Data-Ops avec Matthieu Rousseau
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...
2024-03-29
50 min
Big Data Hebdo
Episode 187 : La data chez Nickel avec Paul Marcombes
2024-03-20
58 min
Big Data Hebdo
Episode 186 : plus jQuery que Terraform
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...
2024-03-09
1h 06
Big Data Hebdo
Episode 185 : C'est génial jusqu'au moment ou c'est plus génial
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda* IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1...
2024-03-01
53 min
Big Data Hebdo
Episode 184 : Pour une poignée de dollars
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
2024-02-15
58 min
Big Data Hebdo
Episode 183 : Promptologues de l'infra
### Promptologues* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt...
2024-02-09
35 min
Big Data Hebdo
Episode 182 : Zuck fabric une AGI avec des data-contracts
Shownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/
2024-02-03
47 min
Big Data Hebdo
Episode 181 : Le Maestro du GPT Store
Shownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/
2024-01-26
52 min
Big Data Hebdo
Episode 180 : Quelques news pour démarrer 2024
https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/
2024-01-17
44 min
Big Data Hebdo
Episode 179 : 2023 en revue et quelques prédictions pour 2024
2023-12-29
1h 28
Big Data Hebdo
Episode 178 : Q Re-invent tout AWS
2023-12-12
1h 06
Big Data Hebdo
Episode 177 : Je ne sais pas
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY* LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex### data-engineering* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00...
2023-12-05
51 min
Big Data Hebdo
Episode 176 : Il n'y a pas que les modèles qui hallucinent
### LLM fever* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résultats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter* Microsoft optimise Azure avec ses propres puces d’IA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/### Data-eng* data load tool (dlt) -> https://dlthub.com/* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/da...
2023-11-27
51 min
Big Data Hebdo
Episode 175 : Evaluateur de LLM
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/### Tools* Pijul -> https://pijul.org/* Pijul la théorie -> https://p...
2023-11-20
42 min
Big Data Hebdo
Episode 174 : OpenAI devday 2023
* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih### LLM fever* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation* Quand la boîte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/### Data-Science* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden...
2023-11-13
49 min
Big Data Hebdo
Episode 173 : L'arbre qui cache la forêt aléatoire
### Data-science* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41### Tools* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a* Fast, Git Friendly API Client -> https://www.usebruno.com
2023-10-30
48 min
Big Data Hebdo
Episode 172 : ça souffle toujours sur les LLMs
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08* K...
2023-10-23
46 min
Big Data Hebdo
Episode 171 : ChatGPT on lui parle poliment
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/
2023-10-16
44 min
Big Data Hebdo
Episode 170 : le Vent tourne pour les LLM
### LLM* Mistral 7B is here! -> https://mistral.ai/product/* What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard* How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web* Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565* The iliad Group is making strategic investments in Artificial Intelligence -> https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_AI_260923_Eng_462ff3265c.pdf### Cloud and DBs* Announcing DuckDB 0.9.0 -> https...
2023-10-10
44 min
Big Data Hebdo
Episode 169 : LLM est un consultant comme les autres
* Modern Data Stack Meetup : Streamlit + Kestra### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center* LLMs in Action: A Practical Guide for Software Architects and Developers -> https://www.linkedin.com/pulse/llms-action-practical-guide-software-architects-s%C3%A9bastien-brasseur?utm_source=share&utm_medium=member_ios&utm_campaign=share_via* Lantern — a PostgreSQL vector database for building AI applications -> https://docs.lantern.dev/blog/2023/09/13/hello-world### Data science* Announcing Py...
2023-09-19
1h 11
Big Data Hebdo
Episode 168 : Si t'as pas ta vectordb en 2023...
### Tools* Ruff -> https://beta.ruff.rs/docs/### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix* Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/### Database* Awesome DuckDB -> https://github.com/davidgasquez/awesome-duckdb### GenAI* RAG vs Finetuning — Which Is the Best Tool to Boost Your LLM Application? -> https://towardsdatascience.com/rag-vs-finetuning-which-is-the-best-tool-to-boost-your-llm-application-94654b1eaba7* Best pra...
2023-09-05
1h 17
Big Data Hebdo
Episode 167 : Snowflake
Dans cet épisode nous accueillons Ilyes Mehaddi de Snowflake pour nous parler de Snowflake Data Cloud et des annonces du SummitRetrouvez Ilyes sur le slack du bigdatahebdo ou alors sur son blogData Cloud World Tour : 5 octobre à Paris Recap du Summit 2023 par secteurs d’activités Recap des annonces du Summit 2023 SponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.
2023-07-27
1h 39
Big Data Hebdo
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 2/2)
Encore une fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### Sponsors...
2023-07-24
42 min
Big Data Hebdo
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 1/2)
Encore un fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette...
2023-07-15
1h 11
Big Data Hebdo
Episode 165 : Generative duck phone number
### Apéro* Voxxed Days Luxembourg ->* Numéros pour œuvres audiovisuelles -> https://www.arcep.fr/uploads/tx_gsavis/21-0532.pdf### ML* Gladia -> http://app.gladia.io/* Microsoft Orca 13B -> https://intelligence-artificielle.developpez.com/actu/345575/Microsoft-AI-presente-Orca-un-modele-a-13-milliards-de-parametres-qui-apprend-a-imiter-le-processus-de-raisonnement-des-grands-modeles-fondamentaux-ses-performances-egalent-celles-de-ChatGPT/* Image Joint Embedding Predictive Architecture -> Cette nouvelle IA de Meta serait capable de raisonner comme un humain (clubic.com)* Grounding et RAG -> Grounding LLMs - Microsoft Community Hub* Ask your own data -> https://methodidacte.org/2023/06/ajoutez-vos-donnees-a-chatgpt/### DB* Announcing MotherDuck -> https://motherduck.com/blog/ann...
2023-07-08
59 min
Big Data Hebdo
Episode 164 : Que fabric santa Nadella ?
Retour sur la MS Build 2023 avec Charles-Henri Sauget MVP Microsofthttps://learn.microsoft.com/en-us/fabric/get-started/microsoft-fabric-overviewSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [contact@cerenit.fr](mailto:contact@cerenit.fr) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Exp...
2023-06-29
1h 22
Big Data Hebdo
Episode 163 : On fait de l'informatique pour ne pas avoir à parler aux gens
* Google I/O '23 in under 10 minutes -> https://www.youtube.com/watch?v=hleLlcHwQLM&list=TLGGCy91ScdjTPYyNjA1MjAyMw&index=2* Google "We Have No Moat, And Neither Does OpenAI" -> https://www.semianalysis.com/p/google-we-have-no-moat-and-neither* Google demande à ses chercheurs d'arrêter de partager leurs travaux -> https://www.nextinpact.com/lebrief/71669/google-demande-a-ses-chercheurs-darreter-partager-leurs-travaux* Multilingual speech to text -> https://ai.facebook.com/blog/multilingual-model-speech-recognition/* Tableau Jumps Into Generative AI with Tableau GPT -> https://www.datanami.com/2023/05/09/tableau-jumps-into-generative-ai-with-tableau-gpt/* Sklearn Meets Large Language Models -> https://github.com/iryna-kondr/scikit-llmSponsors
2023-06-01
56 min
Big Data Hebdo
Episode 162 : WARP10 3.0 avec Mathias Herberts
Warp 10 sors dans sa version 3, Mathias Herberts est avec nous pour en parlerQuelques blogs de la société Senx sur Warp 10 : https://blog.senx.io/tag/warp-10-3-x/Mathias était déjà venu nous parler de Warp 10 dans l'épisode 72 (https://bigdatahebdo.com/podcast/episode-72-warp-10-avec-mathias-herberts/)Pour en savoir plus sur Foundation DB il y a l'épisode 93 (https://bigdatahebdo.com/podcast/episode-93-foundation-db/)Suivez Mathias Herberts sur Twitter : [@herberts](https://twitter.com/herberts)
2023-05-24
1h 38
Big Data Hebdo
Episode 161 : La semaine dernière a été une année importante
### Apéro* Nouveau métier dans l'IA: C3PO -> https://podcast.ausha.co/le-podcast-des-eclaireurs/c3po-ce-metier-qui-va-sauver-les-journalistes### GenAI* Microsoft JARVIS / HuggingGPT -> https://analyticsindiamag.com/microsoft-jarvis-is-the-path-towards-agi/* New ways to manage your data in ChatGPT -> https://openai.com/blog/new-ways-to-manage-your-data-in-chatgpt### Vector DB* What is a Vector Database? -> What is a Vector Database? - Zilliz Vector database learn* Chroma the AI-native open-source embedding database -> https://www.trychroma.com### Cloud* Augmentation Bigquery la suite -> ### Databases* MySQL Locking Reads -> ht...
2023-05-09
1h 15
Big Data Hebdo
Episode 160 : BigdataHebdo Live à DevoxxFR 2023
Merci à l'équipe DevoxxFR de nous avoir accueilli pour cet enregistrementMerci à nos auditeurs qui nous ont rejoins, pour leur contributions et leur bonne humeur.
2023-05-01
48 min
Big Data Hebdo
Episode 155 : Bilan et prédictions de début d'année (en retard)
OrateursAlexander : @alexanderdejaJérôme : @jxerome et ZeeneaNicolas: @nsteinmetz, CerenIT, Paris Time Series MeeupVincent : @vhe74, Affini-Tech et DatataskPaul : @paulpetonSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blo...
2023-03-11
1h 13
Big Data Hebdo
Episode 148 : Trino avec Victor Coustenoble
On reçoit cette dans cet épisode Victor Coustenoble pour nous parler de Trino.Rebranding PrestoSQL as Trino https://trino.io/blog/2020/12/27/announcing-trino.htmlHappy tenth birthday Trino!https://trino.io/blog/2022/08/08/trino-tenth-birthday.htmlTrino's tenth birthday celebration recaphttps://trino.io/blog/2022/09/12/tenth-birthday-celebration-recap.htmlA decade of query engine innovationhttps://trino.io/blog/2022/08/04/decade-innovation.htmlOrateursVictor : @victorcousteAlexander : @alexanderdejaVincent : @vhe74, Affini-Tech et DatataskJérôme : @jxerome et ZeeneaSponsorsCette publication est sponsorisée par A...
2022-09-22
1h 15
Big Data Hebdo
Episode 138 : Les gentils Cloud, la CNIL et F***DB
### La rubrique de l'indien* CVE-2021-44521 – Exploiting Apache Cassandra User-Defined Functions for Remote Code Execution -> https://jfrog.com/blog/cve-2021-44521-exploiting-apache-cassandra-user-defined-functions-for-remote-code-execution/### Cloud* AWS devriendrait-il gentil? -> https://www.elastic.co/blog/elastic-and-amazon-reach-agreement-on-trademark-infringement-lawsuit* AWS devriendrait-il gentil? -> https://venturebeat.com/2022/03/15/mongodb-and-aws-go-deep-to-help-customers-move-to-the-cloud/### Cloud Native* Kubernetes is complex because you want complex things -> https://home.robusta.dev/blog/kubernetes-is-complex-because-you-want-complex-things/* Programming languages: Go just received its biggest update ever -> https://www.zdnet.com/article/programming-languages-go-just-received-its-biggest-update-ever/* Introducing the Next Generation of K8ssandra! -> https://k8ssandra.io/blog/announcements/release/in...
2022-04-29
1h 01
Big Data Hebdo
Episode 137 : Cloud native intermittent developer
### Apero* A short history of the O’Reilly animals https://trkit.io/s/BDHEP137JWbM ### La rubrique de l'indien* The Apache Software Foundation Announces Open Source data orchestration platform Apache® Hop™ as a Top-Level Project https://trkit.io/s/BDHEP137wV2V ### Cloud Native* Clever Operator: The best of Kubernetes and Clever Cloud https://trkit.io/s/BDHEP137KKhZ * A Kubernetes Documentary Shares Google’s Open Source Story https://trkit.io/s/BDHEP137Wa5e ### Data-Gouv* open-metadata Open Standard for Metadata https://trkit.io/s/BDHEP13...
2022-03-25
52 min
Big Data Hebdo
Episode 133 : IaaS qu'il faut et plus encore en serverless
Episode 133 : IaaS qu'il faut et plus encore en serverlessUn épisode de news enregistré le 10/12/2021.avec Alexander Dejanovski, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP133
2021-12-17
1h 22
Big Data Hebdo
Episode 131 : big data à 230 kb/s
Episode 131 : big data à 230 kb/sPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 12/11/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP131
2021-12-03
1h 47
Big Data Hebdo
Episode 130 : Du DevSecOps administrativement souverain
Episode 130 : Du DevSecOps administrativement souverainPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 15/10/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP130
2021-11-22
1h 56
Big Data Hebdo
Episode 128 : Infinidash 4.0
Un épisode de news enregistré le 17/09/21 par Vincent Heuschling, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP128
2021-09-24
1h 26
Big Data Hebdo
Episode 124 : Ultra bleu ou vert, c'est selon
Un épisode de news enregistré le 18/06/21 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP124
2021-07-02
1h 42
Big Data Hebdo
Episode 123 : Data+AI Summit avec Quentin Ambard
Data+AI Summit avec Quentin Ambard de DatabricksEnregistré le 4/6/2021 par Quentin Ambard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP123
2021-06-23
1h 08
Big Data Hebdo
Episode 122 : Le défi de la data dans le monde de la voile
Le défi de la data dans le monde de la voileEnregistré le 26/03/2021 par Olivier Douillard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP122
2021-06-11
1h 23
Big Data Hebdo
Episode 119 - Le Cloud Native Developper fait-il autre chose que du Kubernetes ?
Cloud Native Developper !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérôme Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP119
2021-04-16
1h 45
Big Data Hebdo
Episode 118 : Excel, à fond la fonction
Excel, à fond la fonction !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP118
2021-02-18
1h 55
Big Data Hebdo
Episode 117 : AWS avec Sébastien Stormacq
L'offre AWS avec les annonces "data" de Re-Invent 2020 par Sébastien StormacqEnregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP117
2021-02-07
1h 51
Big Data Hebdo
Episode 116 : Powerpoint la bdd du futur
Powerpoint la base de données du futur !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP116
2021-01-19
1h 44
Big Data Hebdo
Episode 115 : CentOS est mort, vive CentOS
CentOS est mort, vive CentOS !Enregistré le 18/12/2020 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaudet Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP115
2021-01-15
1h 36
Big Data Hebdo
Episode 114 : Bientôt un abonnement pour écouter BigData Hebdo ?
Bientôt un abonnement pour écouter BigData Hebdo ?Episode de News enregistré le 4/12/2020 par Nicolas Steinmetz, Jérôme Mainaud, Alexander Dejanovski, et Vincent Heuschling Shownotes complètes sur : https://trkit.io/s/BDHEP114
2020-12-31
1h 46
Big Data Hebdo
Episode 111 : L'AI à 60 dollars
L'AI à 60 dollarsEpisode de News enregistré le 23/10/2020 par Alexander Dejanovski, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP111
2020-11-28
1h 39
Big Data Hebdo
Episode 109 : Un bras ça coute cher ...
Un bras ça coute cher, mais pas autant qu'un flocon....Episode de News enregistré le 25/9/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP109
2020-10-11
1h 39
Big Data Hebdo
Episode 107 : 100 millions sinon rien
Quelques news de rentréeEnregistré le septembre 2020 avec Alexander Dejanovski, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP107a
2020-09-07
1h 36
Big Data Hebdo
Episode 105 : summer news
Quelques news pour l'étéEnregistré le 10 Juillet 2020 par Vincent Heuschling , Jérôme Mainaud, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP105
2020-08-14
1h 18
Big Data Hebdo
Episode 101 : soit 5 en binaire
Shownotes complètes sur : https://trkit.io/s/BDHEP101 Affini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...
2020-06-21
1h 19
Big Data Hebdo
Episode 100 : Anniversaire avec la communauté
Shownotes complètes sur : https://trkit.io/s/BDHEP100 Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affin...
2020-06-04
3h 09
Big Data Hebdo
Episode 98 : Datastax, le retour à la communauté ?
Shownotes complètes sur : https://trkit.io/s/BDHEP98Cedrick Lunven et Alexander Dejanovski nous parlent du rachat de the last pickle par Datastax* The Last Pickle Joining DataStax https://trkit.io/s/BDH-HecICs* Des Workshop online tous les mercredis (celui la jeudi)https://trkit.io/s/BDHBFNBJeCA* Posez vos questions à la communautéhttps://trkit.io/s/BDHdqLRTZpH* FF4J le projet OSS de Cedrick https://trkit.io/s/BDHUImVCBxr### Meetups et conférences Bigdatapero en stand by et probablement en r...
2020-04-06
1h 19
Big Data Hebdo
Episode 91 : C'est en rachetant qu'on devient un géant
-----------------------------Quelques newsGoogle May Buy Salesforce To Help Bolster Its Cloud Businesshttps://www.webpronews.com/google-may-buy-salesforce/The Apache Software Foundation Bloghttps://blogs.apache.org/foundation/entry/the-apache-news-round-up151 - Apache Libcloud 2.7.0 released http://libcloud.apache.org/ - Apache Libcloud 2.8.0 released https://libcloud.apache.org/ - Apache TVM (Incubating) 0.6.0 released https://tvm.apache.org/ - Apache Druid (incubating) 0.16.1 released http://druid.apache.org/ - Apache HBase 2.1.8 released http://hbase.apache.org/ - Apache Kafka 2.4.0 released http://kafka.apache.org/ - Apache Hivemall (Incubating) 0.6.0 released http://hivemall.incubator...
2020-01-14
1h 27
Big Data Hebdo
Episode 90 : La FAQ de NOEL 2019
LA FAQ de NOEL (Décembre 2019)Dans cet épisode on répond aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comA...
2019-12-23
1h 20
Big Data Hebdo
Episode 80 : Ne met pas ta bigdata dans un SAN
HadoopHewlett Packard Enterprise fait l’acquisition de MapRhttps://www.zdnet.fr/actualites/hewlett-packard-enterprise-fait-l-acquisition-de-mapr-39888799.htmZookeeper 3.5https://zookeeper.apache.org/doc/r3.5.5/releasenotes.htmlhttps://zookeeper.apache.org/releases.html"DatabasePresto Unlimitedhttp://prestodb.github.io/blog/2019/08/05/presto-unlimited-mpp-database-at-scaleWarp10 2.1https://blog.senx.io/warp-10-version-2-1/La big data sur du virtualiséhttps://bigdatahebdo.slack.com/archives/C18M2REM7/p1565118704017000CouchDB 3 & 4https://mail-archives.apache.org/mod_mbox/couchdb-dev/201901.mbox/%3C8EBBB4D1-C555-49DB...
2019-08-16
1h 36
Big Data Hebdo
Episode 77 : Elassandra, mémoires géantes, et bases de données
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur et de plein d'autres choseshttp://www.elassandra.io/https://twitter.com/elassandraioPour en savoir plus c'est dans l'Episode 46Se préparer à la NVRAM : Intel 3D Xpoint débarque bientôthttps://www.zdnet.fr/actualites/se-preparer-a-la-nvram-intel-3d-xpoint-debarque-bientot-39882653.htmTiDB 2.1.7https://jepsen.io/analyses/tidb-2.1.7mattm/sql-style-guidehttps://github.com/mattm/sql-style-guide2019 Open Source Database Report: Top Databases, Public Cloud vs. On-Premise, Polyglot Persistencehttps://scaleg...
2019-07-02
1h 40
Big Data Hebdo
Episode 76 : L'As des Aces
Looker to Join Google Cloudhttps://looker.com/blog/looker-to-join-google-cloudRachat de Tableau par Salesforcehttps://techcrunch.com/2019/06/10/salesforce-is-buying-data-visualization-company-tableau-for-15-7b-in-all-stock-deal/https://realmoney.thestreet.com/investing/technology/salesforce-deal-for-tableau-takeaways-14986369Cassandra Meetup (canal historique)https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/261869169/Storm 2.0.0 Releasedhttps://storm.apache.org/2019/05/30/storm200-released.htmlWhy We’re Relicensing CockroachDBhttps://www.cockroachlabs.com/blog/oss-relicensing-cockroachdb/OVH avance d’un pied fermehttps://www.ovh.com/fr/blog/ovh-avance-dun-pied-ferme/Predictive CPU isolation of containers at Netflix...
2019-06-22
1h 29
Big Data Hebdo
Episode 74 : Le soldat wsl2 sauvera t’il la cogip ?
Snips Open Sources Tracthttps://medium.com/snips-ai/snips-open-sources-tract-cdc50f437ef2AI Weekly: Google’s ethics council barely lasted a week, but there’s a thin silver lininghttps://venturebeat.com/2019/04/05/ai-weekly-googles-ethics-council-barely-lasted-a-week-but-theres-a-thin-silver-lining/Google ouvre un centre mondial dédié à la vie privée en Europehttp://www.lefigaro.fr/secteur/high-tech/google-ouvre-un-centre-mondial-dedie-a-la-vie-privee-en-europe-20190514Thoughtworks Technology Radar vol 20 - Avril 2019https://www.thoughtworks.com/radarData Lake + Data Warehouse in One Box using Snowflakehttps://blog.persistent.com/index.php/2019/05/07/data-lake-dwh-in-one-box-using-snowflake/Announcing WSL 2https://devblogs.microsof...
2019-05-18
1h 04
Big Data Hebdo
Episode 73 : Si t'as pas le mode sombre t'as raté ta vie
Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Elastic Stack 7.0.0 releasedhttps://www.elastic.co/blog/elastic-stack-7-0-0-releasedKafka : Migrer un consommateur vers Streams et Connecthttp://blog.ippon.fr/2019/04/29/rex-migrer-un-consommateur-vers-streams-et-connect/The PipelineDB Team Joins Confluenthttps://www.confluent.io/blog/pipelinedb-team-joins-confluenthttps://www.pipelinedb.com/blog/pipelinedb-is-joining-confluentIntroduction à Apache Pulsarhttps://speakerdeck.com/bbonnin/introduction-a-apache-pulsarFor Open Source, It's All About GitHub Nowhttps://www.wired.co...
2019-05-04
1h 24
Big Data Hebdo
Episode 66 : Papa est de retour
KafkaConfluent Raises a $125M Series D Funding Roundhttps://www.confluent.io/blog/confluent-raises-a-125m-series-d-funding-roundDatabasesInfluxDB 2.0 Alpha Release and the Road Aheadhttps://www.influxdata.com/blog/influxdb-2-0-alpha-release-and-the-road-ahead/Introducing the Next-Generation InfluxDB 2.0 Platformhttps://www.influxdata.com/blog/introducing-the-next-generation-influxdb-2-0-platform/Microsoft Acquires Citus Data: Creating the World’s Best Postgres Experience Togetherhttps://www.citusdata.com/blog/2019/01/24/microsoft-acquires-citus-data/Elastic Stack 6.6.0 Releasedhttps://www.elastic.co/blog/elastic-stack-6-6-0-released14 Things To Do When Setting Up a New Cassandra Clusterhttp://thelastpickle.com/blog/2019/01/30/ne...
2019-02-04
1h 19
Big Data Hebdo
Episode 60 : J'peux pas j'ai Nouvelle Zelande
-----------------------------HadoopCloudera and Hortonworks merger means Hadoop’s influence is declininghttps://venturebeat.com/2018/10/06/cloudera-and-hortonworks-merger-means-hadoops-influence-is-declining/-----------------------------DatabaseSnowflakehttps://www.frenchweb.fr/cloud-450-millions-de-dollars-pour-la-licorne-franco-americaine-snowflake/338077NewSQL database systems are failing to guarantee consistency, and I blame Spannerhttp://dbmsmusings.blogspot.com/2018/09/newsql-database-systems-are-failing-to.htmlGoogle Cloud Spanner: the good, the bad and the uglyhttps://medium.com/@LightspeedHQ/google-cloud-spanner-the-good-the-bad-and-the-ugly-5795f37a7684Microsoft updates its planet-scale Cosmos DB database servicehttps://techcrunch.com/2018/09/24/microsoft-updates-its-planet-scale-cosmos-db-database-service/?guccounter=1Spotify cstarhttp://thelastpickle.com/blog/2018/10/01/introduction-to-cstar.ht...
2018-10-25
1h 13
Big Data Hebdo
Episode 58 : Data-Astro-Science
DatabaseFoundationDB, a very interesting NoSQL database owned by Apple, is now an open-source projecthttps://www.geekwire.com/2018/foundationdb-interesting-nosql-database-owned-apple-now-open-source-project/https://www.foundationdb.org/blog/foundationdb-is-open-source/Anna: A KVS for any scalehttps://blog.acolyer.org/2018/03/27/anna-a-kvs-for-any-scale/DataStax Enterprise 6.0https://docs.datastax.com/en/dse/6.0/dse-admin/datastax_enterprise/newFeatures.htmlMonitorer l’inconnu, 1000 * 100 series par jour (Quentin Adam DevoxxFR)https://www.youtube.com/watch?v=74LI4yqcI0g-----------------------------Data (astro) ScienceLes prochaines découvertes d’astronomie sont probablement cachées dans les vieill...
2018-06-24
53 min
Big Data Hebdo
Episode 57 : C'est comme prévoir que t'auras pas de succès !
Troll of the week : Patrick McFadinhttps://twitter.com/PatrickMcFadin/status/984467651752841219?s=20"Most everyone doing something at scale is probably using #cassandra" Oh. Except for @EpicGames and @FortniteGame They went with MongoDB.Here's the postmortem: https://www.epicgames.com/fortnite/en-US/news/postmortem-of-service-outage-at-3-4m-ccuAerospike 3.99.0.3https://jepsen.io/analyses/aerospike-3-99-0-3Effectively-once semantics in Apache Pulsarhttps://streaml.io/blog/pulsar-effectively-once/Introducing Pulsar Functionshttps://streaml.io/blog/pulsar-functions/Leaving the Nest: Heron donated to Apache Software Foundationhttps://blog.twitter...
2018-04-19
1h 27
Big Data Hebdo
Episode 54 : CockroachDB avec Julien Anguenot
Julien Anguenot d'Iland Cloud - https://www.iland.com/ - nous parle de CockroachDB - https://www.cockroachlabs.com/ - le clone open source de Cloud Spanner - https://cloud.google.com/spanner/) qu'il a mis en production en complément d'Apache Cassandra, pour des besoins internes.Julien et Alexander participeront en tant que speakers au prochain Paris Cassandra Meetup le 31 Janvier 2018 chez Deezer : https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/246902065/On a ouvert un Slack : bigdatahebdo.slack.cominvitation par DM @bigdatahebdo ou sur contact@bigdatahebdo.comLisez le blog D'affini-Techh...
2018-01-22
1h 13
Big Data Hebdo
Episode 53 : 2017 review
Metrics : 10500 écoutes en 2017 (moyenne à 617 écoutes)17 episodes en 2017 (vs 14 en 2016, et 10 en 2015)Top 2017 : Episode 38 : SQL is back (Spanner / CockroachDB)Episode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBEpisode 43 : DevoxxFr, Kafka, AWS, Microsoft CosmosDB, AMLEpisode 36 : AI ApocalypseTop overall : Episode 35 : Microsoft U-SQL avec Michel CaradecEpisode 28 : Quelques news de rentréeEpisode 38 : SQL is backEpisode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBLes mots les plus cités dans les show notes : Apache25Kafka25Googl...
2018-01-13
1h 02
Big Data Hebdo
Episode 52 : Cosmos speaks Cassandra
Reaper 1.0 Has Been Released!http://thelastpickle.com/blog/2017/11/14/reaper-10-announcement.htmlDear Cassandra Developers, welcome to Azure #CosmosDB!https://azure.microsoft.com/en-us/blog/dear-cassandra-developers-welcome-to-azure-cosmosdb/https://venturebeat.com/2017/11/15/microsoft-updates-cosmos-db-with-cassandra-support-better-availability-guarantees/Introducing Azure Databrickshttps://databricks.com/blog/2017/11/15/introducing-azure-databricks.html?utm_content=63154906&utm_medium=social&utm_source=twitterGoogle Cloud Spanner goes multi-regionhttp://www.zdnet.com/article/google-cloud-spanner-goes-multi-region/Transactions in Apache Kafkahttps://www.confluent.io/blog/transactions-apache-kafka/KSQL Developer Preview november updatehttps://www.confluent.io/blog/november-update-ksql-developer-preview-available/Looking Ahead to...
2017-12-15
1h 12
Big Data Hebdo
Episode 51 : Apache Beam avec Jean-Baptiste Onofré
http://beam.incubator.apache.org/Vous pouvez retouver Jean-Baptiste :http://blog.nanthrax.net/https://github.com/jbonofrehttps://twitter.com/jbonofre https://www.linkedin.com/in/jean-baptiste-onofr%C3%A9-a0739317Lisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com
2017-11-18
1h 09
Big Data Hebdo
Episode 48 : no views ?
Cassandra : Proposal to retroactively mark materialized views experimentalhttps://lists.apache.org/thread.html/d81a61da48e1b872d7599df4edfa8e244d34cbd591a18539f724796f@%3Cdev.cassandra.apache.org%3ECassandra pluggable storage enginehttps://lists.apache.org/thread.html/0540e793ec58eb97d8afe294635279d16e0191f9b613ad3edd710181@%3Cdev.cassandra.apache.org%3Ecouchbasehttps://www.couchbase.com/products/data-platformGoogle Cloud Dataprep - Data Handling Made Easierhttps://medium.com/google-cloud/google-cloud-dataprep-data-handling-made-easier-79d7c35fbbe7et l’épisode que nous avions enregistré sur...
2017-10-10
38 min
Big Data Hebdo
Episode 46 : Elassandra
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur. http://www.elassandra.io/https://twitter.com/elassandraioLe github du projethttps://github.com/strapdata/elassandraLa société Strapdata http://www.strapdata.comLe talk du C* Summit 2016 : "Elassandra: Elasticsearch as C* Secondary Index"https://www.youtube.com/watch?v=0WuLZTvA3YMet les slides associés : https://fr.slideshare.net/DataStax/elassandra-elasticsearch-as-a-cassandra-secondary-index-rmi-trouville-vincent-royer-independent-c-summit-2016Instaclustr propose Elassandrahttp://www.marketwired.com/press-release/instaclustr-first-to-offer-managed-service-for-elassandra-and-kibana-2217532.htm
2017-09-04
1h 12
Big Data Hebdo
Episode 39 : Quelques News, Kafka, Hoodie, Google Next, ScillaDB, IA, GDPR
Confluent raises $50M to continue growing commercial arm of Apache Kafkahttps://techcrunch.com/2017/03/07/confluent-raises-50m-to-continue-growing-commercial-arm-of-apache-kafka/How Kafka Redefined Data Processing for the Streaming Agehttps://www.datanami.com/2017/03/07/kafka-redefined-data-processing-streaming-age/Hoodie: Uber Engineering’s Incremental Processing Framework on Hadoophttps://eng.uber.com/hoodie/Analysis: It’s Amazon Web Services’ world – Google Cloud is just living in ithttp://siliconangle.com/blog/2017/03/08/analysis-amazon-web-services-world-google-cloud-just-living/Welcome Kaggle to Google Cloudhttps://cloudplatform.googleblog.com/2017/03/welcome-Kaggle-to-Google-Cloud.htmlGoogle Next 17https://blog.google/topics/google-cloud/100-announcements-google-cloud-next-17/Google C...
2017-03-25
1h 18
Big Data Hebdo
Episode 36 : AI Apocalypse
Pour ce premier épisode de 2017, un gros focus sur l'IA et ses enjeux :The Great A.I. Awakeninghttp://mobile.nytimes.com/2016/12/14/magazine/the-great-ai-awakening.htmlUne I.A. remplace 34 employés d’une assurance au Japonhttp://www.numerama.com/tech/221747-une-i-a-remplace-34-employes-dune-assurance-au-japon.htmlLemonade Sets New World Record https://medium.com/@dschreiber/lemonade-sets-new-world-record-706ef8674110#.ze3xl0y97Washington s’inquiète des conséquences de l’IA sur le monde du travailhttp://www.numerama.com/politique/219002-washington-sinquiete-des-consequences-de-lia-sur-le-monde-du-travail.html3 000 véhicules autonomes remplaceraient tous les taxis de New Yorkhttp://www...
2017-01-16
1h 17
Big Data Hebdo
Episode 34 : Serverless Monster
Amazon goes all in on AI and Big Data at AWS:Reinvent 2016http://www.techrepublic.com/article/amazon-goes-all-in-on-ai-and-big-data-at-aws-reinvent-2016/AWS EC2 Instances Updateshttps://aws.amazon.com/fr/blogs/aws/ec2-instance-type-update-t2-r4-f1-elastic-gpus-i3-c5Custom silicon, 9PB storage boxes, and 25Gb Ethernet – just another day in AWS hardwarehttp://www.theregister.co.uk/2016/11/30/aws_hardware/Amazon Athenahttps://aws.amazon.com/fr/athena/https://aws.amazon.com/fr/athena/pricing/https://prestodb.io/Run IoT applications seamlessly across the AWS cloud and local deviceshttps://aws.am...
2016-12-02
57 min
Big Data Hebdo
Episode 33 : des news venues du Cloud...
Datastax acquires DataScale and announces Datastax Managed Cloudhttp://www.datastax.com/2016/11/announcing-datastax-managed-cloudMicrosoft's data announcements, and what they meanhttp://www.zdnet.com/article/microsofts-data-announcements-and-what-they-mean/Announcing GPUs for Google Cloud Platform https://cloudplatform.googleblog.com/2016/11/announcing-GPUs-for-Google-Cloud-Platform.htmlRetour sur le Spark Summit Europe 2016http://blog.ippon.fr/2016/11/08/retour-sur-le-spark-summit-europe-2016/https://www.youtube.com/user/TheApacheSpark/playlistsApache Spark: Config Cheatsheethttp://c2fo.io/c2fo/spark/aws/emr/2016/07/06/apache-spark-config-cheatsheet//Hortonworks comes to the Amazon AWS cloudhttp://www...
2016-11-25
1h 00