Look for any podcast host, guest or anyone

Showing episodes and shows of

Romain Ferraton

Shows

Livres en partage

Livres en partage Henry-Noël Ferraton - Sixième sensAux Editions L'arbre de Rinou - Alexandrine grandit sur la ferme familiale auprès de son père et ses frères, marquée par l’absence de sa mère et la perte de sa grand-mère. Animée par sa passion pour la pétanque et l’élevage caprin, elle se heurte à l’incompréhension paternelle. Depuis l’enfance, Alexandrine vit avec des prémonitions mystérieuses qui influencent ses choix et son regard sur le monde.Au lycée agricole de Bonnefont, elle découvre le rugby et intègre l’équipe de France, mais un accident brutal met fin à s...

2026-01-3013 min

#DataOops

#DataOops Episode 44 : REX dataoops modélisation et postgresql performance, DuckDB stars, MS Fabric ratio prix/performanceREX sur des erreurs de modélisation avec des vues trop imbriquées, performance postgresql windows vs linux. DuckDB une star sur Github qui rejoint Postgresql. MS Fabric des prix d'appel pour les entreprises avec un ratio prix/performance attractif.

2024-01-311h 06

Performance

Performance Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouseEpisode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomous

2023-12-311h 02

Database

Database Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouseEpisode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomous

2023-12-311h 02

#DataOops

#DataOops Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouseEpisode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomous

2023-12-311h 02

Performance

Performance Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous dbEpisode timeline

2023-12-2600 min

Database

Database Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous dbEpisode timeline

2023-12-2600 min

#DataOops

#DataOops Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous dbEpisode timeline

2023-12-2600 min

#DataOops

#DataOops Episode 41 : Onyxia et SSP Cloud avec Frederic ComteOnyxia est une UX open source pour mettre en place un datalab avec des services basés sur des containers et orchestrés par K8s. Minio pour le stockage, Keycloak et Vault pour la sécurité s'intègre parfaitement. Cette solution est mise en oeuvre à l'INSEE avec le datalab SSP et Frederic Comte, Architecte Data à l'INSEE nous en explique les fondements et les avantages.

2023-12-2030 min

Database

Database Episode 40 – Microsoft Fabric passe en GAMicrosoft Fabric passe en GA : on en parle

2023-12-061h 07

#DataOops

#DataOops Episode 40 – Microsoft Fabric passe en GAMicrosoft Fabric passe en GA : on en parle

2023-12-061h 07

Database

Database Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging FaceUne interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA.

2023-11-191h 05

#DataOops

#DataOops Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging FaceUne interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA.

2023-11-191h 05

Database

Database Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodagePartie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en général

2023-11-0857 min

Performance

Performance Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodagePartie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en général

2023-11-0857 min

#DataOops

#DataOops Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodagePartie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en général

2023-11-0857 min

Database

Database Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernanceEpisode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique.

2023-10-151h 06

Performance

Performance Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernanceEpisode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique.

2023-10-151h 06

#DataOops

#DataOops Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernanceEpisode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique.

2023-10-151h 06

#DataOops

#DataOops Episode 36 : les tendances des bases de données / Une formation Databricks testée / DB Vectorielles : les points importantsDatabricks : formation en ligne gratuite et aparté Delta Lake 3.0. Oracle DB : un dashboard sur les features et innovation depuis la 11.2 avec 1608 features. Les tendances des bases de données (Relationnelles et NoSQL). Les bases de données vectorielles : qu'est ce qui les différencie et les points importants pour les choisir.

2023-10-051h 08

Database

Database Episode 36 : les tendances des bases de données / Une formation Databricks testée / DB Vectorielles : les points importantsDatabricks : formation en ligne gratuite et aparté Delta Lake 3.0. Oracle DB : un dashboard sur les features et innovation depuis la 11.2 avec 1608 features. Les tendances des bases de données (Relationnelles et NoSQL). Les bases de données vectorielles : qu'est ce qui les différencie et les points importants pour les choisir.

2023-10-051h 08

Database

Database Episode 35 : SQL invulnérable / Microsoft DataFabricSQL : un language incontournable dans le traitement des données. On en parle avec une approche historique, les dialectes et les nouvelles approches qui rendent ce language plus vivant que jamais. Dans la deuxième partie de l'épisode on vous parle de Microsoft DataFabric : où en est-on avec ce nouveau service orienté données proposé par Microsoft.

2023-09-231h 03

#DataOops

#DataOops Episode 35 : SQL invulnérable / Microsoft DataFabricSQL : un language incontournable dans le traitement des données. On en parle avec une approche historique, les dialectes et les nouvelles approches qui rendent ce language plus vivant que jamais. Dans la deuxième partie de l'épisode on vous parle de Microsoft DataFabric : où en est-on avec ce nouveau service orienté données proposé par Microsoft.

2023-09-231h 03

#DataOops

#DataOops Episode 34 : DataLakeHouse et architecture médaillon / Nouveautés d’Oracle Database 23cDataLakehouse et Architecture Médaillon. Les nouveautés d'Oracle Database 23c

2023-08-211h 00

Database

Database Episode 34 : DataLakeHouse et architecture médaillon / Nouveautés d’Oracle Database 23cDataLakehouse et Architecture Médaillon. Les nouveautés d'Oracle Database 23c

2023-08-211h 00

Performance

Performance Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2Dans cette épisode on parle d'un essai d'implémentation de recherche sémantique et vectorielle avec SQL Server. Dans la seconde partie : Approfondissement de Microsoft Fabric.

2023-07-101h 07

Database

Database Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2Dans cette épisode on parle d'un essai d'implémentation de recherche sémantique et vectorielle avec SQL Server. Dans la seconde partie : Approfondissement de Microsoft Fabric.

2023-07-101h 07

#DataOops

#DataOops Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2Dans cette épisode on parle d'un essai d'implémentation de recherche sémantique et vectorielle avec SQL Server. Dans la seconde partie : Approfondissement de Microsoft Fabric.

2023-07-101h 07

Database

Database Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAsMicrosoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accélérées les bases de données vectorielles ont le vent en poupe. Mais on peut aussi faire ce type de recherche semantique avec des bases classiques comme postgresql avec une extension (pgvector) voir même avec sql server, oracle ou n'importe quelle base de données r...

2023-06-181h 02

#DataOops

#DataOops Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAsMicrosoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accélérées les bases de données vectorielles ont le vent en poupe. Mais on peut aussi faire ce type de recherche semantique avec des bases classiques comme postgresql avec une extension (pgvector) voir même avec sql server, oracle ou n'importe quelle base de données r...

2023-06-181h 02

Modélisation

Modélisation Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAsMicrosoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accélérées les bases de données vectorielles ont le vent en poupe. Mais on peut aussi faire ce type de recherche semantique avec des bases classiques comme postgresql avec une extension (pgvector) voir même avec sql server, oracle ou n'importe quelle base de données r...

2023-06-181h 02

Performance

Performance Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAsMicrosoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accélérées les bases de données vectorielles ont le vent en poupe. Mais on peut aussi faire ce type de recherche semantique avec des bases classiques comme postgresql avec une extension (pgvector) voir même avec sql server, oracle ou n'importe quelle base de données r...

2023-06-181h 02

Performance

Performance Episode 31 : REX dataoops SQL Server et IOT, Observabilité, DataMesh4 sujets dans cet épisode : Une REX sur un problème de modélisation de données IOT dans SQL Server. L'arrivée des fonctionnalités spatiales sur DuckDB. Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog. Discussion sur le datamesh

2023-05-281h 39

#DataOops

#DataOops Episode 31 : REX dataoops SQL Server et IOT, Observabilité, DataMesh4 sujets dans cet épisode : Une REX sur un problème de modélisation de données IOT dans SQL Server. L'arrivée des fonctionnalités spatiales sur DuckDB. Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog. Discussion sur le datamesh

2023-05-281h 39

Database

Database Episode 31 : REX dataoops SQL Server et IOT, Observabilité, DataMesh4 sujets dans cet épisode : Une REX sur un problème de modélisation de données IOT dans SQL Server. L'arrivée des fonctionnalités spatiales sur DuckDB. Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog. Discussion sur le datamesh

2023-05-281h 39

Performance

Performance Episode 30 : Parquet to SQL / 3 000 milliards de lignes dans SQL ServerOn parle de chargement de données Parquet dans SQL Server via C# et bulkcopy. On parle également des bonnes pratiques pour sql server pour stocker 3000 milliards de lignes. Dernière partie avec une overview

2023-05-121h 08

#DataOops

#DataOops Episode 30 : Parquet to SQL / 3 000 milliards de lignes dans SQL ServerOn parle de chargement de données Parquet dans SQL Server via C# et bulkcopy. On parle également des bonnes pratiques pour sql server pour stocker 3000 milliards de lignes. Dernière partie avec une overview

2023-05-121h 08

Database

Database Episode 30 : Parquet to SQL / 3 000 milliards de lignes dans SQL ServerOn parle de chargement de données Parquet dans SQL Server via C# et bulkcopy. On parle également des bonnes pratiques pour sql server pour stocker 3000 milliards de lignes. Dernière partie avec une overview

2023-05-121h 08

Performance

Performance Episode 29 : TPCH MSSQL entre dans la danse + ChatGpt Premiers testsTPCH : nouveaux tests avec SQL Server et influence de la collation sur les performances. Autres Tests TPCH SF100 : DuckDB & Hyper sur un laptop vs, Snowflake (XS to 4xLarge). Quelques mots sur nos premiers essais avec ChatGPT

2023-04-271h 21

#DataOops

#DataOops Episode 29 : TPCH MSSQL entre dans la danse + ChatGpt Premiers testsTPCH : nouveaux tests avec SQL Server et influence de la collation sur les performances. Autres Tests TPCH SF100 : DuckDB & Hyper sur un laptop vs, Snowflake (XS to 4xLarge). Quelques mots sur nos premiers essais avec ChatGPT

2023-04-271h 21

Database

Database Episode 29 : TPCH MSSQL entre dans la danse + ChatGpt Premiers testsTPCH : nouveaux tests avec SQL Server et influence de la collation sur les performances. Autres Tests TPCH SF100 : DuckDB & Hyper sur un laptop vs, Snowflake (XS to 4xLarge). Quelques mots sur nos premiers essais avec ChatGPT

2023-04-271h 21

Database

Database Episode 28 : TPCH Cloud Databases vs DuckDB, les outils autour de Terraform et les extended events sur SQL Server.On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code. Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleStore et Synapse vs DuckDB. Eric nous parle également des outils permettant se faciliter la vie avec Terraform.

2023-04-011h 40

Performance

Performance Episode 28 : TPCH Cloud Databases vs DuckDB, les outils autour de Terraform et les extended events sur SQL Server.On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code. Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleStore et Synapse vs DuckDB. Eric nous parle également des outils permettant se faciliter la vie avec Terraform.

2023-04-011h 40

#DataOops

#DataOops Episode 28 : TPCH Cloud Databases vs DuckDB, les outils autour de Terraform et les extended events sur SQL Server.On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code. Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleStore et Synapse vs DuckDB. Eric nous parle également des outils permettant se faciliter la vie avec Terraform.

2023-04-011h 40

Performance

Performance Episode 27 : Data Virtualisation + Hardware NVMe-oFData virtualisation remise au gout du jour avec sql server 2022, la data virtualisation permet d'accéder à de nombreuses sources (SGBDR, Datalake, Fichiers...) depuis un point unique. Ce type d'architecture permet de simplifier le paysage architectural. On en parle sur Dataoops. Les disques NVMe apparus il y a quelques années on permis d'accélerer considérablement les accès disques. Les SAN en bénéficient maintenant plus efficacement avec le NVMe-oF : NVMe over Fabric.

2023-03-1800 min

Database

Database Episode 27 : Data Virtualisation + Hardware NVMe-oFData virtualisation remise au gout du jour avec sql server 2022, la data virtualisation permet d'accéder à de nombreuses sources (SGBDR, Datalake, Fichiers...) depuis un point unique. Ce type d'architecture permet de simplifier le paysage architectural. On en parle sur Dataoops. Les disques NVMe apparus il y a quelques années on permis d'accélerer considérablement les accès disques. Les SAN en bénéficient maintenant plus efficacement avec le NVMe-oF : NVMe over Fabric.

2023-03-1800 min

#DataOops

#DataOops Episode 27 : Data Virtualisation + Hardware NVMe-oFData virtualisation remise au gout du jour avec sql server 2022, la data virtualisation permet d'accéder à de nombreuses sources (SGBDR, Datalake, Fichiers...) depuis un point unique. Ce type d'architecture permet de simplifier le paysage architectural. On en parle sur Dataoops. Les disques NVMe apparus il y a quelques années on permis d'accélerer considérablement les accès disques. Les SAN en bénéficient maintenant plus efficacement avec le NVMe-oF : NVMe over Fabric.

2023-03-1800 min

Database

Database Episode 26 : Big Data is Dead (DuckDB) / Data GouvernanceOn discute de l'article Big Data is Dead : de Jordan Tigani. On discute des avantages de DuckDB. Puis un on aborde la data gouvernance avec Fabien

2023-02-261h 17

#DataOops

#DataOops Episode 26 : Big Data is Dead (DuckDB) / Data GouvernanceOn discute de l'article Big Data is Dead : de Jordan Tigani. On discute des avantages de DuckDB. Puis un on aborde la data gouvernance avec Fabien

2023-02-261h 17

Performance

Performance Episode 25 : DataLakeHouse, ADBC et Configuration VMWare pour les bases de données1) Premières impression sur le DatalakeHouse de Databricks. 2) Le protocole ADBC (Arrow Database Connectivity) 3) Bonnes pratiques de configuration des VMs pour les bases de données

2023-01-231h 16

Database

Database Episode 25 : DataLakeHouse, ADBC et Configuration VMWare pour les bases de données1) Premières impression sur le DatalakeHouse de Databricks. 2) Le protocole ADBC (Arrow Database Connectivity) 3) Bonnes pratiques de configuration des VMs pour les bases de données

2023-01-231h 16

#DataOops

#DataOops Episode 25 : DataLakeHouse, ADBC et Configuration VMWare pour les bases de données1) Premières impression sur le DatalakeHouse de Databricks. 2) Le protocole ADBC (Arrow Database Connectivity) 3) Bonnes pratiques de configuration des VMs pour les bases de données

2023-01-231h 16

Database

Database Episode 24 : MongoDB avec Frédéric FavelinMongoDB est devenu la principale base de données NoSQL du marché. De type document, elle cherche à toucher le plus de cas d'usages possibles. Frédéric Favelin Directeur Technique chez MongoDB viens nous parler de ses spécificités.

2022-12-2400 min

#DataOops

#DataOops Episode 24 : MongoDB avec Frédéric FavelinMongoDB est devenu la principale base de données NoSQL du marché. De type document, elle cherche à toucher le plus de cas d'usages possibles. Frédéric Favelin Directeur Technique chez MongoDB viens nous parler de ses spécificités.

2022-12-2400 min

#DataOops

#DataOops Episode 23 : PowerBI External ToolsLes external tools de powerBI permettent d'augmenter la productivité des développements. Fabien nous explique comment et quels tools choisir

2022-12-1456 min

Database

Database Episode 23 : PowerBI External ToolsLes external tools de powerBI permettent d'augmenter la productivité des développements. Fabien nous explique comment et quels tools choisir

2022-12-1456 min

SQL Server Radio

SQL Server Radio Episode 146 - New DMVs and Application ReliabilityGuy and Eitan play a game of word associations to spout a bunch of stuff about SQL Server features - mostly reviewing new system objects that replaced old DBCC commands, useful scripts in our toolbox, and talking about Application Reliability Errors. Relevant links: Buffer Pool Extension SQL Server editions comparison dashboard by domains, features, and scale capacities – by Romain Ferraton SQL Server Standard vs Enteprise Edition features history – by Romain Ferraton SQL Server Scale Limits by Version and Edition - by Eitan Blumin sys.dm_os_buffer_descriptors Madeira Toolbox: Buffer Pool Distribution by Tables.sql Get...

2022-11-1433 min

#DataOops

#DataOops Episode 22 : Datalake & Datasharing + DevOps & FinOps + Silicon ChaletUn tour d'horizon sur les solutions Datalake du marché et discussion sur le Datasharing Coté Devops : comme le devops est perçu suivant le type d'entreprise FinOps : pilotage des couts News : Nouveau Meetup Silicon Chalet

2022-10-281h 35

Database

Database Episode 22 : Datalake & Datasharing + DevOps & FinOps + Silicon ChaletUn tour d'horizon sur les solutions Datalake du marché et discussion sur le Datasharing Coté Devops : comme le devops est perçu suivant le type d'entreprise FinOps : pilotage des couts News : Nouveau Meetup Silicon Chalet

2022-10-281h 35

#DataOops

#DataOops Episode 21 : REX sur crash databases mssql + AWS AppRunner + les Certifications ITEpisode 21 : Rex sur un crash d'une infrastructure virtuelle et l'impact sur les bases de données (MSSQL). Découverte de AWS App Runner et discussions sur les certifications IT

2022-10-101h 31

Database

Database Episode 21 : REX sur crash databases mssql + AWS AppRunner + les Certifications ITEpisode 21 : Rex sur un crash d'une infrastructure virtuelle et l'impact sur les bases de données (MSSQL). Découverte de AWS App Runner et discussions sur les certifications IT

2022-10-101h 31

#DataOops

#DataOops Episode 20 : Microsoft Dataverse & les secrets d’un stockage performant pour les bases de donnéesMicrosoft Dataverse : une base de données universelle ? Retour sur EightKB 2022 et les indicateurs de performances critiques selon les fichiers utilisés par SQL Server (Journal, Datafiles, Backup Files) : Latence vs Bande Passante

2022-09-1000 min

Performance

Performance Episode 20 : Microsoft Dataverse & les secrets d’un stockage performant pour les bases de donnéesMicrosoft Dataverse : une base de données universelle ? Retour sur EightKB 2022 et les indicateurs de performances critiques selon les fichiers utilisés par SQL Server (Journal, Datafiles, Backup Files) : Latence vs Bande Passante

2022-09-1000 min

Database

Database Episode 20 : Microsoft Dataverse & les secrets d’un stockage performant pour les bases de donnéesMicrosoft Dataverse : une base de données universelle ? Retour sur EightKB 2022 et les indicateurs de performances critiques selon les fichiers utilisés par SQL Server (Journal, Datafiles, Backup Files) : Latence vs Bande Passante

2022-09-1000 min

#DataOops

#DataOops Episode 19 : MS SQL Server 2022 nouveautés et AWS CloudFront CDNQuelques nouveautés de SQL Server 2022 : optimisation des index columnStore, opérateur Is (Not) Distinct From, DateTrunc, DateBucket, Greatest, Least. 2ème partie avec Aws Cloudfront ou le CDN selon AWS. 3ème partie : Coups de coeurs avec Apache Arrow Flight SQL et HashiCorp Learn

2022-08-1000 min

Performance

Performance Episode 19 : MS SQL Server 2022 nouveautés et AWS CloudFront CDNQuelques nouveautés de SQL Server 2022 : optimisation des index columnStore, opérateur Is (Not) Distinct From, DateTrunc, DateBucket, Greatest, Least. 2ème partie avec Aws Cloudfront ou le CDN selon AWS. 3ème partie : Coups de coeurs avec Apache Arrow Flight SQL et HashiCorp Learn

2022-08-1000 min

Database

Database Episode 19 : MS SQL Server 2022 nouveautés et AWS CloudFront CDNQuelques nouveautés de SQL Server 2022 : optimisation des index columnStore, opérateur Is (Not) Distinct From, DateTrunc, DateBucket, Greatest, Least. 2ème partie avec Aws Cloudfront ou le CDN selon AWS. 3ème partie : Coups de coeurs avec Apache Arrow Flight SQL et HashiCorp Learn

2022-08-1000 min

#DataOops

#DataOops Episode 18 : DuckDB et Apache ArrowDuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI. Apache Arrow est un format pour la représentation colonnaire données analytiques et permet d'éviter la serialisation et la perte de temps associée.

2022-07-1758 min

Database

Database Episode 18 : DuckDB et Apache ArrowDuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI. Apache Arrow est un format pour la représentation colonnaire données analytiques et permet d'éviter la serialisation et la perte de temps associée.

2022-07-1758 min

Performance

Performance Episode 18 : DuckDB et Apache ArrowDuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI. Apache Arrow est un format pour la représentation colonnaire données analytiques et permet d'éviter la serialisation et la perte de temps associée.

2022-07-1758 min

#DataOops

#DataOops Episode 17 : Retours DevopsDays Genève + AWS S3 et Athena+Retours sur les DevOpsDays de Genève 2022. Discussion sur AWS S3 et les services Analytiques dérivés AWS Athena et Glue. On parle également de Apache Parquet et du requêtage via SQL de ces fichiers ==> Datalake

2022-06-1500 min

Database

Database Episode 17 : Retours DevopsDays Genève + AWS S3 et Athena+Retours sur les DevOpsDays de Genève 2022. Discussion sur AWS S3 et les services Analytiques dérivés AWS Athena et Glue. On parle également de Apache Parquet et du requêtage via SQL de ces fichiers ==> Datalake

2022-06-1500 min

#DataOops

#DataOops Episode 16 : BigQuery & Etourno de DomweeBigQuery et la sécurité des accès aux données et Domwee Etourno un ELT SAAS pour BigQuery et Snowflake

2022-06-0800 min

Database

Database Episode 16 : BigQuery & Etourno de DomweeBigQuery et la sécurité des accès aux données et Domwee Etourno un ELT SAAS pour BigQuery et Snowflake

2022-06-0800 min

Performance

Performance Episode 16 : BigQuery & Etourno de DomweeBigQuery et la sécurité des accès aux données et Domwee Etourno un ELT SAAS pour BigQuery et Snowflake

2022-06-0800 min

#DataOops

#DataOops Episode 15 : BigQuery un datawarehouse serverless sur GCPBigQuery : un datawarehouse serverless sur GCP tarifé à la requête. Brice Michetti, spécialiste GCP et BigQuery depuis plus de 5 ans nous en parle

2022-05-301h 08

Database

Database Episode 15 : BigQuery un datawarehouse serverless sur GCPBigQuery : un datawarehouse serverless sur GCP tarifé à la requête. Brice Michetti, spécialiste GCP et BigQuery depuis plus de 5 ans nous en parle

2022-05-301h 08

Performance

Performance Episode 15 : BigQuery un datawarehouse serverless sur GCPBigQuery : un datawarehouse serverless sur GCP tarifé à la requête. Brice Michetti, spécialiste GCP et BigQuery depuis plus de 5 ans nous en parle

2022-05-301h 08

#DataOops

#DataOops Episode 14 : Data Gouvernance // Monitoring de bases de donnéesData Gouvernance : les rôles Monitoring de bases de données : 3 types d'outillage : les spécialisés, les outils d'APM et les frameworks de monitoring type ELK

2022-05-2400 min

Database

Database Episode 14 : Data Gouvernance // Monitoring de bases de donnéesData Gouvernance : les rôles Monitoring de bases de données : 3 types d'outillage : les spécialisés, les outils d'APM et les frameworks de monitoring type ELK

2022-05-2400 min

#DataOops

#DataOops Episode 12 : Datalake intro et aide pour les débutants dans le cloudOn parle des bases d'un datalake et quelques conseils pour débuter ans le cloud

2022-05-171h 25

Database

Database Episode 11 : Result Cache // FinOps & RessourcesLe result cache (ou query cache) en base de données permet d'accélérer les requêtes répétitives et consommatrices sur les bases de données. Quelles databases disposent de cette fonctionnalité ? Optimiser sa consommation de ressources dans le cloud : le FinOps

2022-05-101h 03

Performance

Performance Episode 11 : Result Cache // FinOps & RessourcesLe result cache (ou query cache) en base de données permet d'accélérer les requêtes répétitives et consommatrices sur les bases de données. Quelles databases disposent de cette fonctionnalité ? Optimiser sa consommation de ressources dans le cloud : le FinOps

2022-05-101h 03

#DataOops

#DataOops Episode 11 : Result Cache // FinOps & RessourcesLe result cache (ou query cache) en base de données permet d'accélérer les requêtes répétitives et consommatrices sur les bases de données. Quelles databases disposent de cette fonctionnalité ? Optimiser sa consommation de ressources dans le cloud : le FinOps

2022-05-101h 03

#DataOops

#DataOops Episode 10 : DataHub & Strategie DataDatahub : définition(s) et approche. Data stratégie : comment mieux intégrer et gérer la données dans l'entreprise

2022-05-031h 07

#DataOops

#DataOops Episode 9 : Slowly Changing Dimensions // APICoté Modélisation : les SCD ou Slowly Changing dimensions (dimensions à évolution lente) ==> on discute des SCD1, SCD2, SCD3 et même SCD6. Eric nous parle API, REST bien sur !

2022-04-261h 08

Performance

Performance Episode 8 : Bases Graphes Neo4j // Parallélisme dans les databases relationnellesBases de données graphes // Performance & Database : Le parallélisme

2022-04-121h 16

#DataOops

#DataOops Episode 8 : Bases Graphes Neo4j // Parallélisme dans les databases relationnellesBases de données graphes // Performance & Database : Le parallélisme

2022-04-121h 16

Database

Database Episode 8 : Bases Graphes Neo4j // Parallélisme dans les databases relationnellesBases de données graphes // Performance & Database : Le parallélisme

2022-04-121h 16

#DataOops

#DataOops Episode 7 : Gestion des plans d’exécution (SPM) | Les étapes pour construire son datavault | Introduction à Terraform3 parties dans cet épisode : la gestion des plans d'exécution particuliers dans les bases de données, les étapes pour concevoir son datavault et finalement une introduction a Terraform

2022-03-291h 51

Performance

Performance Episode 7 : Gestion des plans d’exécution (SPM) | Les étapes pour construire son datavault | Introduction à Terraform3 parties dans cet épisode : la gestion des plans d'exécution particuliers dans les bases de données, les étapes pour concevoir son datavault et finalement une introduction a Terraform

2022-03-291h 51

Database

Database Episode 7 : Gestion des plans d’exécution (SPM) | Les étapes pour construire son datavault | Introduction à Terraform3 parties dans cet épisode : la gestion des plans d'exécution particuliers dans les bases de données, les étapes pour concevoir son datavault et finalement une introduction a Terraform

2022-03-291h 51

#DataOops

#DataOops Episode 6 : Plan d’exécution, Orchestrateur de containeurs et multi-temporalité dans le datavaultLe plan d'exécution dans une base de données : la base et quelques outils. L'orchestrateur de containers : pourquoi un orchestrateur et quel orchestrateur choisir en 2022. La multi-temporalité dans le datavault : snapshot or not snapshot !

2022-03-1500 min

Performance

Performance Episode 6 : Plan d’exécution, Orchestrateur de containeurs et multi-temporalité dans le datavaultLe plan d'exécution dans une base de données : la base et quelques outils. L'orchestrateur de containers : pourquoi un orchestrateur et quel orchestrateur choisir en 2022. La multi-temporalité dans le datavault : snapshot or not snapshot !

2022-03-1500 min

Database

Database Episode 6 : Plan d’exécution, Orchestrateur de containeurs et multi-temporalité dans le datavaultLe plan d'exécution dans une base de données : la base et quelques outils. L'orchestrateur de containers : pourquoi un orchestrateur et quel orchestrateur choisir en 2022. La multi-temporalité dans le datavault : snapshot or not snapshot !

2022-03-1500 min

Database

Database Episode 5 : Clef en SHA256 (binary) ou BigInt ? // Indexation et InMemoryDans un datavault les clefs ne sont pas incrémentales, alors quelle technique utiliser : SHA256 ou fonction de hashache vers un entier ? Une partie sur l'indexation et l'ordre des colonnes, une autre sur le InMemory, la compression et le stockage colonne sur SQL Server, Oracle et HANA.

2022-03-0157 min

Database

Database Episode 4 : performance et Data Vault, Devops et Docker, Indexation dans les bases de données Modélisation : Data Vault la suite DevOps : Docker PerformanceIndexation dans les bases de données

2022-02-151h 27

Database

Database Episode 3 : Partitionnement, Data Vault et le CALMS du DevOps Performance Database : Partitionnement (Oracle & SQL Server) DevOps : Les fondements (CALMS) Modélisation DataVault: définition et utilité

2022-02-011h 20

Database

Database Episode 2 : Modélisation en étoile ou flocon, GitOps intro et performance sql des fonctions UDF Modélisation en étoile et en flocon : définition et utilité Gitops : principes et intérêts Performance Database : Fonctions Utilisateurs (UDF) dans les bases de données, cas d'utilisation et problèmes de performance

2022-01-181h 09

Database

Database Episode 1 : Modélisation en 3ème forme normale / Performance : Curseur vs ensembliste et sargable Modélisation et formes normales : définition et utilité Performance Database : Curseur vs Ensemble et notion de Sargable

2022-01-0448 min