Listen

Description

Ein Data Lake ist ein Repository zur Speicherung von Big Data in ihrem ursprünglichen, unstrukturierten Format. Data Lakes werden in der Regel auf einem Hadoop-Cluster aufgebaut und verwenden HDFS zum Speichern von Daten. Da Daten in einem Data Lake in ihrem rohen, unstrukturierten Format gespeichert werden können, können sie kostengünstiger sein als herkömmliche Data Warehouses 

Data Lakes können für eine Vielzahl von Zwecken verwendet werden, z. B. zum Sammeln von Protokolldateien, Anwendungsüberwachungsdaten, Clickstream-Daten von Webanwendungen, Sensordaten von IoT-Geräten und Daten aus sozialen Medien. Neben der Speicherung dieser Rohdaten können Data Lakes auch dazu verwendet werden, Analysen mit den Daten durchzuführen, um Erkenntnisse zu gewinnen, die Unternehmen dabei helfen, bessere Entscheidungen zu treffen.