Med den stadigt voksende mængde ustrukturerede data, altså råt data, som ikke findes i en database i rækker og kolonner eller i et datalager, er man kommet frem til udtrykket Data Lake. En Data Lake er altså et system, som lader dig gemme alle dine strukturerede, semistrukturerede, ustrukturerede og binære data i dets naturlige rå format.
Data Lake handler om de data, som vi ikke har brug for her og nu, altså de data, som vi ikke henter og uploader (ETL (extract, transform, load)) i et datalager. Dette kan være data fra IoT-enheder. Der kan være data fra forskellige målere og så videre. Der findes nemlig teknologier, som gør det muligt at hente data uden at gå igennem et Data Warehouse, såsom Hadoop.
Data Lake er forbundet med et andet teknologisk ord: Big Data
Cegal arbejder med hele Hadoop-økosystemet samt med den største big data udbyder Cloudera, som tilbyder løsninger til big data infrastruktur og software. Vi tilbyder support til hele big data-infrastrukturer med tilhørende software. Desuden understøtter vi alle Oracle, MySQL, NoSQL-databaser og Kafka-datastreamings platformen. Vi tilbyder såvel store dataløsninger til vores kunder inden for forretningsområderne energi, telekom, bank og logistik.