Med den stadig voksende mengden ustrukturerte data, altså data som ikke finnes i en database med rader og kolonner eller i et datavarehus, kom begrepet datasjø, fra det engelske Data Lake.
Datasjøen handler om de dataene som vi ikke trenger akkurat nå, de dataene som vi ikke henter ut og laster opp (ETL (extract, transform, load)) i et datavarehus. Det kan være data fra IoT-enheter. Det kan være data fra ulike målere og så videre. Det finnes imidlertid teknologier som gjør det mulig å hente ut data uten at man går veien om datavarehuset, som Hadoop.
Den store datasjøen henger sammen med et annet teknologi-nyord: Big Data.
Vi jobber med hele Hadoop-økosystemet og med den største Big Data-leverandøren Cloudera og har løsninger for Big data-infrastruktur og programvare. Vi tilbyr støtte for hele Big data-infrastrukturer med tilhørende programvare. Videre støtter vi alle NoSQL-databaser og datastreamingsplattformen Kafka. Vi kan tilby store dataløsninger for våre kunder innen forretningsområdene energi, telekom, bank og logistikk.
Alle våre konsulenter er fullt sertifiserte for å tilby den beste løsningen til kundene.