Med den ständigt växande mängden ostrukturerad data, dvs. data som inte finns i en databas med rader och kolumner eller i ett datalager, kom termen datasjö från det engelska Data Lake.
Datasjön handlar om de data som vi inte behöver just nu, de data som vi inte hämtar och laddar upp (ETL (extrahera, transformera, ladda)) i ett datalager. Detta kan vara data från IoT-enheter. Det kan finnas data från olika mätare och så vidare. Det finns dock teknologier som gör det möjligt att hämta data utan att gå igenom datalagret, till exempel Hadoop.
Den stora datasjön är kopplad till ett nytt tekniskt ord: Big Data.
Cegal arbetar med hela Hadoop-ekosystemet och med den största Big Data-leverantören Cloudera och har lösningar för Big data-infrastruktur och programvara. Vi erbjuder support för hela Big data-infrastruktur med tillhörande programvara. Dessutom stöder vi alla NoSQL-databaser och datastreamingsplattformen Kafka. Vi kan erbjuda stora datalösningar för våra kunder inom affärsområdena energi, telekom, bank och logistik.
Alla våra konsulter är fullt certifierade för att erbjuda kunderna den bästa lösningen.