En Data Scientist er en person som spesialiserer seg på trekke ut essensen av store datamengder ved hjelp av maskinlæring. Resultatene kan være både visualiseringer, brukergrensesnitt, tekst og tall, og kan brukes både direkte av beslutningstakere og som del av et større eller mindre datasystem.
Det finnes spesialiserte utdannelser innen maskinlæring (AI), men en Data Scientist har ofte annen realfagsbakgrunn og lang programmeringserfaring, og har gått over til å arbeide med maskinlæring med det som utgangspunkt. Arbeidet er i svært stor grad knyttet til å forberede proprietære datasett, og analysere disse, før maskinlæring og visualisering kan brukes til å trekke konklusjoner.
Det er også ofte bedre å bruke erfaringsbaserte beregninger kombinert med maskinlæring—spesielt i analyser knyttet til fysiske, kjemiske og biologiske prosesser, som i et vannkraftverk eller et lakseoppdrettsanlegg. Her er det såpass mange kjente faktorer og sammenhenger, at det er lite hensiktsmessig å bruke maskinlæring til alt. En erfaren Data Scientist vet når et problem bedre kan løses med andre metoder enn maskinlæring alene.
For å få en reell nytteverdi av maskinlæring kreves gode datasystemer for datainnsamling og lagring, og gode analyser og visualiseringer krever gjennomgående forståelse av forretningslogikk. Bruk av sanntids algoritmer som del av et større datasystem krever også en forståelse av alle programmeringslag. En dyktig Data Scientist har derfor også evnen til å sette seg inn i både det forretningsmessige aspektet av problemene, samt evner å lage løsninger som passer inn i et helhetlig datasystem.
Vi har flere eksperter innenfor Data Science. I Cegal hjelper våre Data Scientists kunder med å lage skreddersydde løsninger for maskinlæring og analyse. Våre konsulenter innenfor dette feltet har spesialisert seg på strømnettet og de har også erfaring med video- og tekstanalyse.
Ett eksempel er et prosjekt for en av våre energikunder, hvor vi leverte en løsning for visualisering av hvilke jordkabler som burde skiftes ut eller vedlikeholdes først, basert på historiske data og maskinlæring. Det er mange individer med lang erfaring i organisasjonen, og dermed flere meninger om hvordan man skal prioritere utskiftning og vedlikehold. Løsningen gir kunden et matematisk referansepunkt til disse meningene, og bidrar på denne måten i beslutningsprosessen.
I Cegal er vi opptatt av meningsfullt arbeid, og ett av prosjektene vi jobber med i tillegg til jobben vi gjør for våre kunder er et frivillighetsprosjekt sammen med KRIPOS hvor vi jobber for å bekjempe overgrep mot barn på nett. I dette prosjektet jobber våre Data Scientists med å analysere loggfiler for å øke forståelsen for trafikken på filutveksling – og lage visualiseringer som bistår politiet i videre arbeid.