#MeetOurTeam – Thibaud
Vi har lyst til å vise frem våre ansatte gjennom det vi har kalt #MeetOurTeam. Møt Thibaud!
Vi har lyst til å vise frem våre ansatte gjennom det vi har kalt #MeetOurTeam. Møt Thibaud!
Alder:
Cegal kontor:
Rolle:
Kommer fra:
År i Cegal:
36 år
Oslo
Senior Data Scientist Consultant
Frankrike
Siden august 2022
Det er vanskelig å beskrive en typisk arbeidsdag fordi den varierer avhengig av hvilket stadium prosjektet jeg jobber med er i. Vanligvis starter jeg med å lage en liste over oppgavene mine eller delta på et stand-up møte før jeg starter på oppgavene for dagen. Dette kan være å gjøre research, løse problemer, feilsøke og gjøre nødvendige justeringer inntil alt er løst.
Jeg fokuserer på Microsoft Azure med Microsoft Synapse og nå Microsoft Fabric. Hovedsakelig bruker jeg Python og SQL.
Presentasjonen - En kilde til sannhet - er faktisk basert på et prosjekt vi gjør for en av kundene våre innen olje og gass. Som mange andre selskaper i bransjen sliter denne kunden med mengden informasjon og antall datakilder de håndterer for brønnboredata. Mye av kvalitetskontrollen av informasjon blir gjort manuelt, og dette er en kjedelig jobb for geologer og data managere.
Det viktigste målet med prosjektet er å automatisere denne prosessen ved å integrere automatisk de ulike kildene kunden bruker og vise forskjellene mellom datakildene på et dashboard.
Vi har valgt å løse denne oppgaven med Microsoft Fabric, som er en programvare som en tjeneste fra Microsoft der vi kan bygge end-to-end dataløsninger. Jeg liker det fordi det er nesten ingenting å konfigurere før jeg kan bruke det, og jeg kan gjøre mye uten å være avhengig av noen andre. Jeg er ansvarlig for all datainnhenting og transformasjon, og min Power BI-ekspertkollega bygger dashbordet.
En av utfordringene i dette prosjektet er at for en av kildene - Diskos - er mye av informasjonen lokalisert i PDF-filer, og å trekke ut data fra dem (spesielt tabeller) er en vanskelig oppgave. Vi vil dra nytte av mulighetene til Large Language Mode (LLM)- som ChatGPT - for å trekke ut data fra dem.
Det å ha klare målsetninger og effektive prosjektledere er viktig. Og det å være omgitt av støttende og hjelpsomme individer er nøkkelen til suksess.
Jeg bruker Copilot GitHub for å hjelpe meg med å fikse feil og kode raskere, og som en del av et faktisk prosjekt vil jeg bruke Large Language Model for å trekke ut data fra ustrukturert tekst.
Jeg liker å lære og bygge/utvikle, og det at jeg får muligheten til å lære av hver ny oppgave.
Det er morsomt å bli utfordret av kunden og å løse det teknisk innenfor de rammene av teknologistakken vi bygger løsningen med.
En leder som gir oss friheten og fleksibiliteten til å jobbe slik vi ønsker, så lenge vi leverer resultater.
Les mer om hvordan det er å jobbe i Cegal >
Jeg elsker Super Data Science Podcast - en gammel favoritt med hele 750 episoder som hjelper meg å holde meg oppdatert innen data science feltet.
Practice makes the master.
Android eller iPhone?
iTunes eller Spotify?
Ringe eller melde?
Emoji eller tekst?
Snapchat eller Instagram?
iPhone
Spotify
Melde
Emojis & GIF
Ingen
Etter å ha tilbrakt et tiår i modellbransjen og tidligere designet nye medisiner med datamaskiner, tok livet mitt en ny vending da jeg hadde mitt aha-øyeblikk mens jeg brukte Python for første gang for fem år siden. Dette avgjørende øyeblikket førte til at jeg gikk over til det spennende feltet data science. Nylig hadde jeg en annen inspirerende opplevelse da jeg oppdaget den innovative verdenen av low-code/no-code teknologi.
I tillegg er jeg stolt over å være grunnlegger av Pint of Science Norway, hvor vi arrangerer en årlig tre-dagers festival. På dette arrangementet forvandler vi barer til arenaer der forskere kan dele sin forskning med et nysgjerrig publikum.