Er det smart at bruge deduplikering på din backupdisk?
I dette indlæg behandler vi deduplikation, eller dedupe, som det også kaldes. Dette er relevant i forbindelse med sikkerhedskopi og backup af databaser, og hvordan dedupe kan påvirke den tid, det tager at udføre en databasegendannelse.
Hvad er Dedupe?
Dataduplikation, også kaldet dedupe, er en type "datareduktion", ligesom komprimering. Dedupe reducerer mængden af disk, der er nødvendig for at gemme en bestemt mængde data. Dette gøres ved at opdele alle data i mindre dele, sammenligne disse dele og derefter sørge for at identiske dele kun gemmes en gang.
Hvorfor bruger man Dedupe?
Med dedupe kan man øge mængden af data, som man kan gemme på den samme diskplads betydeligt. Man kan f.eks. gøre brug af dedupe ved lagring af VDI-filer (Virtual Disk Image), da mange af filerne stort set er de samme, og man kan derfor opnå en god "dedupe-ratio". Man kan også opnå en god "dedupe-ratio" på backup-filer til en given database, hvis man primært har data, som ikke ændrer sig særlig meget.
Dedupe er ikke nødvendigvis altid det bedste valg
Ulempen ved dedupe er, at opsving tager meget længere tid, og afhængigt af RTO (Recovery Time Objective) kan det være en "deal breaker". En af vores kunder bruger dedupe på sin SQL Server backup-disk, og med deres godkendelse blev der udført nogle genoprettelsestest, så vi kunne få en idé om, hvor stor forskellen ville være med deduplikering.
Denne test blev udført med en 10 GB database. Det blev også testet både med og uden SQL Server's indbyggede backupkomprimering.
Billedet ovenfor viser de tal, der blev hentet fra testen. Som man kan se, kan gendannelse fra en delt disk som benytter dedupe tage omkring 10 gange længere tid end med en almindelig delt disk, hvilket er pænt meget.
Det blev også opdaget, at gendannelse af en SQL-komprimeret backupfil var mærkbart hurtigere, hvilket er interessant. Disse tal kan naturligvis variere afhængigt af typen af data og hvor meget man gemmer. Sørg for at lave dine egne genopretningstest for at finde ud af, om tiderne er acceptable.
Skal man bruge deduplikering eller ej?
Deduplikation kan reducere størrelsen af dine data drastisk, men vi anbefaler, at man gemmer sikkerhedskopier af databasen på en disk uden dedupe.
Man tænker måske, at mængden af lagerplads, som man sparer, er det værd, og det kan det også være. Men man skal bare sørg for at vide, hvor lang tid en gendannelse tager på alle sine vigtige databaser.
Læs om: Hvordan håndterer din virksomhed et databasenedbrud? >
Læs om: Har du sikret dit databasemiljø godt nok mod datatab og nedetid? >
Læs om vores tjenester til sikker drift og overvågning af virksomhedskritiske systemer >