Dataduplisering, også kalt dedupe, er en type "datareduksjon", omtrent som komprimering. Dedupe reduserer mengden disk som trengs for å lagre en viss mengde data. Dette gjøres ved å dele alle dataene i mindre deler, sammenligne disse delene og deretter lagre identiske deler bare én gang. Når du trenger tilgang til filene, blir de gjenoppbygd før du forlater disken.
Med dedupe kan man øke mengden data man kan lagre på samme diskplass betydelig. En mulighet for bruk av dedupe kan være når du lagrer ,VDI-filer (Virtual Disk Image) ettersom mange av filene stort sett er de samme, og du derfor kan oppnå et godt "dedupe-ratio". Du kan også få et godt dedupe-ratio på sikkerhetskopi-filer for SQL Server, hvis du stort sett har data som ikke endrer så mye. Dette gjelder også andre databaser.
Ulempen med dedupe er at gjenopprettingen tar mye lengre tid, og avhengig av RTO (Recovery Time Objective) kan det være en "deal breaker". En av våre kunder bruker dedupe på sin backup-disk, og med deres godkjenning ble det utført noen gjenopprettingstester slik at vi kunne få en ide om hvor stor forskjellen ville være med deduplisering.
Denne testen ble utført med en 10 GB database. Det ble også testet både med og uten SQL Server sin innebygde komprimering av sikkerhetskopier.
Bildet over viser tallene som ble hentet fra testen. Som du kan se, så kan gjenoppretting fra en delt disk med dedupe ta omtrent 10 ganger lengre tid enn med en vanlig delt disk, noe som er fryktelig mye.
Det ble også oppdaget at gjenoppretting av en SQL-komprimert sikkerhetskopifil var merkbart raskere, noe som er interessant. Disse tallene kan selvfølgelig variere avhengig av type data og hvor mye du lagrer. Sørg for å gjøre dine egne restitusjonstester, for å finne ut om tidene er akseptable.
Deduplisering kan drastisk redusere størrelsen på dataene dine, men vi anbefaler at du lagrer sikkerhetskopier av databasen i en disk uten dedupe.
Du tenker kanskje at mengden lagringsplass du sparer er verdt det, og det kan det være. Bare sørg for at du vet hvor lang tid en gjenoppretting tar på alle dine viktige databaser.