Læs også:
Sådan moderniserer du din backup-infrastruktur.
Ny backup: Hvorfor ikke prøve disk-til-disk-til bånd?
Computerworld News Service: Den typiske backup skaber det duplikerede data på en af to måder: Gentagne fulde backups sammen med incrementals af den samme fil, når den er blevet ændret flere gange.
Et system til deduplikering identificerer begge situationer og eliminerer dubletter, og det reducerer den mængde diske, der skal bruges til at gemme backups et sted mellem 10:1 og 50:1 og derover, afhængigt af dataets redundans-niveau.
Men deduplikerings-systemer er også ret magiske på subfile-niveauet.
Det fungerer ved, at systemet identificerer data-segmenter (et segment vil typisk være mindre end en fil, men større end en byte), som er dubletter af andre segmenter, hvorefter det bliver fjernet.
Den mest oplagte måde at anvende teknologien på, er at give kunderne mulighed for at skifte fra disk staging-strategier (hvor der kun lagres backup fra en enkelt nat) og til disk backup-strategier (hvor alle backups i huset gemmes på diske).
To typer
Der findes to hovedtyper af deduplikering:
- Target deduplikerings-systemer, der gør det muligt for kunderne at sende traditionelle backups til et storage-system, som derefter deduplikerer dem. De bliver typisk brugt i mellemstore og store datacentre og fungerer ved høj hastighed.
- Source deduplikerings-systemer anvender en anden type software til eliminering af dubletter helt fra begyndelsen af processen, ligesom de kan fungere som backup for fjern-kontorer og mobile brugere.
Backup i farten
CDP (continuous data protection, eller ‘vedvarende databeskyttelse') er en anden diskbaseret backup-teknologi, som bliver mere og mere populær.
Det kan beskrives som replikering med en fortryd-funktion.
Hver gang en blok data ændrer sig i et af de systemer, der bliver lavet backup af, bliver den overført til CDP-systemet.
Men i modsætning til replikering gemmer CDP ændringerne i en log, så man senere kan vælge at fortryde dem helt nede på detaljeplan.
Faktisk kan man genskabe systemet til praktisk talt alle tidligere versioner, der er gemt i CDP-systemet.
Et såkaldt 'near-CDP-system' fungerer på nogenlunde samme måde, bortset fra at det indeholder discrete points, som man kan genskabe til.
Near-CDP kombinerer med andre ord snapshots med replikation.
Snapshots
Det foregår typisk på den måde, at der bliver taget snapshots, mens systemet kører backup, hvorefter det snapshot bliver replikeret til et andet system, som holder backup'en.
Hvorfor tager man snapshot på kilden inden replikationen?
Fordi det typisk kun er ved kilden, at man har mulighed for midlertidigt at standse applikationen, så ens snapshot kommer til at give mening.
Læs også:
Sådan moderniserer du din backup-infrastruktur.
Ny backup: Hvorfor ikke prøve disk-til-disk-til bånd?