Mængden af data på alverdens computere vokser eksponentielt.
Samtidig kommer der krav om, at data skal gemmes.
De skal kunne læses om fem, ti, femten– eller i nogle tilfælde 100 år.
’At løse den kommende arkivkrise’ var derfor overskriften på et af de aktuelle indlæg på Storage Networking World.
Mange forskellige medier
Foredragsholder Gary Zasman fremlagde en undersøgelse, hvor man har spurgt 276 bibliotekarer og arkivarer om deres opfattelse af behovet for langtidsarkivering. Her er et typisk svar:
“Vores arkivalier omfatter hulkort, diktafon-bånd, 5,25’’-disketter, 3,5’’-disketter, cd’er, dvd’er, 386- og 486-pc’er, diverse drev, foruden en række softwarepakker såsom Windows 3, WordPerfect 4.2, 5.0 og 5.1. Alt sammen for, at vi kan læse, migrere og konvertere data,” lød det fra en arkivar ved et større universitet.
81 procent af de adspurgte havde behov for at lagre data i over 50 år.
“Der er både tekniske og driftsmæssige udfordringer. De tekniske handler især om at sikre fysisk og logisk læsbarhed af data.
Det driftsmæssige handler om at få organisationen til at samarbejde om at opstille krav og klassificere data, så man er enig om, hvad der skal gemmes,” siger Gary Zasman. Han er formand for arbejdsgruppen ’100 Year Archive Task Force’ under SNIA (Storage Networking Industry Association).
Teknologierne ændrer sig
Den fysiske læsbarhed er et problem, fordi teknologierne ændrer sig.
Når pc’erne ikke længere leveres med 5,25’’-diskettedrev, er de gamle disketter ubrugelige. Løsningen her hedder migrering: Man kopierer filerne over på harddiske eller bånd.
USA’s National Archives & Records Administration anbefaler, at man migrerer data på disk hvert tredje år. Data på bånd skal migreres hvert femte år.
XAM bliver standard
Men den logiske læsbarhed er ofte mere besværlig. Hvordan læser man en fil fra 1989 ved navn regnskab.dat? Hvilket program skal den åbnes med?
Der er behov for metadata, data om data. SNIA har derfor indledt arbejdet med at udvikle specifikationen XAM, Extensible Access Method.
Den skal bruges i lagringssystemer, der er skræddersyet til arkivering. I branchen taler man om ’fixed content’ (fast indhold) i modsætning til transaktionsdata, der løbende ændres. Claes Allendorf, der er kanalansvarlig for arkivsystemer hos HP, forklarer:
“I dag har leverandørerne af arkivløsninger deres egne API’er (Application Programming Interface, programmeringsgrænseflader, red.).
For at en applikation kan arkivere data på boksen, skal der skrives datamovers (en slags middleware, red.), der sørger for kommunikationen mellem applikationen og arkivsystemet. I fremtiden kan den middleware blive overflødig, hvis både arkivløsningen og applikationen understøtter XAM.”
Claes Allendorf forventer, at XAM om nogle år vil blive et fast krav, som kunderne vil stille, når de skal vælge arkivløsninger og applikationer.
“Det vil stille kunderne bedre i forhold til leverandørerne, fordi de ikke er bundet til ét system. De vil kunne skifte fra et XAM-system til et andet. For leverandørerne betyder det, at det bliver lettere at understøtte flere applikationer. I dag har leverandørerne typisk en positivliste over de applikationer, der kan arkivere i deres system. I fremtiden kan en applikation via XAM arkiveres i ethvert system, der følger standarden,” siger han.
Giver logisk læsbarhed
Foruden API-delen består XAM af en specifikation for, hvordan metadata skal struktureres, og en søgefunktion.
Når data gemmes i et XAM-system, lagres der samtidig metadata om dataene. Metadata omfatter for eksempel en unik identifikation af datasættet, oplysninger om dataformatet og dets historie, samt kontrol af, at data ikke er blevet ændret.
XAM bygger her på specifikationen Archival Information Package (AIP) fra ISO-standarden OAIS (Open Archival Information System).
Kombinationen af AIP og XAM får navnet Self-Describing, Self-Contained Data Format (SD-SCDF).
“Dermed får vi standard-metadata. Det er min drøm for branchen: Lad os få data ind i et format, hvor de kan flyttes. Det løser problemet med den logiske læsbarhed af data,” siger Gary Zasman fra SNIA.
SNIA har for nylig demonstreret, at arkivsystemer fra EMC, HP, Sun Microsystems og Vignette alle var i stand til at arkivere data via XAM.
En første udgave af standarden ventes klar til marts. SNIA vil foreslå XAM som international standard, når den er færdig.
Gå til faktaboks og få forklaringen på, hvad XAM er
Denne artikel stammer fra Computerworlds CTO-magasin.