Statsbiblioteket kæmper for at lagre vores historie

I sidste uge kiggede ComON på processen bag etableringen af de digitale arkiver. Vi har nu taget en snak med Bjarne Søgaard Andersen fra Statsbiblioteket for at høre om, hvordan de lagrer deres data.

På Statsbiblioteket i Århus arbejder afdelingen for Digitale Ressourcer med at få overført deres kæmpesamling af musik til en digital form. Nationaldiskografien, som samlingen kaldes, består af alt fra gamle voksvalser til sidste års danske cd-udgivelser. Men en ting er at digitalisere gammel musik og få dem lagt ind på en harddisk. Hvordan lagrer man dataene, så de ikke forfalder?

Det er et spørgsmål, de arbejder med på afdelingen for Digitale Ressourcer ved Statsbiblioteket i Århus.
Funktionsleder Bjarne Søgaard Andersen fortæller om deres arbejde for at vi også kan høre den danske musik i fremtiden. Afdelingen udvikler selv software, men er på vej til at flytte til nogle standardsystemer.

Metadata holder styr på samlingen

»Selve digitaliseringen, hvor man går fra fysisk dims til en digital kopi, er typisk ikke noget vi selv udvikler.«

Statsbiblioket har til formålet indkøbt et system bygget til digitalisering af lyd.

"Når vi så har fået lavet den digitale kopi, skal vi have flyttet den over på vores langtidsbevaringssystem, plus vi skal have tilknyttet nogle metadata, så vi kan finde det igen. En ting er, at vi digitaliserer for at bevare det. Noget andet er, at vi også skal gøre materialet tilgængeligt. Det er så fordelen ved at have digitale kopier. Der er ikke kun en person, der kan låne pladen.«

Metadata er beskrivelsen af de originale medier, helt ned til muggen på de gamle voksvalser.

Tre digitale kopier på redundante diske

Afdelingen laver tre digitale kopier, som bliver lagret i et selvudviklet system, et Digital Object Management System(DOMS). Systemet holder øje med filerne og metadataene.

»Når vi snakker digital langtidsbevaring, skelner vi mellem to typer bevaring, bitbevaring og logisk bevaring. Bitbevaringen består udelukkende i at holde liv på i de originale bits, så de ikke forgår eller forvansker. Det gør man ved at have flere digitale kopier af alting, og løbende checke bitsene. Det foregår typisk med checksums-algoritmer, hvor man sammenligner checksummen af de tre kopier.«

Den logiske bevaring er, hvordan de digitale kopier bliver lagret. De digitale kopier bliver lagret, og checksummen lagret sammen med dem. Så har holdet fire checksummer at arbejde med. Hvis en kopi ved et check viser sig at være blevet forvansket, overskriver de den forvanskede kopi med en god kopi.

Bits skal bevares

Men de digitale kopier er ikke perfekte. For bevaringsformålet peger Bjarne Andersen på, at så længe man kan opleve, hvad der engang var, er det fint.

»Det komprimerede format er indenfor bevaring en potentiel fælde, for komprimerede formatter kan lettere forvanske,« siger Bjarne Andersen. Derfor har Statsbiblioteket valgt streamede formater, som MPEG, der ikke er så kritiske, hvis en bit skulle forvanskes uigenkaldeligt.

»Vi kører typisk checksum en gang om måneden. Men det er noget vi må kigge på, om vi kan blive ved med. Jo større datamængden er, jo længere tager det at checksumme.«

Når dataene er lavet, bliver de lagret på et RAID-system.

»De storage-systemer vi bruger har indbyggede fejlretningsalgoritmer. Leverandøren er ansvarlig for installationen, og det er leverandøren, der overvåger fejl. Og fordi det er et RAID-system, har vi hotsparediske. Så systemet kan i virkeligheden have regenereret sig selv, da det opdager fejlen. Så kommer leverandøren og skifter en disk, så nogle gange opdager vi ikke, at der har været fejl, før vi får en log over deres besøg.«




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Also A/S
Salg af serviceydelser inden for logistik, finansiering, fragt og levering, helhedsløsninger, digitale tjenester og individuelle it-løsninger.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere