Det digitale tab

Kulturarven forsvinder, fordi information flytter over på internet ? og ingen gemmer de mange internet-sider. Statsbiblioteket og Det kongelige Bibliotek har forsøgt at gemme efterårets valgkamp på internet. Men arkivering af hele .dk kræver en lovændring.

I fremtiden vil historikere og alle os andre huske tilbage på vidensamfundet som den tid, hvor al viden gik tabt.

For eksempel bliver det ikke muligt at rekonstruere, hvordan Fremskridtspartiet under valgkampen i november 2001 brugte elektroniske postkort med letpåklædte kvinder til at fremme deres budskaber.

Eller hvordan borgere og politikere chattede sig gennem valgkampen. Eller hvordan den første politiske robot, Socialdemokratiets Rosa, gav vælgerne svar på deres spørgsmål.

? I øjeblikket forsvinder kulturarven mellem hænderne på os, siger Birte Christensen-Dalsgaard fra Statsbiblioteket i Århus.

Hun peger på, at mere og mere af samfundets liv foregår elektronisk på internet, og at loven i dag kun handler om at gemme statisk materiale som deciderede udgivelser, databaser og den slags.

Fremtidens historikere får svært ved at skaffe primære kilder.

Den store internet-høst

? Hvis man ønsker at gemme bredt, er man nødt til at ændre pligtafleveringsloven, så den også dækker dynamiske sider på internet, forklarer hun.

Som IT-udviklingschef på Statsbiblioteket står hun sammen med Det kongelige Bibliotek og Center for Internetforskning bag et pilotprojekt, der skal undersøge, hvordan man gemmer alle danske hjemmesider. Altså hele .dk.

I forbindelse med kommunalvalget i november sidste år afprøvede de en række forskellige høste-robotter og indsamlede knap 1,5 million hjemmesider om valgkampen.

Projektet har undersøgt, om robotterne kan høste almindelige hjemmesider, komplicerede hjemmesider (for eksempel omdirigerede adresser, Javascript, Flash, kryptering), streamet lyd og billede, chat, net-konferencer, mailinglister, nyhedsgrupper og WAP-sider.

? De traditionelle høstmaskiner har problemer med automatisk at indsamle alle typer materiale. Men det materiale kan man i stedet bede kilderne om at aflevere direkte. Det er for eksempel tilfældet med streamet video og audio og chatsessioner, forklarer Birte Christensen-Dalsgaard.

I øvrigt rendte gruppen ind i et uforudset problem, nemlig at de blev opdaget af de analyseværktøjer, som mange hjemmesider anvender, fordi serverne blev nærmest rødglødende, mens robotterne høstede.

? Så ringede de jo til os for at spørge, hvad vi gik og lavede. Som regel giver det ikke problemer, men hvis man skal gemme hele .dk, vil det blive urimeligt dyrt, som lovgivningen er i dag, fortæller Birte Christensen-Dalsgaard.

Hun peger på, at det vil koste mange penge i form af arbejdstimer at lave aftaler med indehaverne af danske hjemmesider.

Barok situation

I dag giver pligtafleveringsloven ikke bibliotekerne ret til at gemme dynamiske hjemmesider, og høst af alle danske hjemmesider vil betyde, at man skulle lave frivillige aftaler med tusindvis af ejere af hjemmesider.

? I Sverige gemmer de hele .se to gange om året, men de holder materialet gemt. De giver ikke online adgang til materialet, fordi de ikke har lovhjemmel til det, siger Birte Christensen-Dalsgaard.

? Både Sverige og Danmark er i den barokke situation, at danske hjemmesider kan søges og vises via det amerikanske initiativ på www-archive.org, men vi kan ikke selv give adgang, fortæller Birte Christensen-Dalsgaard.

For at give fremtiden et dækkende billede af internet anno 2002, er man nødt til at kombinere to årlige ?snapshots? af den danske del af internet med en mere tæt overvågning af udvalgte hjemmesider, som for eksempel nyhedssider, der udvikler sig konstant.

De såkaldte snapshots illustrerer bredden, og en intensiv opfølgning af udvalgte hjemmesider giver dybden.
Robotterne kan i øvrigt få indbygget pauser, så de ikke vælter folks website.

Projektet, der kan ses på www.netarkivet.dk, er nu i færd med at analysere materialet. Den færdige rapport med en strategi og en anbefaling af, hvordan opgaven løses, udkommer til sommer.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Højer og Lauritzen ApS
Distributør af pc- og printertilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere