I fremtiden vil historikere og alle os andre huske tilbage på vidensamfundet som den tid, hvor al viden gik tabt.
For eksempel bliver det ikke muligt at rekonstruere, hvordan Fremskridtspartiet under valgkampen i november 2001 brugte elektroniske postkort med letpåklædte kvinder til at fremme deres budskaber.
Eller hvordan borgere og politikere chattede sig gennem valgkampen. Eller hvordan den første politiske robot, Socialdemokratiets Rosa, gav vælgerne svar på deres spørgsmål.
? I øjeblikket forsvinder kulturarven mellem hænderne på os, siger Birte Christensen-Dalsgaard fra Statsbiblioteket i Århus.
Hun peger på, at mere og mere af samfundets liv foregår elektronisk på internet, og at loven i dag kun handler om at gemme statisk materiale som deciderede udgivelser, databaser og den slags.
Fremtidens historikere får svært ved at skaffe primære kilder.
Den store internet-høst
? Hvis man ønsker at gemme bredt, er man nødt til at ændre pligtafleveringsloven, så den også dækker dynamiske sider på internet, forklarer hun.
Som IT-udviklingschef på Statsbiblioteket står hun sammen med Det kongelige Bibliotek og Center for Internetforskning bag et pilotprojekt, der skal undersøge, hvordan man gemmer alle danske hjemmesider. Altså hele .dk.
I forbindelse med kommunalvalget i november sidste år afprøvede de en række forskellige høste-robotter og indsamlede knap 1,5 million hjemmesider om valgkampen.
Projektet har undersøgt, om robotterne kan høste almindelige hjemmesider, komplicerede hjemmesider (for eksempel omdirigerede adresser, Javascript, Flash, kryptering), streamet lyd og billede, chat, net-konferencer, mailinglister, nyhedsgrupper og WAP-sider.
? De traditionelle høstmaskiner har problemer med automatisk at indsamle alle typer materiale. Men det materiale kan man i stedet bede kilderne om at aflevere direkte. Det er for eksempel tilfældet med streamet video og audio og chatsessioner, forklarer Birte Christensen-Dalsgaard.
I øvrigt rendte gruppen ind i et uforudset problem, nemlig at de blev opdaget af de analyseværktøjer, som mange hjemmesider anvender, fordi serverne blev nærmest rødglødende, mens robotterne høstede.
? Så ringede de jo til os for at spørge, hvad vi gik og lavede. Som regel giver det ikke problemer, men hvis man skal gemme hele .dk, vil det blive urimeligt dyrt, som lovgivningen er i dag, fortæller Birte Christensen-Dalsgaard.
Hun peger på, at det vil koste mange penge i form af arbejdstimer at lave aftaler med indehaverne af danske hjemmesider.
Barok situation
I dag giver pligtafleveringsloven ikke bibliotekerne ret til at gemme dynamiske hjemmesider, og høst af alle danske hjemmesider vil betyde, at man skulle lave frivillige aftaler med tusindvis af ejere af hjemmesider.
? I Sverige gemmer de hele .se to gange om året, men de holder materialet gemt. De giver ikke online adgang til materialet, fordi de ikke har lovhjemmel til det, siger Birte Christensen-Dalsgaard.
? Både Sverige og Danmark er i den barokke situation, at danske hjemmesider kan søges og vises via det amerikanske initiativ på www-archive.org, men vi kan ikke selv give adgang, fortæller Birte Christensen-Dalsgaard.
For at give fremtiden et dækkende billede af internet anno 2002, er man nødt til at kombinere to årlige ?snapshots? af den danske del af internet med en mere tæt overvågning af udvalgte hjemmesider, som for eksempel nyhedssider, der udvikler sig konstant.
De såkaldte snapshots illustrerer bredden, og en intensiv opfølgning af udvalgte hjemmesider giver dybden.
Robotterne kan i øvrigt få indbygget pauser, så de ikke vælter folks website.
Projektet, der kan ses på www.netarkivet.dk, er nu i færd med at analysere materialet. Den færdige rapport med en strategi og en anbefaling af, hvordan opgaven løses, udkommer til sommer.