Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 18. oktober 2002.
Der er ingen dansk standard for dokumentformater. Det betyder, at dagens dokumenter muligvis ikke kan læses i fremtiden. Brug af open source-programmer kan mindske dette problem, viser erfaringer fra Peru.
Rigsarkivet er den eneste danske institution, som har sat nogen standarder for dokumenter. Standarderne er: ASCII for tekstdokumenter og TIFF (Tagged Image File Format) for digitale billeder.
Ellers er der frit slag for valg af dokumentstandarder. Og det på trods af, at der eksisterer internationale standarder på området.
Den internationale standardiseringsorganisation ISO, har vedtaget flere standarder på området. De hedder blandt andet SGML (Standard Generalized Markup Language - ISO 8879:1986), HTML, og PDF (Portable Document Format).
XML er en forsimplet udgave af SGML, men er ikke en ISO-standard, i stedet er det en W3C-norm, som ISO ganske vist anerkender brugen af. Men lukkede programmer som Microsoft Office er for eksempel kun i stand til at gemme dokumenter i en HTML-version som standard.
Gamle dokumenter er ulæselige
Alle kommercielle tekstbehandlere har deres egne dokumentformater, hvor flere af formaterne som Word 2.0, WordPerfect 5.1 og RTF (Rich Text Format) er blevet de facto standarder. Disse dokument-formater kan i dag læses af næsten alle tekstbehandlingsprogrammer, men spørgsmålet er, hvor længe.
Hedengange tekstbehandlingssystemer som Wang, WordStar, DSI-tekst eller IBM System 80, var aktive for 15 år siden, men ingen har i dag konverteringer til dem.
Og selv om der eksisterer konventeringsprogrammer, skal der stadigvæk bruges tid og energi på at få dokumenterne overført til et andet og mere fremtidssikkert tekstformat.
Dermed kan det danske dokumentformat-anarki betyde, at man i fremtiden vil få stort besvær med at læse nutidens dokumenter.
Peru som foregangsland
Netop problemet med at kunne sikre, at ældre elektroniske dokumenter er læselige, er en af de faktorer, som har fået statsadministrationen i Peru til at gøre brug af open source-programmer i den offentlige forvaltning.
Tilgængeligheden af kildeteksten bevirker nemlig, at dokumentformatet også bliver offentligt, og dermed sikres, at de ældre dokumenter kan læses, hvis de ikke følger en ISO-standard.
Argumenterne for anvendelse af open source er centreret om tre punkter: Fri adgang til alle offentlige informationer, bevaring af mulighederne for at læse offentlige data og statens sikkerhed.
Det sidste argument er baseret på, at open source-programmer ikke kan have bagdøre eller gemme oplysninger i computeren, som tekstbehandlingsleverandøren senere anvender. Hermed menes, at programmerne ikke sender oplysninger til tredjepart eller gemmer disse oplysninger.
Hele argumentationen mellem Microsofts peruvianske chef og medlem af det peruvianske parlament Edgar Villanueva Nu-ez kan findes her:
www.opensource.org/docs/peru_and_ms.php.
Billedtekst:
Nutidens elektroniske dokumenter bliver langt sværere at læse i fremtiden end fordums papirbaserede dokumenter. Allerede 15 år gamle elektroniske dokumenter kan være ulæselige.