I havnebyerne omkring Middelhavet har man en dialekt, som
har fået betegnelsen lingua franca. En blanding af fransk, spansk, italiensk, græsk og
arabisk, som man efter sigende har kunnet klare sig på i århundreder uanset hvor man var
i området. En praktisk foranstaltning, når man skulle have et handelssamarbejde til at
fungere.
XML vil uden tvivl få en rolle som lingua franca: det
sprog, som får ting til at fungere.
Indrømmet: XML er i høj grad blevet buzzword-kompatibel
og er ét af de begreber, der i brochurer og whitepapers tillægges samme effekt på
allehånde problemer som sølvkugler siges at have på vampyrer og varulve: nem og
effektiv afvikling. Nu er der ikke nødvendigvis noget galt med at være et
"buzzword", når bare det reelle budskab er godt og sandt og rent og alt det
der. Denne artikel vil gerne advokere for, at XML netop kan bære at være et buzzword men
også gøre opmærksom på, at hvis man tror der er nemme smutveje at opnå ved at bruge
XML, så skal man være forberedt på skuffelser og at "reality bites"
man kan stort set alt med XML, men XML gør som sådan ikke noget for én.
Hvad er XML egentlig?
XML eXtensible Markup Language betyder
simpelthen "et udvidbart beskrivelsessprog". Den underliggende idé i XML er
langtfra ny. Opmærkningssprog og brugen af dem går tilbage til dengang IT hed EDB og man
havde brug for nogle simple men kraftfulde måder at beskrive data og informationer på.
Ét af resultaterne blev SGML Standard Generalized Markup Language hvor man
i en defineret syntaks, der blev beskrevet i en Document Type Definition (DTD), kunne
beskrive sine informationers struktur. Disse informationer kunne relativt enkelt udveksles
med andre. Denne teknologi tog Tim Berners Lee til sig, da han tænkte tanker om World
Wide Web. Han havde brug for et sprog til at strukturere og præsentere informationer i en
browser og valgte HTML. HTML er et låst, ikke-udvidbart sprog, som har leveret varen
indtil nu, men HTML er ene og alene et præsentationssprog. HTML leverer ikke den
fleksibilitet, som vi ofte har brug for.
XML leverer os denne fleksibilitet, men hvor HTML er en
relativ enkeltstående ting, så består XML samlet set af en række teknologier. Alle
disse teknologier er standarder defineret af W3C konsortiet (www.w3.org), og der har hidtil været en flot
opbakning om at overholde disse standarder fra alle de store producenter af
XML-værktøjer. Så har man lavet XML i ét produkt vil det kunne behandles af alle andre
relevante produkter.
XML explained
Kernen i XML-familien af teknologier består af 3 centrale
elementer og en række standarder, der udbygger og understøtter brugen af XML. Vi vil her
kort gennemgå de vigtigste og vi tillader os at blive lidt tekniske:
XML syntax + Document Type Definitions (DTD)
Dette er det basale. Hvordan ser et XML-dokument ud, og hvordan definerer man
strukturen af en anvendelse altså en DTD. Når man taler om syntaks taler man om
velformethed. Det vil sige om dokumentet overholder de basale regler, der gælder for alle
XML-dokumenter. Bemærk at XML stiller langt højere krav til velformethed end SGML. Hvis
man glemmer et sluttag i HTML som jo er en anvendelse af SGML så går det
jo nok.
Derudover har man DTDer, der bestemmer hvilke tags i
hvilken rækkefølge, man kan have i et dokument. Hvis et dokument udover at være
velformet også overholder disse regler, taler man om, at XML-dokumentet er validt.
XSL, (eXtensible Stylesheet Language)
Mange tror, at XSL er en metode til at transformere XML dokumenter til en
anden struktur. Det er det også, men det er ikke det hele. XSL består nemlig af to dele:
en transfomerings-del (XSLT) og en præsentations-del kaldet (FO).
Kun i det tilfælde hvor man transformer et XML-dokument
over til nogle specielle formatteringsobjekter, som så skal kunne præsenteres, er der
tale om XSL (dermed giver forkortelsen også mening).
Standardiseringsarbejdet med XSL er i øjeblikket så
langt, at XSLT er på plads og allerede nu kan man se denne teknologi i brug.
Fremover vil vi se en flittig brug af XSL, når
XML-dokumenter fra ét system i én dialekt skal oversættes til et andet system med en
anden dialekt. Bemærk dog at det er ikke nogen automagisk (!) proces. Der skal både
tænkes og programmeres i denne XML-baserede XSL-syntaks. Men skal man have transformeret
et XML-dokument til en anden struktur, er XSLT skabt til dette formål.
Xlink + Xpointer
XML-syntaksen beskæftiger sig ikke med lænkning mellem dokumenter og hvordan man
peger ind i dokumenter. Det var netop denne egenskab, der gjorde WWW så succesfuldt, og
derfor har man naturligvis et arbejde i gang med at definere helt præcist hvordan
dokumenter linker og peger ind i hinanden i en XML-verden. Der er metoder til lænkning i
støbeskeen, der er langt mere kraftfulde end hvad man nogensinde vil se i HTML.
Derudover er der en række interessante teknologier, der
baserer sig på kerne XML-teknologien:
XML-Schema (afløseren til DTD)
Dokument Type Definitionerne har mange begrænsninger og man er i gang med at
definere afløseren. XML-Schema vil kunne håndtere struktur af dokumenter på en mere
brugbar måde, og vil endvidere kunne understøtte de basale datatyper som det kendes fra
SQL og Java. Dette gør, at man mere præcist kan specificere kravet til XML-dokumenter,
hvilket vil gøre det muligt at lave forskellige fuldautomatiske integrationer med
programmeringssprog og databaser.
Standardiseret programmerings interface (DOM)
Ud af Den Store Browserkrig kom der to meget interessante ting: den ene ting
var at betragte HTML-dokumenter som objekter, som man kan aflæse og manipulere fra kode
på en simpel måde. Den anden ting man erfarede var, at der var brug for en
standardiseret måde at gøre dette på. Med DOM (Document Object Model) har man defineret
en standard for, hvordan man kan tilgå og manipulere XML-dokumenter (og skam også
HTML-dokumenter). Dette API er et godt valg til brug ved programmering af XML, da det er
uafhængigt af det valgte programmeringssprog og dermed gør det enklere at flytte
løsninger.
Søgning i dokumenter (XQL)
Der er brug for en måde at søge i XML-dokumenter. XQL er en standard der,
når den bliver færdig engang, er tænkt til at være for XML, hvad SQL i dag er for
databaser. Altså en standard måde at lave udtræk fra XML-dokumenter med.
Lowtech high gain
Selvom det måske ikke virker sådan, når man ser på den
suite af teknologier, som XML er en samle-betegnelse for, så er enkelheden faktisk det
kendetegnende. XML er en lowtech men high gain-teknologi, der er forudbestemt til at
overleve og dominere i fremtiden blandt andre af fremtidens teknologier. Præcis som
Darwin udtrykte det, så er det den, der tilpasser sig bedst, der overlever og bliver den
dominerende art. Som nævnt er de nuværende web-teknologier ved at nå grænserne for
deres tilpasning og mere og mere energi bruges på at omgå begrænsninger i fx HTML. Ser
vi på udviklingen og udbredelsen af web-teknologierne de sidste 5 år, så tegner der sig
et overordnet mønster, som ser ud til at gentage sig med XML også denne gang med
store følgevirkninger.
Internettet og WWW bragte HTML på banen og snart trængte
behovet i virksomheder og organisationer sig på for at bruge dette format til at udveksle
informationer med andre internt såvel som eksternt. HTML er på få år blevet en
integreret del af de flestes informationsstrategi. Samme bevægelse fra Internettet ind i
organisationerne ser vi lige nu med XML, men denne gang med en anderledes tyngde i både
standardisering og strategisk brug fra starten af.
Lingua franca
Lingua franca opstod ud af en praktisk kontekst for at
opfylde et konkret behov for at få nogle konkrete handelsmæssige ting til at fungere. Vi
ser i øjeblikket rundt omkring branchespecifikke og endda leverandør-specifikke
XML-anvendelser og vi har også set EDI gå XML-vejen. Flere og flere ser potentialet i
XML, fordi de indser, at XML ikke blot er et format til udveksling af data, men mere
generelt tilbyder mulighed for at behandle, sammenbinde og præsentere data og
informationer efter nutidige og fremtidige behov. Tilgængelighed af informationer er
blevet et strategisk sigte.
Tilgængeligheden er på flere planer: tilgængelighed
mellem systemer/platforme, tilgængelighed for medarbejdere, tilgængelighed for partnere
og tilgængelighed i fremtiden.
Uagtet de udfordringer XML har foran sig som der skal (Kilde: Dataposten nr. 7)
findes snarlige løsninger på, så er der et voksende og upåvirkeligt moment bag XML,
der vil drive udbredelsen af XML-standardisering og XML-teknologierne frem i et rasende
tempo. XML har så meget foran sig men er allerede i dag implementeret og integreret i så
mange løsninger, at vi har sikkerhed for teknologiens holdbarhed og fået syn for det
potentiale den rummer.