Menneske møder maskine - og sød musik opstår

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 7. juli 2006.


Det semantiske web kan fundamentalt ændre internettets funktionsmåde og skabe et net, hvor maskiner taler med hinanden for at hjælpe mennesker. Det kan blive grundlag for nye teknologiske milliardindustrier, men forud­sætter en enorm udviklingsindsats.
internet

Først var internettet et kommunikationsredskab, der skulle forbinde mennesker og gøre dem klogere, men den næste store forandrende kraft på nettet bliver måske, at maskinerne bliver klogere.
Bevægelsen hen mod et intelligent net, der selv kan forstå og kombinere betydninger, og dermed operere langt mere effektivt end det er tilfældet i dag, kaldes med en samlebetegnelse det semantiske web. Semantik er den sprogvidenskabelige disciplin, der beskæftiger sig med betydninger.
Hvor internettet i dag kan opfattes som en slags gigantisk bibliotek med enorme mængder af ustruktureret informa­tion, der skal sorteres mere eller mindre ved håndkraft, vil det semantiske web tilføje et nyt lag, som gør det muligt for maskiner ikke bare at læse informationer på nettet, men også forstå og strukturere dem.
Man kan sige, at det vil skabe et intelligent katalogsystem på nettet og etablere en bibliotekar-funktion i form af digitale agenter, som kan identificere og sammenknytte information fra vidt forskellige kilder.
- Hvor webben har gjort mennesker klogere, vil det semantiske web gøre maskiner klogere, siger Henrik Hvid Jensen, seniorkonsulent hos firmaet Devoteam og en af de få danske eksperter på området.
Hvis det lykkes at få maskinerne til at tale sammen på effektiv vis, vil det kunne revolutionere mange aspekter af informationsteknologien. Blandt mulighederne er en radikal forbedring af den teknologi, der anvendes i søgemaskiner, en effektivisering og samkøring af forretningsprocesser inden for virksomheder, og skabelsen af helt nye former for kollaborative projekter.

Det mest avancerede nordiske projekt på området er den finske Semantic Computing Research Group, der siden 2001 har udviklet en række semantiske pilotprojekter og lagt fundamentet for et nationalt semantisk webprogram i Finland.
Forskningsgruppens leder Eero Hyvönen peger på store muligheder i teknologien både for den enkelte og for erhvervslivet
- Brugerne vil særligt have glæde af, at teknologien gør det muligt at skabe intelligente indholdstjenester på nettet, mens virksomheder vil få mulighed for at skabe avancerede portaler med indhold hentet fra mange forskellige kilder, fortæller Hyvönen.
Blandt de projekter, den finske forskergruppe har skabt, er en portal for de finske museer, hvor avanceret semantisk søgeteknologi gør det muligt at søge på tværs af samlingerne, samt at hente yderligere relateret information som portalen selv foreslår og sammensætter til brugeren.
Isoleret set syner projekter som dette måske ikke af så meget, men skaleret op i et format, der omfatter hele internettet, kan det få meget store konsekvenser.
- Semantikken kan sammenlignes med en lim, som får tingene på internettet til at hænge sammen på et helt nyt niveau, siger Eero Hyvönen.

En af de oftest nævnte anvendelser for det semantiske web er digitale agenter, der kan søge i databaser og kommunikere på tværs af forskellige platforme - med din pc, din smartphone og dit intelligente køleskab.
Hvis din visdomstand for eksempel gør knuder, vil det semantiske web gøre det muligt for din pc at vælge en tandlæge, der specialiserer sig i kæbekirurgi og ligger nær din bopæl, at lave aftalen og booke den i din og tandlægens PDA, tjekke om du har penge på kontoen til behandlingen og plotte adressen ind i din bils navigationssystem. Desværre må du selv møde op til den aftalte tid.
For organisationer kan det semantiske web åbne helt nye muligheder for vidensdeling, fordi det kan skabe en fælles infrastruktur for databaser og forskellige systemer, der i dag ikke taler ordentligt sammen.
- Der vil ikke længere være tale om databaser med nogle få tusind tabeller. Du vil have serier med milliarder af sider, siger Mills Davis, direktør for det amerikanske konsulentfirma Project 10x, der specialiserer sig i semantiske projekter.

I det små er brugen af semantiske webfunktioner allerede dukket op i vores hverdag på nettet. Man kan sige, at en form for semantisk relation
er i spil, når Google spørger, om du mener Nicole Kidman, hvis du ved en fejl indtaster ordene Nikole Kiddman i søgemaskinen.
Semantiske søgemaskiner vil dog være langt mere sofistikerede, idet de vil kunne vurdere relevansen af den givne information og udføre komplekse søgeopgaver, såsom ‘find information på tysk og svensk om Nicole Kidmans samarbejde med Lars von Trier skrevet af filmhistorikere med speciale i nordiske film.'
Ifølge Mills Davis er der i øjeblikket snesevis af start-up projekter med søgemaskiner, der forsker i anvendelsen af semantik på nettet.
- Alle i søgemaskinebranchen er i færd med at bevæge sig op i værdikæden. Hvordan gør du det? Ved at bevæge dig i retning af mere semantik, siger han.
Semantik er altså ikke længere den rene science fiction. En ny generation af standarder for programmering gør det muligt at beskrive indholdet på nettet på en facon, som maskiner kan fortolke. Rent teknisk kan det gøres på grundlag af standarder udviklet under ledelse af World Wide Web Consortium, den organisation som definerer tekniske forhold og retningslinjer for udviklingen af internettet.
- Standarderne er modne. De er klar til at blive brugt, siger Henrik Hvid Jensen.

Det semantiske web er i dag en udpræget vækstindustri. Et stigende antal projekter forsøger at omsætte ideerne i praksis; der afholdes konstant konferencer om emnet, og det semantiske web har også skabt sine egne mini-guruer.
En af dem er tyskeren Alex­ander Linden, der i otte år arbejdede for researchfirmaet Gartner Group som analytiker med speciale i nye internet-teknologier, men som nu leder en lille, stadig unavngivet, virksomhed, der arbejder på at systematisere produktionen af de meta-data, som skal hjælpe maskinerne med at tale med hinanden.
- Den grundlæggende vision bag det semantiske web er sund, og jeg forventer, at vi vil begynde at se en række praktiske, forretningsmæssige anvendelser for semantiske teknologier inden for de næste to til tre år, siger Alexander Linden til Computer­world.
Linden peger på intelligent søgning på internettet, content management og applikationer for finansiel rapportering og kontrol som de mest lovende kortsigtede vækstområder for det semantiske web.
- Det er de næste tre ting. Siden vil der komme tusinder andre til, siger han.
Andre lovende anvendelser for semantiske teknologier ligger på områder, hvor der er brug for at knytte databaser og hjemmesider sammen for at bearbejde meget store mængder af information. Det kan være i naturvidenskaben eller inden for medicinsk forskning, hvor semantiske algoritmer kan anvendes til at sortere i det kæmpe datamateriale, der indgår i de videnskabelige undersøgelser.
En anden industri, der formodes at interessere sig aktivt for det semantiske web, er efterretningstjenesterne, som kan anvende teknologiens muligheder til overvågning og såkaldt data mining på nettet.
Hvor Alexander Linden taler med en lav, næsten hviskende stemme, så er amerikaneren Mills Davis - en anden velkendt autoritet på det semantiske område - ikke bange for at tale med store bogstaver.
- Den semantiske web teknologi vil få en enorm indflydelse på tidsforbrug og omkostninger i hele it-industrien, siger Mills Davis til Computer­world.
- Du vil kun­ne få den sam­me funktionalitet med et input, der er 5-10 gange min­dre.
Det kan blive startskuddet for intet mindre end en semantisk bølge, der vil revolutionere informa­tions­­behand­lingen over de næste årtier på samme måde som pc'en og internettet gjorde det i forbindelse med tidligere teknologiske udviklingsbølger, mener Mills Davis.
- I dag er det et lille bitte område inden for it-industrien, men i et 10 års perspektiv er potentialet kæmpestort.
Mills Davis forudser således, at midlerne investeret i semantisk udvikling vil vokse fra 300 millioner til 2,4 milliarder kroner over de næste fem år. På infrastruktur-siden har han forventninger om et veritabelt boom, der vil øge investeringerne fra de nuværende tre milliarder kroner årligt til 1.200 milliarder i 2015!
Selvom det kan lyde ekstremt lovende, er der også mange eksperter, der er skeptiske over for perspektiverne i den semantiske udvikling.
Et af de vægtigste argumenter i deres favør er, at det teknisk vil være uhyre besværligt at få produceret det enorme antal metadata, der skal til for at få det semantiske web til at fungere.
- Betydning er meget svær at computerisere, siger Timme Bisgaard Munk, der arbejder på en ph.d. om videndeling ved Københavns Universitet.
- Spørgsmålet er, hvor tæt man kan komme på at tilnærme matematik til betydning.
At få det semantiske web op at køre i stor målestok kræver helt oplagt en enorm indsats, hvad angår at katalogisere og bringe nettets mylder af information på begreb.
Det er en kæmpeopgave - for et nøgleord er ikke nok til at definere betydningen af et givent begreb. For at gøre kommunikationen mellem maskiner effektiv kræves en meget præcis formel definition af millioner af begreber - og deres relation til andre begreber.
En række sproglige kategorier er svære at formalisere, fordi de er sammensatte, udtrykker tvetydige begreber, eller beskriver en undtagelse. Misforståelser kan få meningsforstyrrende konsekvenser - som det kendes fra de oversættelsesprogrammer af tvivlsom lødighed, der florerer på nettet.
- Det centrale praktiske problem er hvem, der skal producere alle disse metadata. Maskinerne kan bruge dem, men maskinerne kan ikke generere dem, siger Timme Bisgaard Munk.

Det kan blive afgørende for teknologiens succes, at der kommer flere konkrete projekter, der i praksis viser fordelene ved den semantiske organisering.
- Der mangler stadig overbevisende eksempler. Eksemplerne på området er enten for trivielle, eller så komplicerede, at de ikke kan forklares i korthed, siger Alexander Linden.
Teknologien er heller ikke endnu så moden, at de store internationale teknologiselskaber for alvor er begyndt at anvende den kommercielt.
- Reelt anvendes standarderne endnu ikke i produkter, måske også fordi efterspørgslen fra kunder er begrænset, siger Henrik Hvid Jensen.
- Der er megen snak om det, men der skal også være en business case.
Til gengæld er der positive tegn på, at finansielle investorer så småt begynder at inter­essere sig for området.
- Du kan nu sige 'det semantiske web' uden at folk glor helt uforstående på dig, siger Patrick Sheehan, en engelsk teknologiinvestor, til International Herald Tribune.
- Teknologien udvikles fortsat mest på universiteterne, men der findes rigtige firmaer (på området), der løser rigtige problemer. De laver ikke bare ren forskning, siger Sheehan.
Konsulenten Mills Davis mener de næste 12 måneder vil give de første eksempler på store strategiske investeringer i semantisk webteknologi.
- I 2007 vil de store teknologiselskaber begynde at købe firmaer, der arbejder på det semantiske område, siger han.
I Finland følges forskeren Hyvönens projekter med stor interesse af erhvervslivet. Hans Semantic Computing Research Group er startet med offentlig støtte, men 38 private virksomheder deltager også i projektet.
- Det kan blive et meget vigtigt område for erhvervslivet, og de virksomheder, der er tidligt ude, vil have et forspring, siger Hyvönen.
Så måske er det semantiske gennembrud virkelig på trapperne? Alexander Linden tvivler ikke på, at det semantiske web vil revolutionere vores forståelse af internettet, men han advarer mod at forvente mirakler her og nu.
- Det er en kæmpe mulighed, men det er også et felt, der udvikler sig langsomt, siger han:
- Jeg tror vi vil se et seismisk skift på området i løbet af de næste fem år.

bokse:
Internettets fader
og det semantiske web
Den legendariske Sir Tim var manden bag den første ­applikation, der gjorde det muligt at linke dokumenter på nettet, og er i den forstand en slags uofficiel fader til the World Wide Web.
Berners-Lee har i flere år agiteret for ideen om det semantiske web som han i en artikel i Scientific American i 2001 definerede på følgende måde:
- Det semantiske web videreudvikler det nuværende web på en måde, så information får en veldefineret betydning, der gør det lettere for computere og mennesker at arbejde sammen.
Hans forhåbninger til de opgaver, som denne videre­udvikling af nettet skal løse, lyder store, næsten utopiske:
- Denne struktur vil gøre menneskehedens viden og handlinger tilgængelig for softwareagenter, som skaber en ny klasse af værktøjer, der kan hjælpe os med at leve, arbejde og lære sammen.
Berners-Lee forudså på det tidspunkt, at det semantiske web ville få et gennembrud inden for tre til fire år. Man må dog sige, at han her har været lidt vel optimistisk. Selvom et voksende antal projekter anvender semantiske funktioner, vurderer de fleste iagttagere i dag, at vi skal frem til 2010, før man kan forvente et gennembrud på området.

Semantik på nettet
Tag en guidet tur på finske provinsmuseer med fuld database-funk­tionalitet, eller finkæm blog-universet med din semantiske browser. Det semantiske web er en vision, men der er mange hjemmesider, som - på den ene eller anden måde - forholder sig til, eller benytter sig af, semantiske teknologier:

Museosuomi.fi, eller MuseumFinland, en hjemmeside om finske museer, der indgår i et større finsk projekt med at udvikle en national semantisk infrastruktur på nettet.
BigBlogZoo.com er en slags prototype på en semantisk webbrowser, der blandt andet kan søge i de myriader af weblogs, eller blogs, hvor borgerjournalister og andet godtfolk skriver på nettet om alt mellem himmel og jord.
Dublincore.org er en uafhængig, international organisation, der arbejder på at skabe åbne, fælles standarder for anvendelsen af metadata på det semantiske web.
Sekt-project.org er et EU-støttet projekt om semantiske videnteknologier. Programmet løber frem til 2007 og har blandt andet oprettet en undervisningsportal med en stribe videoprogrammer, der gennemgår forskellige aspekter af det semantiske web.

Google Base er første skridt
Et af de nye web-initiativer, der anvender semantiske webfunktioner, er Google Base. Det er en slags brugergenereret database, der kan bruges til alt fra deling af opskrifter til salg af biler. Brugerne kan selv beskrive det indhold, de lægger i databasen, ved hjælp af nøgleord, hvilket kan gøre det langt lettere at søge præcist. Man kan sige, at Google Base anvender nogle af det semantiske webs tilgange, men på en platform, der er privat snarere end åben.

Lille ordbog over semantisk web-talk
I stedet for programmeringssproget Hyper Text Markup Language, HTML, der er grundlaget for dagens hjemmesider på nettet, arbejder det semantiske web med XML, eller Extensible Markup Language.
To datastandarder, kaldet Resource Description Framework (RDF) og Web Ontology Language (OWL), understøtter også det web, der kan læses af maskiner. Begge standarder er udviklet af World Wide Web Consortium.

På det semantiske web får hvert begreb tildelt en slags ‘adresse', kaldet en Universal Resource Identifier, eller URI. De URLer, eller Uniform Resource Locator, der i dag kendes fra adresser på internettet, er en undergruppe af URI'erne.

Et afgørende skridt i skabelsen af det semantiske web er oprettelsen af en slags fælles ordbøger for metadata - en forudsætning for at gøre siderne læsbare for maskiner. Disse fortegnelser, der også kaldes ontologier, giver, ifølge en udbredt definition, "en fælles forståelse af et givet domæne."

Det største og mest ambitiøse forsøg på at skabe et system af ontologier, primært til anvendelse inden for bibliotekssystemet, kendes under betegnelsen Dublin Core Metadata Initiative.

OriginalModTime: 07-07-2006 10:40:50




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Hewlett-Packard ApS
Udvikling og salg af software, hardware, konsulentydelser, outsourcing samt service og support.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere