Nyt net bygges på danske Wikipedia

Information.dk lancerer det semantiske web, der lader data og tilhørende metadata flyde sammen for at give mening for læseren.

Danske Wikipedia bliver ofte beskyldt for at være en bleg kopi af den engelske moder-udgave. Men nu får de danske Wikipedia-skribenter en hjælpende hånd, der måske kan sætte gang i leksikonet - og få de flygtende læsere til at vende hjem.

Dagbladet Information har taget hul på et ambitiøst projekt om at sætte data i system. Det indebærer blandt andet, at informationer fra Wikipedia og andre aviser og databaser bliver trukket ind på avisens hjemmeside.

Missionen er kort sagt at træde ind i det semantiske web. Idéen om at data kan tale sammen på kryds og tværs.

Ved hjælp af sprogteknologi bliver alle artikler opmærket semantisk. Det betyder, at ord som Barack Obama og Søren Gade ikke bare er simpelt tekst. De bliver automatisk autotagget med metadata, så de kan indgå i andre sammenhænge og forbindes til eksisterende databaser og artikler.

Konkret betyder det, at Information har skabt 40.000 emnesider om personer, organisationer, steder og emner. Man kommer ind på emnesiderne via en boks i toppen af de fleste artikler. Se for eksempel oversigterne over Dronning Margrethe og Island.  

Er Wikipedia god nok
Men Wikipedia DK bliver ofte kritiseret for at være langsom og lille sammenlignet med andre Wikipedia-sider. Er det ikke farligt at basere en tjeneste på danske Wikipedia?

»Jeg har selv været en hård kritiker af det danske Wikipedia. Men vi gør meget for at opfordre folk til at bidrage til Wikipedia. Så jeg håber, at vi via det her projekt kan bidrage til, at der kommer mere indhold på Wikipedia. Men faktisk er Wikipedia ret hurtig på nyhedsfronten. For eksempel blev der hurtigt opstartet en kategori med ”lømmelpakken”. Men det er klart, at når man ser på historiske opslag, så har Wikipedia sine svagheder,« siger Nikolai Thyssen, der er chef for digitalt indhold på Information til ´CRN's søstersite ComON.

Men det er heller ikke Wikipedia alene, der skal sætte artikler i kontekst hos Information.

Information henter også data fra Dbpedia, det engelske Wikipedia og Geonames. Og brugen af Open Linked Data betyder også, at Informations artikler kan komplimenteres af artikler fra New York Times, der også anvender Open Linked Data.

»Fremover kan vi kombinere vores egen dækning af eksempelvis krigen i Irak med New York Times' dækning og lang række andre kilder. Brugerne vil opleve, at vi ikke blot skriver nyheder fra dag til dag, men sætter disse i sammenhæng og skaber viden, der giver mening og indsigt,« uddyber Nikolai Thyssen. Men når man ser på funktionen, så minder den meget om det vi kender som ”relaterede artikler” eller ”læs mere”.

»Jeg kan godt følge påstanden, men man skal forstå, at det her handler om metadata. Det er meget mere end at linke videre til gamle artikler. Det her giver helt nye muligheder. Vi er jo først lige begyndt, men snart kan vi forbinde vores artikler med CIA World Factbook og på den måde vil man for eksempel kunne bede om at se, hvilke artikler vi har skrevet om de 10 fattigste lande i de sidste 14 dage,« forklarer Nikolai Thyssen.

»Det er rigtig sjovt at lege med berigede metadata, for det er noget, som brager af sted i udlandet. For eksempel i det engelske med OpenCalais. Men det er skidesvært at opbygge og uforholdsmæssigt dyrt for et lille sprogområde som Danmark, så vi håber, at vi med vores projekt kan være med til at skabe en standard,« siger Nikolai Thyssen.

Information vil snart give omverdenen adgang til emnekataloget via api'er. Senere vil avisen også lave en professionel løsning til andre medier.

Ifølge Information er den danske avis blot den tredje i verden, der succesfuldt har indbygget forbundne data. De andre er BBC og The New York Times.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Despec Denmark A/S
Distributør af forbrugsstoffer, printere, it-tilbehør, mobility-tilbehør, ergonomiske produkter, kontor-maskiner og -tilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Dinner Roundtable: Sikre og skalerbare løsninger til den moderne komplekse infrastruktu

Traditionelle IT-sikkerhedsløsninger, såsom VPN'er, er ikke længere tilstrækkelige for de avancerede sikkerhedsbehov og kompleksiteten i moderne virksomheder. Det norske nationale cybersikkerhedscenter anbefaler derfor nu at erstatte SSLVPN/WebVPN-løsninger på grund af sårbarheder.

18. september 2024 | Læs mere


Nye forretningsmæssige gevinster med Microsoft Dynamics 365

Eksperter fra CGI stiller skarpt på hvordan, du lærer også hvorfor det er vigtigt at have fokus på både processer, teknologi og mennesker - og hvordan du kommer i gang med løbende optimering af forretningsudvikling.

25. september 2024 | Læs mere


NIS2: Indhold, krav og konsekvenser- sidste chance for at blive klar

Vi sætter på denne dag fokus på hvad NIS2-direktivet kommer til at betyde for din organisation. Du et overblik over direktivet og de skærpede krav, så du undgår bøder og sanktionering.

26. september 2024 | Læs mere