Open source-projekt skal lokke danske hjemmesider til at dyppe tæerne i det semantiske web

Information.dk deler sine erfaringer på Tagger.dk.

Helt tilbage i 2003 begyndte web-pioneren Tim Berners-Lee at drømme om internettets næste skridt - det semantiske web. Men det lader stadig vente på sig i den form, som Bernes-Lee forventer.

Men de første spadestik er taget. I denne uge blev der taget et på dansk jord.

Tagger.dk, der udspringer af erfaringer fra avisen Information, blev tilgængelig for omverdenen i open source-klæder. 

Det semantiske net betyder, at nettet bliver så intelligent, at det kan se sammenhænge og ikke kun enkeltstående ord. For eksempel at søgemaskiner skal kunne kende forskel på ordet Kashmir alt efter om det står i relation til stoffet, regionen eller rockbandet.
På et højere niveau vil det semantiske net gøre systemer i stand til at tale sammen på tværs af systemer.

Tagger.dk udspringer af Informations eget projekt, der gik i gang sidste år, som gør det let at binde artikler sammen med tidligere artikler eller offentlige opslagsværker.

Hvad er der sket siden sidst?

"Vi har abstraheret projektet ud af vores eget system, så andre kan bruge det. Før var det meget knyttet til vores CMS. Der var ikke så meget automatisering af tags. Nu kan man finde tags i løbende tekst," Johannes Wehner, der er en af udviklerne på projektet.

På Tagger.dk kan man hente de datasæt, som Information har opbygget og bruger. Det er dog primært knyttet til personer, organisationer og firmaer. Tanken er, at Tagger-projektet skal skabe et open source-miljø omkring datasæt, så det bliver let at dele og opdatere. Lige nu er den automatiske opmarkering af ord tilgængeligt i en webservice, men der arbejdes netop nu på at gøre Tagger til et bibliotek, som kan bruges enten i en webservice eller i fx et Drupalmodul.

"Det skal gerne være teknologiuafhængigt. Men det er klart, at der er stærke bindinger til Drupal i første omgang, når projektet er vokset ud af Information, hvor vi er lidt Drupal-forelskede. Men vi er allerede gået fra at tilbyde det som en webservice til at gøre det tilgængeligt via et bibliotek så folk kan have det kørende lokalt. Det er netop for at blive så uafhængige af platformen," siger Johannes Wehner.

Tagger.dk er inspireret af OpenCalais, der er et lignende projekt, som dog kun knytter til det engelske sprog. Center for Sprogteknologi på Københavns Universitet har bidraget til Tagger.

Se mere på tagger.dk.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Ed A/S
Salg af hard- og software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Hybrid, on-premise eller public cloud. Bliv klogere på fremtidens datacenter

Få indblik i, hvordan du planlægger, designer og drifter dit datacenter, så det kan følge med virksomhedens vækst, støtter bæredygtighedsindsatsen og lever op til krav om effektiv datahåndtering.

25. februar 2025 | Læs mere


Identity Festival 2025

Er du klar til en dag, der udfordrer din forståelse af, hvad Identity & Access Management (IAM) kan gøre for din organisation? En dag fyldt med indsigt, inspiration og løsninger, der sætter kursen for, hvordan vi arbejder med IAM i de kommende år.

05. marts 2025 | Læs mere


Tech Transformation Trends 2025

Tech Transformation Trends er konferencen, hvor vi sætter fokus på de helt store Danske virksomheders digitale transformationer og måden de driver virksomhed på. Dagen byder på cases og vidensdeling, der vil give inspiration som kan være med til at løfte din strategi og navigere i fremtidens digitale landskab.

06. marts 2025 | Læs mere






White paper
Sådan: Opgradér din printerløsning uden store investeringer