Open source-projekt skal lokke danske hjemmesider til at dyppe tæerne i det semantiske web

Information.dk deler sine erfaringer på Tagger.dk.

Helt tilbage i 2003 begyndte web-pioneren Tim Berners-Lee at drømme om internettets næste skridt - det semantiske web. Men det lader stadig vente på sig i den form, som Bernes-Lee forventer.

Men de første spadestik er taget. I denne uge blev der taget et på dansk jord.

Tagger.dk, der udspringer af erfaringer fra avisen Information, blev tilgængelig for omverdenen i open source-klæder. 

Det semantiske net betyder, at nettet bliver så intelligent, at det kan se sammenhænge og ikke kun enkeltstående ord. For eksempel at søgemaskiner skal kunne kende forskel på ordet Kashmir alt efter om det står i relation til stoffet, regionen eller rockbandet.
På et højere niveau vil det semantiske net gøre systemer i stand til at tale sammen på tværs af systemer.

Tagger.dk udspringer af Informations eget projekt, der gik i gang sidste år, som gør det let at binde artikler sammen med tidligere artikler eller offentlige opslagsværker.

Hvad er der sket siden sidst?

"Vi har abstraheret projektet ud af vores eget system, så andre kan bruge det. Før var det meget knyttet til vores CMS. Der var ikke så meget automatisering af tags. Nu kan man finde tags i løbende tekst," Johannes Wehner, der er en af udviklerne på projektet.

På Tagger.dk kan man hente de datasæt, som Information har opbygget og bruger. Det er dog primært knyttet til personer, organisationer og firmaer. Tanken er, at Tagger-projektet skal skabe et open source-miljø omkring datasæt, så det bliver let at dele og opdatere. Lige nu er den automatiske opmarkering af ord tilgængeligt i en webservice, men der arbejdes netop nu på at gøre Tagger til et bibliotek, som kan bruges enten i en webservice eller i fx et Drupalmodul.

"Det skal gerne være teknologiuafhængigt. Men det er klart, at der er stærke bindinger til Drupal i første omgang, når projektet er vokset ud af Information, hvor vi er lidt Drupal-forelskede. Men vi er allerede gået fra at tilbyde det som en webservice til at gøre det tilgængeligt via et bibliotek så folk kan have det kørende lokalt. Det er netop for at blive så uafhængige af platformen," siger Johannes Wehner.

Tagger.dk er inspireret af OpenCalais, der er et lignende projekt, som dog kun knytter til det engelske sprog. Center for Sprogteknologi på Københavns Universitet har bidraget til Tagger.

Se mere på tagger.dk.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
itm8 A/S
Outsourcing, hosting, decentral drift, servicedesk, konsulentydelser, salg og udleje af handelsvarer, udvikling af software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
PCI og cloud-sikkerhed: Strategi til beskyttelse af betalingsdata

Er din organisation klar til de nye PCI DSS 4.0-krav? Deltag i vores event og få indsigt i, hvordan du navigerer i compliance-udfordringerne i en cloud-drevet verden.

16. januar 2025 | Læs mere


Strategisk It-sikkerhedsdag 2025, Aarhus: Viden om trusler og tendenser – Beskyt din virksomhed

Gå ikke glip af årets vigtigste begivenhed for it-sikkerhedsprofessionelle! Mød Danmarks førende eksperter, deltag i inspirerende diskussioner og få praktisk erfaring med de nyeste teknologier. Bliv klogere på de seneste trusler og lær, hvordan du bedst beskytter din virksomhed mod cyberangreb. Tilmeld dig nu og vær på forkant med fremtidens cybersikkerhedsudfordringer.

21. januar 2025 | Læs mere


Strategisk It-sikkerhedsdag 2025, København: Viden om trusler og tendenser – Beskyt din virksomhed

Gå ikke glip af årets vigtigste begivenhed for it-sikkerhedsprofessionelle! Mød Danmarks førende eksperter, deltag i inspirerende diskussioner og få praktisk erfaring med de nyeste teknologier. Bliv klogere på de seneste trusler og lær, hvordan du bedst beskytter din virksomhed mod cyberangreb. Tilmeld dig nu og vær på forkant med fremtidens cybersikkerhedsudfordringer.

23. januar 2025 | Læs mere