Open source-projekt skal lokke danske hjemmesider til at dyppe tæerne i det semantiske web

Information.dk deler sine erfaringer på Tagger.dk.

Helt tilbage i 2003 begyndte web-pioneren Tim Berners-Lee at drømme om internettets næste skridt - det semantiske web. Men det lader stadig vente på sig i den form, som Bernes-Lee forventer.

Men de første spadestik er taget. I denne uge blev der taget et på dansk jord.

Tagger.dk, der udspringer af erfaringer fra avisen Information, blev tilgængelig for omverdenen i open source-klæder. 

Det semantiske net betyder, at nettet bliver så intelligent, at det kan se sammenhænge og ikke kun enkeltstående ord. For eksempel at søgemaskiner skal kunne kende forskel på ordet Kashmir alt efter om det står i relation til stoffet, regionen eller rockbandet.
På et højere niveau vil det semantiske net gøre systemer i stand til at tale sammen på tværs af systemer.

Tagger.dk udspringer af Informations eget projekt, der gik i gang sidste år, som gør det let at binde artikler sammen med tidligere artikler eller offentlige opslagsværker.

Hvad er der sket siden sidst?

"Vi har abstraheret projektet ud af vores eget system, så andre kan bruge det. Før var det meget knyttet til vores CMS. Der var ikke så meget automatisering af tags. Nu kan man finde tags i løbende tekst," Johannes Wehner, der er en af udviklerne på projektet.

På Tagger.dk kan man hente de datasæt, som Information har opbygget og bruger. Det er dog primært knyttet til personer, organisationer og firmaer. Tanken er, at Tagger-projektet skal skabe et open source-miljø omkring datasæt, så det bliver let at dele og opdatere. Lige nu er den automatiske opmarkering af ord tilgængeligt i en webservice, men der arbejdes netop nu på at gøre Tagger til et bibliotek, som kan bruges enten i en webservice eller i fx et Drupalmodul.

"Det skal gerne være teknologiuafhængigt. Men det er klart, at der er stærke bindinger til Drupal i første omgang, når projektet er vokset ud af Information, hvor vi er lidt Drupal-forelskede. Men vi er allerede gået fra at tilbyde det som en webservice til at gøre det tilgængeligt via et bibliotek så folk kan have det kørende lokalt. Det er netop for at blive så uafhængige af platformen," siger Johannes Wehner.

Tagger.dk er inspireret af OpenCalais, der er et lignende projekt, som dog kun knytter til det engelske sprog. Center for Sprogteknologi på Københavns Universitet har bidraget til Tagger.

Se mere på tagger.dk.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Jobindex Media A/S
Salg af telemarketing og research for it-branchen, it-kurser og konferencer

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Strategisk It-sikkerhedsdag 2025, København: Viden om trusler og tendenser – Beskyt din virksomhed

Gå ikke glip af årets vigtigste begivenhed for it-sikkerhedsprofessionelle! Mød Danmarks førende eksperter, deltag i inspirerende diskussioner og få praktisk erfaring med de nyeste teknologier. Bliv klogere på de seneste trusler og lær, hvordan du bedst beskytter din virksomhed mod cyberangreb. Tilmeld dig nu og vær på forkant med fremtidens cybersikkerhedsudfordringer.

23. januar 2025 | Læs mere


Skab værdi med produktkonfiguration i Dynamics 365

Deltag i dette webinar og lær, hvordan du kan skabe øget værdi gennem produktkonfiguration med Microsoft Dynamics 365 standard konfigurator og Easy Creator. Eksperter fra CGI vil dele deres indsigt i, hvordan produktkonfiguration kan optimere processer, forbedre kvalitet og øge kundetilfredshed.

05. februar 2025 | Læs mere


Sådan automatiserer du med Copilot

Høst fordelene og sæt strøm til processerne med Microsofts alsidige AI-assistent.

06. februar 2025 | Læs mere






White paper
SAP: Skab værdi og minimér omkostninger med effektiv dokumenthåndtering