Open source-projekt skal lokke danske hjemmesider til at dyppe tæerne i det semantiske web

Information.dk deler sine erfaringer på Tagger.dk.

Helt tilbage i 2003 begyndte web-pioneren Tim Berners-Lee at drømme om internettets næste skridt - det semantiske web. Men det lader stadig vente på sig i den form, som Bernes-Lee forventer.

Men de første spadestik er taget. I denne uge blev der taget et på dansk jord.

Tagger.dk, der udspringer af erfaringer fra avisen Information, blev tilgængelig for omverdenen i open source-klæder. 

Det semantiske net betyder, at nettet bliver så intelligent, at det kan se sammenhænge og ikke kun enkeltstående ord. For eksempel at søgemaskiner skal kunne kende forskel på ordet Kashmir alt efter om det står i relation til stoffet, regionen eller rockbandet.
På et højere niveau vil det semantiske net gøre systemer i stand til at tale sammen på tværs af systemer.

Tagger.dk udspringer af Informations eget projekt, der gik i gang sidste år, som gør det let at binde artikler sammen med tidligere artikler eller offentlige opslagsværker.

Hvad er der sket siden sidst?

"Vi har abstraheret projektet ud af vores eget system, så andre kan bruge det. Før var det meget knyttet til vores CMS. Der var ikke så meget automatisering af tags. Nu kan man finde tags i løbende tekst," Johannes Wehner, der er en af udviklerne på projektet.

På Tagger.dk kan man hente de datasæt, som Information har opbygget og bruger. Det er dog primært knyttet til personer, organisationer og firmaer. Tanken er, at Tagger-projektet skal skabe et open source-miljø omkring datasæt, så det bliver let at dele og opdatere. Lige nu er den automatiske opmarkering af ord tilgængeligt i en webservice, men der arbejdes netop nu på at gøre Tagger til et bibliotek, som kan bruges enten i en webservice eller i fx et Drupalmodul.

"Det skal gerne være teknologiuafhængigt. Men det er klart, at der er stærke bindinger til Drupal i første omgang, når projektet er vokset ud af Information, hvor vi er lidt Drupal-forelskede. Men vi er allerede gået fra at tilbyde det som en webservice til at gøre det tilgængeligt via et bibliotek så folk kan have det kørende lokalt. Det er netop for at blive så uafhængige af platformen," siger Johannes Wehner.

Tagger.dk er inspireret af OpenCalais, der er et lignende projekt, som dog kun knytter til det engelske sprog. Center for Sprogteknologi på Københavns Universitet har bidraget til Tagger.

Se mere på tagger.dk.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Konica Minolta Business Solutions Denmark A/S
Salg af kopimaskiner, digitale produktionssystemer og it-services.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
SAP Excellence Day 2025

Hvordan du orkestrerer og opdeler SAP-projekter for at opnå gevinster hurtigere? Hvordan påvirker AI fremtiden for SAP i almindelighed og måske også din virksomhed? Dette er blot nogle af de svar du får ved at deltage på denne spændende konference.

03. april 2025 | Læs mere


Cyber Briefing: Backup, availability og disaster recovery

I en tid hvor truslerne mod it-driften kun vokser, er det afgørende at kende forskellen på backup, availability og disaster recovery. Deltag og få konkret viden og praksisnære eksempler på, hvordan I kan styrke jeres beredskab.

07. april 2025 | Læs mere


Cyberthreat Day, København: Trusler, angreb og forsvar i praksis

Stå rustet mod cybertrusler. Få et detaljeret overblik over de nyeste sårbarheder, angrebsmønstre og metoder, som cyberkriminelle anvender. Lyt til beretninger fra sikkerhedseksperter på den digitale frontlinje, og få indsigt i både succesfulde angreb og de, der blev afværget

08. april 2025 | Læs mere