XML-database som mediearkiv

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den CTO d. 1. september 2006.


arkiv Ritzaus Bureau skiftede sin artikeldatabase ud med et standardbaseret mediearkiv for at opnå større fleksibilitet.

XML bliver i stigende grad anvendt til at definere dataformater i forskellige brancher. Brancheorganisationen International Press Telecommunications Council (IPTC) har eksempelvis udviklet en standard, der kan anvendes til at udveksle nyhedspakker i en verden, hvor nyheder i stigende grad er multimediebaserede. IPTC varetager verdenspressens interesser med hensyn til elektronisk udveksling af nyheder og har blandt andet defineret standarden NewsML. Ved hjælp af den kan nyhedsbureauer pakke nyhedstekst sammen med grafik, lyd, billede og video og sende det til aftagerne.
I Danmark er Ritzaus Bureau langt fremme med anvendelsen af News­ML. Ritzaus Bureau ejes i fællesskab af de danske dagblade og leverer nyheder til de fleste aviser og tv-stationer i Danmark,
- Kunderne i dag forventer et mere avanceret format end et simpelt telegram-format. Med NewsML har vi en nyhedspakke indeholdende grafik, billeder, lydklip, video og weblinks, siger Ulrik Arndt Schack, kommerciel direktør hos Ritzaus Bureau.
Bureauet anvender Lotus Notes som kerne i det redaktionelle system, hvor journalisterne skriver deres nyheder. I foråret 2003 startede en større opgradering af det redaktionelle system, så det blandt andet kunne håndtere og sammenbinde forskellige multimedieformater.
Som arkiv for nyhedsartiklerne havde Ritzaus Bureau hidtil benyttet databasen BRS/Search. Grundet usikkerhed om supporten på det produkt begyndte man at se sig om efter et alternativ.
- Firmaet bag det gamle BRS/Search havde været igennem en del opkøb og var endt hos Opentext. Organisationen i Danmark blev mindre og mindre, og til sidst forsvandt den helt. Vi var derfor henvist til support fra udlandet, hvilket vi fandt uholdbart, siger Ulrik Arndt Schack.

Via et brancheseminar kom Ritzaus Bureau i kontakt med Software AG, der står bag XML-databasen Tamino. Da standarden bygger på XML, var Tamino oplagt at anvende som arkiv for NewsML.
- En Oracle-database eller en Microsoft SQL Server kan også håndtere XML, men til vores formål ville det være mere besværligt at anvende dem frem for Tamino, siger Ulrik Arndt Schack.
Lars Moestrup, konsulentchef hos Software AG, var med til at implementere arkivløsningen. Selve projektet bestod af tre dele: Etablering af skema, konvertering af de eksisterende 1,9 millioner telegrammer i BRS/Search til NewsML og endelig udvikling af en brugergrænseflade til arkivet.
- Hvor man i en relationel database definerer tabeller, nøgler og så videre, definerer man i en XML-database et skema. Skemaet, som vi udviklede sammen med Ritzau, baserer sig på NewsML og NITF (News Industry Text Format), forklarer Lars Moestrup.
Hvor NewsML er standarden for en nyhedspakke, er NITF en standard for selve nyhedsteksten. Ved lagring af nyhedspakker i Tamino anvender Ritzaus Bureau i dag en kombination af de to standarder.
Da skemaet for XML-databasen var klar, skulle de eksisterende telegrammer i BRS/Search konverteres til det nye format.
- Konverteringen af 1,9 millioner telegrammer, i alt 10 gigabyte, var den største del af opgaven. I løbet af de 18 år, Ritzau har anvendt det proprietære format, havde formatet ændret sig, så der skulle tages højde for forskellige standarder i BRS/Search. Vores konverteringsprogram skulle tilpasses, og vi lavede omfattende aftestning, så vi var sikre på, at alle telegrammer kom med. Især tabeller med sportsresultater var noget af en opgave, fortæller Lars Moestrup.
Konverteringsprogrammet lavede omfattende logning af konverteringen, så det efterfølgende kunne undersøges, hvordan konverteringen var forløbet. Da konverteringen var overstået, lavede projektgruppen sammenlignende søgninger mellem det gamle BRS/Search og det nye XML-baserede arkiv.

Artikelarkivet er et vigtigt arbejdsredskab for Ritzaus Bureaus journalister, så der blev lagt vægt på en brugervenlig grænseflade til det nye arkivsystem.
- Derfor stillede vi store krav til brugervenlighed. Det skulle være nemt og enkelt at søge efter artikler, siger Ulrik Arndt Schack.
Det er imidlertid ikke kun Ritzaus Bureaus egne journalister, der anvender arkivet. For kunderne er muligheden for at søge i artikel-arkivet en vigtig del af den servicepakke, som bureauet tilbyder. Derfor havde de også adgang til det gamle arkivsystem via en webportal. Desværre fungerede integrationen mellem webportalen og BRS/Search ikke så godt.
- Søgningerne var ustabile, og det kunne ske, at søgningerne på den eksterne del timede ud. For journalisterne internt fungerede det fint nok, men for vores kunder, der fik adgang gennem portalen, var der tale om stærkt varierende kvalitet, forklarer Ulrik Arndt Schack. Med det nye system er der rettet op på den varierende kvalitet. En webbaseret brugergrænseflade til arkivet er blevet udviklet i ASP.NET.
I det gamle system foregik den eksterne adgang til en replikeret database, der blev opdateret en gang i døgnet fra BRS/Search. Med det nye system anvendes den samme database til både ekstern og intern adgang - og der er ingen problemer med svartider. Ved hjælp af et autorisationssystem skelnes der mellem interne og eksterne brugere. De eksterne brugere har ikke lov til at se alle data. Hvilke data de enkelte brugere har lov at se, defineres på feltniveau.

Faktaboks:

Fra tekst til multimedier
Brancheorganisationen International Press Telecommunications Council (IPTC) har defineret en række standarder for udveksling af nyheder. Den ældste er IPTC7901, som blev lanceret i starten af 1980'erne. Der er tale om et rent tekstformat. Det seneste format er det XML-baserede NewsML (News Markup Language) som kan indeholde multimediedata.
XML-databaserne og fremtiden
Selv om XML-baserede databaser udgør under en procent af det samlede databasemarked, ser Software AG med optimisme på det fremtidige salg af Tamino.
Eksempelvis er Erhvervs- og Selskabsstyrelsen ved at gøre sig klar til at modtage XBRL-regnskaber med Tamino. Derudover er et par andre nyhedsbureauer på bedding.
XML og branchestandarder
XML er en generel standard, som kan anvendes til at lave specifikke standarder. I de enkelte brancher er der defineret specielle standarder ved hjælp af XML-skemaer. Eksempelvis NewsML i nyhedsbranchen og XBRL (Extensible Business Reporting Language) i forbindelse med regnskaber.

XBRL er en international standard, men regnskabsaflæggelse i Danmark er forskellig fra andre lande grundet lovmæssige forhold. XBRL i Danmark er derfor én variant, mens Tyskland anvender en anden variant af XBRL.

XML-standarder kan også anvendes til at kæmpe om et marked. Det ses eksempelvis på kontorpakke-området. Her sidder Microsoft solidt på markedet og har hidtil ikke været meget for at anvende OpenDocument (ODF)-standarden i sin Office-pakke. I stedet har Microsoft introduceret Open XML-format i Office-pakken. Microsoft meddelte dog den 6. juli, at de vil lave et værktøj, der gør det muligt at anvende ODF-dokumenter i Office-pakken.

Billedtekst:

format - Kunderne i dag forventer et mere avanceret format end et simpelt telegram-format. siger Ulrik Arndt Schack, kommerciel direktør hos Ritzaus Bureau.
Foto: Hans Juhl

OriginalModTime: 14-09-2006 10:40:08




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Ed A/S
Salg af hard- og software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Industry 4.0 – sådan udnytter du AI og digitalisering til optimering af din produktion.

På denne konference fokuserer på en digitaliseret optimering af processer i produktions- og procesorienterede virksomheder. Herved bliver du f.eks. i stand til at kombinere maskiner med sales forecasting og derved planlægge anvendelsen af produktionsapparat og medarbejderallokering effektivt – samt begrænse materialespild og nedetid ved at optimere produktionsplanlægning og omstilling af produktionsmateriel.

04. september 2024 | Læs mere


Roundtable for sikkerhedsansvarlige: Hvordan opnår man en robust sikkerhedsposition?

For mange virksomheder har Zero Trust og dets principper transformeret traditionelle tilgange til netværkssikkerhed, hvilket har gjort det muligt for organisationer at opnå hidtil usete niveauer af detaljeret kontrol over deres brugere, enheder og netværk - men hvordan implementerer man bedst Zero Trust-arkitekturer i et enterprise set up? Og hvordan muliggør Zero Trust-arkitekturen, at organisationer opnår produktivitetsfordele med AI-værktøjer samtidig med, at de forbliver sikre i lyset af fremvoksende trusler?

18. september 2024 | Læs mere


Nye forretningsmæssige gevinster med Microsoft Dynamics 365

Eksperter fra CGI stiller skarpt på hvordan, du lærer også hvorfor det er vigtigt at have fokus på både processer, teknologi og mennesker - og hvordan du kommer i gang med løbende optimering af forretningsudvikling.

25. september 2024 | Læs mere