Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 22. oktober 2004.
Datakvalitet er underprioriteteret, og det
koster dyrt, siger SAS Institute.
Datakvalitet
Las Vegas: Datakvalitet er omtrent lige så spændende som opvasken, indtil man begynder at regne på omkostningerne ved dårlig kvalitet af data.
En nylig analyse foretaget hos en international bank viste, at de store omkostninger i tid og penge til at få korrekte data frem ville tjene sig hjem fem-seks gange på første år.
Bag oplysningerne står softwarehuset SAS Institute, der ikke vil ud med kundens navn.
- Men beregningerne betød også, at banken nu har planer om at lade datakvalitet indgå som en af parametrene i vurderingerne af lønforhøjelser til den enkelte, siger Roger Shears, europæisk ansvarlig for udviklingen af SAS' forretning inden for Financial Intelligence - en helt ny softwarepakke, der har specielt fokus på økonomidirektørens behov for analyser og rapporter.
SAS taler om beskidte data, og det begreb dækker flere ting såsom dubletregistreringer som følge af, at et navn eller en adresse er stavet på en måde et sted og på en anden måde et andet sted. Ingen aner, at det er samme person, det gælder. Beskidte data er også, når der mangler information i et felt - en mangel, der kan gøre data ubrugelige som baggrund for analyser og beslutninger.
København i stedet for Kbh
Han er ikke bekendt med, at danske virksomheder har foretaget sådanne analyser, ej heller Jim Nielsen, marketingdirektør for SAS Institute i Danmark. Men de kan fortælle, at en større dansk koncern faktisk har fået ekstra fokus på datakvalitet på grund af opkøb og fusioner.
Koncernen vil sikre sig, at data fra de mange forskellige ERP-systemer (Enterprise Resource Planning) konsolideres rigtigt, selv om der har været benyttet forskellige betegnelser og begreber.
Jim Nielsen fortæller, at SAS i Danmark netop nu arbejder på at få en sprog/ begrebsdatabase på plads for den virksomhed, således at visse typer data pr. automatik kan rettes. I et dansk register skal "København" kun staves på den måde og ikke også som Kbh. I et britisk register er det "Copenhagen", der er gældende og så videre.
SAS' generelle software til håndtering af beskidte data kom på markedet tidligere i år, og ifølge Roger Shears sker rensningen i et vidt omfang pr. automatik.
- Men der vil være tilfælde, hvor der skal et menneskeligt øje til at afgøre, om der for eksempel er tale om en dublet eller ej, siger Shears.
Ifølge SAS har kun 30 procent af de amerikanske firmaer en politik for datakvalitet.
billedetekst:
SAS Institutes danske
afdeling arbejder på en sprog/begrebsdatabase for en større dansk koncern, fortæller marketingdirektør Jim Nielsen.