Rensning af beskidte data tjener sig hjem

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 22. oktober 2004.


Datakvalitet er underprioriteteret, og det
koster dyrt, siger SAS Institute.
Datakvalitet
Las Vegas: Datakvalitet er omtrent lige så spændende som opvasken, indtil man begynder at regne på omkostningerne ved dårlig kvalitet af data.
En nylig analyse foretaget hos en international bank viste, at de store omkostninger i tid og penge til at få korrekte data frem ville tjene sig hjem fem-seks gange på første år.
Bag oplysningerne står softwarehuset SAS Institute, der ikke vil ud med kundens navn.
- Men beregningerne betød også, at banken nu har planer om at lade datakvalitet indgå som en af parametrene i vurderingerne af lønforhøjelser til den enkelte, siger Roger Shears, europæisk ansvarlig for udviklingen af SAS' forretning inden for Financial Intelligence - en helt ny softwarepakke, der har specielt fokus på økonomidirektørens behov for analyser og rapporter.
SAS taler om beskidte data, og det begreb dækker flere ting såsom dubletregistreringer som følge af, at et navn eller en adresse er stavet på en måde et sted og på en anden måde et andet sted. Ingen aner, at det er samme person, det gælder. Beskidte data er også, når der mangler information i et felt - en mangel, der kan gøre data ubrugelige som baggrund for analyser og beslutninger.

København i stedet for Kbh
Han er ikke bekendt med, at danske virksomheder har foretaget sådanne analyser, ej heller Jim Nielsen, marketingdirektør for SAS Institute i Danmark. Men de kan fortælle, at en større dansk koncern faktisk har fået ekstra fokus på datakvalitet på grund af opkøb og fusioner.
Koncernen vil sikre sig, at data fra de mange forskellige ERP-systemer (Enterprise Resource Planning) konsolideres rigtigt, selv om der har været benyttet forskellige betegnelser og begreber.
Jim Nielsen fortæller, at SAS i Danmark netop nu arbejder på at få en sprog/ begrebsdatabase på plads for den virksomhed, således at visse typer data pr. automatik kan rettes. I et dansk register skal "København" kun staves på den måde og ikke også som Kbh. I et britisk register er det "Copenhagen", der er gældende og så videre.
SAS' generelle software til håndtering af beskidte data kom på markedet tidligere i år, og ifølge Roger Shears sker rensningen i et vidt omfang pr. automatik.
- Men der vil være tilfælde, hvor der skal et menneskeligt øje til at afgøre, om der for eksempel er tale om en dublet eller ej, siger Shears.
Ifølge SAS har kun 30 procent af de amerikanske firmaer en politik for datakvalitet.

billedetekst:
SAS Institutes danske
afdeling arbejder på en sprog/begrebsdatabase for en større dansk koncern, fortæller marketingdirektør Jim Nielsen.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Advania Danmark A/S
Hardware, licenser, konsulentydelser

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere