Virksomheder jager de rene data

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 24. oktober 2003.


Manglen på kvalitetsdata er det største problem for virksomheder, der benytter data mining. En undersøgelse viser, at kun hver femte har en klar koncernstrategi på området, og konsekvensen er upålidelige resultater i de analyser, der skulle hjælpe virksomheden med at manøvrere.

Når organisationen: "Ældre for bedre fortov" bliver ved med at sende breve til din bolig stilet til en person, der ikke har boet der de sidste ti år, og som i øvrigt har været død de sidste fem, er det et eksempel på en organisation med dårlig datakvalitet.
Når du konsekvent får det dobbelte antal reklamer fra Blålyseville boligmontering, den ene stilet til hr. Madsen, den anden til hr. Maddsen, er det eksempel på en virksomhed med rod i dataen.
For deres pågældende organisation og virksomhed er konsekvensen muligvis ikke andet end spildt porto. Havde samme virksomhed og organisation investeret i data mining som et centralt beslutningsværktøj, ville situationen imidlertid være mere graverende.
- Det absolut væsentligste problem for virksomheder, der benytter data mining i dag, er manglen på kvalitetsdata.
Sådan siger Michael Borges, administrerende direktør for business intelligence konsulenthuset Platon.
- Konsekvensen af dårlig informationskvalitet er, at virksomheden får problemer med at skabe pålidelig styringsinformation ud af data mining-processen og de efterfølgende analyser.
Ifølge en rundspørge foretaget af analysehuset Forrester i foråret, er det kun omkring hver femte virksomhed, der benytter data mining, som har en klart formuleret politik til kvalitetssikring af data. Yderligere 20 procent har det slet ikke prioriteret eller lader det være op til den enkelte, som skal benytte systemet. Ind imellem findes den store gruppe af virksomheder, som har politikker varierende fra afdeling til afdeling.

Affald ind....
Virksomhedernes problemer med at skabe en formaliseret kvalitetskontrol genkender Michael Borges.
- Flere steder mangler der en erkendelse af, at dataenes kvalitet er det afgørende. Muligvis fordi, der er en tendens til, at data mining-løsninger sælges som vidundere, der kan spytte den ene mirakuløse forudsigelse ud efter den anden, uden megen indblanding. Men groft sagt er data mining-værktøjer bare nogle statistiske modeller, kombineret med noget kunstig intelligens. Resultaterne af data mining bliver kun så gode som kvaliteten af de data, der laves analyser på. Hvis det er affald, så er det også affald, der kommer ud i den anden ende, siger han.
Hos Danske Bank, hvor man bruger data mining til blandt andet CRM og kreditrisikoanalyser, er man imidlertid yderst opmærksom på værdien og betydningen af datakvalitet. Analyser på forkerte eller forældede data på kreditområdet kan betyde, at banken påtager sig en uhensigtsmæssig stor risiko.
- Vi sikrer kvaliteten løbende gennem en lang række datakvalitetsrutiner, som vi kører løbende, og som vi udbygger løbende, baseret på vores erfaringer, og vi har kvalitetsikringsteams i organisationen, siger it-udviklingschef, Bent Hansen.
Han mener imidlertid ikke, at en fast formaliseret politik nødvendigvis er den bedste vej til god datakvalitet.
- Det er vores erfaring, at man ikke kan sætte sig ned og definere alle problemområder fra starten. Det er informationer, man får gennem opgaverne og projekterne. På den baggrund er det selvfølgelig vigtigt løbende at følge op og sørge for, at de bliver indarbejdet i systemet, men man kan ikke sidde og drømme sig til de ting på forhånd. Det er noget der skal udvikles løbende, siger han.

Systemkompleksitet i vejen
Definitionen på begrebet kvalitetsdata vil variere fra virksomhed til virksomhed, men som udgangspunkt handler det om, at data afspejler virksomhedens virkelighed så korrekt som muligt. Det betyder, at de skal være opdaterede, renset for dubletter, struktureret ens, for det er begrænset hvor interessante sammenhænge data mining-systemerne kan finde, hvis det eneste der er at "mine" på, er kundens navn og adresse. Alt sammen er det store opgaver at løse for virksomheden og systemerne. Det er imidlertid ikke nok, for kvalitetsdata handler også om at få dem placeret rigtigt. Og ifølge konsulent Gorm Lykke Østergaard fra PA Consulting Group, volder det specielt de store virksomheder besvær.
- Det er en problemstilling, der har eksisteret længe, og den er ikke blevet mindre af, at mængden af data stiger eksplosivt. Der kommer hele tiden nye applikationer, gamle applikationer bliver lukket ned, og i midten af det hele skal du have et "single point of information", et data warehouse, der samler alle trådene, alle informationerne fra systemerne, og det er en vanvittig stor opgave, siger han.
Det problem kender man udmærket hos mobilselskabet Orange. Som andre teleselskaber er Orange gode kunder hos leverandørerne af data mining-produkterne. Fra at være virksomheder med et produkt (tale), og en enkelt kundebase (dem, der taler), har teleselskaberne i løbet af de seneste fem år oplevet en udvikling, hvor produktpaletten stiger i kompleksitet, kunderne segmenterer sig i det uendelige og er mere illoyale end nogensinde. Faktorer, der lægger pres på virksomhedens kunderelationer, og hvor data mining nu spiller en central rolle.
- At sørge for at man analyserer på den rigtige data er helt centralt - det er også en utrolig svær opgave, siger Søren Abildgaard, ansvarlig for Oranges relationship-marketing afdeling, der foretager CRM aktiviteter.
- Vi får vores informationer fra rigtig mange systemer, der alle spiller sammen, så data ligger desværre ikke bare et sted, men skal hentes ind i vores data warehouse fra mange forskellige lokationer, og det største problem er at holde trit med, hvor nye dataene er, hvor tit bliver de egentlig opdateret, for det sker ude i de enkelte afdelinger. Det er en problemstilling, vi arbejder med hele tiden. Der har været data, som vi har opdateret en gang om måneden, men som vi faktisk havde behov for at få opdateret dagligt. Det er den slags, man finder ud af, når man begynder at arbejde med tingene, siger han.
At datakvalitet er blevet et centralt emne for virksomhederne i jagten på succes understreges af en ny rapport fra analysehuset Meta Group. Ifølge analysehuset vil salget af værktøjer til datakvalitetsikring stige med 30 procent årligt, de næste tre til fem år.

billedtekst:
- Der er en tendens til, at data mining-løsninger sælges som vidundere, der kan spytte den ene mirakuløse forudsigelse ud efter den anden. Men groft sagt er data mining-værktøjer bare nogle statistiske modeller, kombineret med noget kunstig intelligens, siger Michael Borges, Platon.

citater:
Danske Bank
- Vi sikrer kvaliteten løbende gennem en lang række datakvalitetsrutiner, som vi kører løbende, og som vi udbygger løbende, og vi har kvalitetssikringsteams.
Bent Hansen, Danske Bank

Orange
- At sørge for, at man analyserer på de rigtige data er helt centralt - det er også en utrolig svær opgave.
Søren Abildgaard, Orange

PA Consulting Group
- At have den rette kvalitet af data er en problemstilling, der har eksisteret længe, og den er ikke blevet mindre af, at mængden af data stiger eksplosivt.
Gorm Lykke Østergaard, PA Consulting Group

Platon
- Resultaterne af data mining bliver kun så gode som kvaliteten af de data, der laves analyser på. Hvis det er affald, så er det også affald, der kommer ud i den anden ende.
Michael Borges, Platon




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Ed A/S
Salg af hard- og software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere