Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.
Data er overalt og bliver genereret af en lang række applikationer, digitale forretningsprocesser, mobile enheder og IoT-sensorer (Internet of Things).
Selv om stadig flere virksomheder høster og lagrer disse data i enorme datalakes og cloud data warehouses, forbliver meget af det desværre ubrugt.
Kun en brøkdel bevæger sig gennem de lange datakvalitets- og transformationsprocesser, der strukturerer data, så det kan bruges til BI-rapporter, dashboards og analyser.
For meget forbliver uudnyttet, og desværre er mange organisationer ikke i stand til at forberede og behandle data hurtigt eller godt nok til, at det kan bruges af forretningen til at forbedre de operationelle processer eller opbygge mere værdifulde kundeforhold.
I stedet sidder data fast i systemet. Og det er ikke gratis for ledelsen at mangle en strategi for udnyttelse af virksomhedens data.
Hvordan skaber man så en datastrategi, der giver en virksomhed langt bedre analyseredskaber og styrer data på tværs af hele virksomheden, så man for alvor kan blive en datadreven organisation?
Struktureret, ustruktureret, kendt og ukendt data i samhørighed
Kendt og struktureret data genereres af de traditionelle forretningsapplikationer, der blandt andet styrer økonomi og levering, og dem er de fleste allerede gode til at udnytte.
For det første skal man forstå, at data ikke kun er det, der allerede er defineret, struktureret og formateret til brug for business intelligence.
Struktureret data kan også være ukendt og komme fra de mange applikationer og platforme, som man som virksomhed køber sig adgang til, og som vokser i volumen dag for dag.
Det betyder, at en virksomhed i tiltagende grad har data, der befinder sig i disse applikationer og platforme, som datasiloer, som det er vigtigt at få fingre i og bruge aktivt.
Hertil kommer ustruktureret data fra sensorer, video, billedfiler, posts på de sociale medier og logfiler, som gør det hele endnu sværere.
Med denne data vil en organisation kunne få værdifulde indsigter.
De fem bud
I bund og grund har den ægte datadrevne organisation brug for at kunne koble kendt og ukendt, struktureret og ustruktureret data sammen i ét billede, så man kan se, hvad der driver hvad.
Her er et bud på fem mulige trin til at føre en virksomhed frem mod at blive en ægte datadreven organisation:
Trin 1: Avancerede dataanalyser skal vise datas indbyrdes forhold
For at kunne bruge de massive mængder af data konstruktivt til at opnå større indsigt i faktorer, der påvirker kundeadfærd, forsyningskæde, prisstruktur, osv. kræves der væsentligt mere end klassiske datarapporter, der holder sig til hver sit område.
Der er brug for viden om relationen mellem de forskellige sæt af data og hvilke hændelser, der udløser en given adfærd.
Det får man kun ved at kigge på datas indbyrdes relation i en samlet kontekst.
For eksempel: Så længe man ikke kobler kundens bevægelser før køb (hvilke produkter har de kigget på, har de læst andre kunders vurderinger og anbefalinger, osv.) sammen med konkrete handlinger (køb/forladt indkøbskurv, produktvurderinger), bliver man ikke klog på hvad der udløser handlingen.
For at kunne koble disse data sammen til et komplet billede, anbefales det at bruge vidensgrafer, der netop viser den indbyrdes afhængighed mellem denne implicitte og eksplicitte data.
Trin 2: Datakataloger forbedrer lokation, analyse og styring af data
Man bliver ikke særlig data-dreven som organisation, hvis brugerne har svært ved at lokalisere data, er i tvivl om, hvordan data defineres eller ikke ved, hvordan de forskellige dataelementer er relateret til emnet, for eksempel økonomi eller kampagneeffektivitet.
Et moderne, opdateret datakatalog samler data på metaniveau og sikrer, at det er den rigtige data, der bruges. Det er også her relationerne mellem data kan findes.
Trin 3: Find de svagheder i datastyringen, der påvirker dataparathed og -tillid
Styring af data er alfa og omega i den datadrevne organisation.
I dag handler datastyring om at definere regler og politiker for at beskytte og sikre sensitive data, men mange virksomheder er usikre på, om de gør det godt nok, når data samles, flyttes, kopieres, analyseres og deles.
Specielt når data skal ligge i skyen. For at sikre, at de ikke gør noget forkert, begrænser mange virksomheder brugernes adgang til BI-værktøjer og de datakilder, der er til rådighed. Til stor frustration for forretningen, selvfølgelig.
Den anden del af datastyring handler om at sikre at data er korrekt og af en god kvalitet.
Her bygger man sin Master Data Model, hvori det er muligt at definere såvel hvordan data skabes og hvordan det høstes.
Det er også her, at applikationernes ejerskab eller styring af data defineres.
Trin 4: Gør klar til effektive, fleksible og integrerede data
Data skal forberedes til forskellige typer af brugere og behov, og det kræver en længere proces af profilering, transformation, integration, rensning og berigelse, før den er klar.
Selvom de forskellige processer er afhængige af hinanden, bliver disse dataforberedelsesprocesser i praksis ofte afbrudt. Det skaber flaskehalse og ineffektivitet.
For at løse dette har en organisation brug for teknologier og praksis, der kan strikke hele sekvensen sammen uden at begrænse brugerens fleksibilitet.
Hertil bruges datakataloger til procesforbedring, master data management til datahåndtering og eventuelt DataOps til forbedret samarbejde om de helt store datasæt.
Trin 5: Moderniser pipelines af data til analytics og AI/ML med datakataloger og workflow automation
Forretningskritisk analytics og AI/ML kræver, at man kan håndtere de utroligt mange pipelines af data.
Nogle streamer data direkte ned i datasøer til brug for data scientists, mens andre har brug en systematisk håndtering af data.
Begge kan drage stor nytte af datakataloger, der hjælper med at lokalisere data hurtigt og guider mod den bedste data.
De mere moderne datakataloger kobler også AI, ML og automatisering på, så de kan håndtere de helt store datasæts.
Med workflow automatisering får man bedre styr på de forskellige workloads og de ofte komplekse og indbyrdes afhængige processer til klargøring af data.
Med få punkter som ovenstående, som vi også bruger i Boomi, kan virksomheder, der ønsker at blive ægte datadrevne, få større indsigt i, hvordan de forskellige trin spiller sammen, så alle data kan bruges aktivt for at øge virksomhedens udbytte.
Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.
Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?
Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.