Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.
Alle er enige om, at det er nu, man skal i gang. Men noget holder virksomhederne tilbage.
Ofte er det fortællingen om, at alle virksomhedens data skal samles i en fælles og moderne dataplatform.
Det er efter sigende en både strategisk og langsigtet investering, for kunstig intelligens kræver jo mange og strukturerede data. Man må derfor være grundig og give sig god tid i valget af platform – hedder det.
Men den fortælling indeholder to fejlantagelser, der hæmmer innovationen i virksomhederne.
Den første er, at kunstig intelligens kræver meget store, velstrukturerede datamængder. Den anden er, at valget af dataplatform er langsigtet og strategisk.
“Ingen AI uden data” er en saga blot
Lad os begynde med myten om, at kunstig intelligens kræver store datamængder.
Det er korrekt, at nogle former for kunstig intelligens har brug for træningsdata, men trenden går den modsatte vej, og mange AI-løsninger lever fint med enten meget få eller slet ingen data.
Dette skyldes først og fremmest, at store grundmodeller til både sprog- og billeddata kun kræver ingen eller få eksempler for at kunne producere et værdifuldt output.
Senest har ChatGPT vist, hvordan en pre-trænet model kan udføre mange forskellige opgaver uden andet end et veldefineret prompt.
Lige nu er syntetiske data et vilkår, og faktisk kan vi udvide og producere data til træning af en AI ud af den blå luft.
Snart vil der findes større mængder syntetiske end observerede eller menneskeligt genererede data.
Din strategiske dataplatform er et cykelskur
Bike Shedding, eller på dansk cykelskursteorien, er fortællingen om, hvordan mindre vigtige beslutninger, der er nemme at forstå, får mere opmærksomhed end mere betydningsfulde.
Udtrykket stammer fra observationen af en komité, der under udarbejdelsen af et atomkraftværk bruger mest tid på at diskutere, hvordan det tilhørende cykelskur skal se ud.
Sådan er det ofte med dataplatforme. De er konkrete og forståelige – især for ledelsen. Kunstig intelligens er derimod en lidt flyvsk teknologi, hvor det er svært at sætte fingeren på, hvor og hvordan den kan bruges.
Det nemt forståelige, dataplatformen, er imidlertid intet værd i sig selv. Værdien realiseres først, når man udnytter dataene til AI eller andre formål.
Samtidig er det utopi at få samlet alle data i en platform. Der kommer hele tiden nye datakilder, flere data og nye sammenhænge. Den færdige dataplatform findes ikke.
Endelig har valget af dataplatform ingen langsigtet strategisk betydning. De mange platforme ligner hinanden og er i konstant udvikling. Uanset hvad du vælger, kommer der en bedre, sikrere og billigere løsning i morgen.
Dataplatform og AI skal udvikles sammen
Alt for ofte hører jeg, at virksomheder lige skal vælge og implementere den rigtige platform, før de kaster sig ud i kunstig intelligens. Men implementeringen af en dataplatform bliver aldrig en opgave, man kan hakke af – den er konstant.
Af alt dette følger, at implementering af dataplatform og AI skal være sideløbende opgaver. AI-løsninger skal skabe behov for data, og data skal skabe muligheder for AI. I et parallelt forløb er de to i harmoni.
Igangsat hver for sig og med dataplatformen som forudsætning bliver al innovation bare sat på pause.
Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.
Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?
Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.