Læs også:
Derfor handler big data ikke kun om mega-analyser
Stor mangel på kloge it-folk inden for nyt vækst-område
Hvert år i it-verdenen byder på sine trends og særligt hypede teknologier. Big data er formentlig den trend, der har fyldt mere end alle andre i 2012.
It-leverandørerne er klar til at klaske mærkatet på stort set hvad som helst for tiden, analytikerne bidrager med big data-forudsigelser og -rådgivning, og vi it-medier er naturligvis også med på vognen: big data er hot.
Men midt i det hele står du måske som it-chef eller it-professionel og klør dig lidt i nakken. For hvad er big data egentlig? Er det ikke bare endnu et it-buzzord? Og hvis nej, hvad er det så for muligheder og udfordringer, der venter forude?
Big data er uanset hvad blandt de it-trends, Gartner har udpeget som de for it-cheferne strategisk vigtigste i 2012.
Med det udgangspunkt vil vi i det følgende forsøge at give en introduktion til begrebet big data.
Definitionen på big data
Der er stadig mere end én definition på, hvad big data egentlig er, men grundlæggende dækker det over de værktøjer og processer, der skal bruges, for at man kan håndtere og udnytte ekstremt store datamængder.
Udfordringen er så, at grænserne for, hvor stort stort er, er temmelig flydende. Taler vi petabytes, exabytes, zettabytes eller det, der er endnu større?
I IDC's seneste opgørelse over det globale big data-marked (beskrives senere i denne artikel) er eksempelvis inddraget konkrete projekter, hvor der er tale om data-mængder på over 100 terabytes - men også projekter, hvor data-mængderne i dag ikke er specielt store, men til gengæld vokser med 60 procent eller mere om året.
Uanset data-mængden er big data-konceptet dog nogenlunde klart.
Forresters definition lyder, at det er "teknikker og teknologier, der gør data-håndtering i en ekstrem skala økonomisk opnåeligt."
Gartner skriver om big data, at:
"Mængden, formaternes kompleksitet og leverings-hastigheden overstiger det, traditionelle data manage-teknologier kan levere; alene det at kunne håndtere volumen kræver nye eller eksotiske teknologier."
Derfor er big data noget nyt
Man tager fejl, hvis man antager, at big data blot handler om store data-mængder. Det handler i lige så høj grad om hastighed og måden, man håndterer data på.
Gartner peger på, at mange nye teknologier vokser frem med det udgangspunkt, eksempelvis såkaldt in-memory-teknologi, hvor virksomhedens databaser afvikles direkte fra lynhurtig RAM.
"En stor konsekvens af big data er, at fremtidens bruger ikke vil kunne placere alle nyttefulde informationer i et enkelt data warehouse. Logiske data warehouses bringer informationer sammen fra mange forskellige kilder efter behov og vil erstatte modellen med et enkelt data warehouse," lyder forudsigelsen fra Gartner.
På samme måde har Forrester om big data skrevet, at "big data ikke er som dine traditionelle BI-værktøjer; det vil kræve nye processer og kan totalt redefinere din tilgang til data governance."
Gammel vin på nye flasker?
Man kan imidlertid med rette spørge, om big data ikke blot er endnu et begreb, der kobles på den generelle tendens med stigende datamængder og deraf følgende teknologisk udvikling?
Gartner nævner selv data warehousing, der har været (og fortsat er) et klassisk it-begreb, men også en trend som eksempelvis information lifecycle management har tidligere haft den fremtrædende position, som big data har her i 2012.
Samtidig er førnævnte in-memory-teknologier sammen med sådan noget som high performance computing og næste generations analyse-værktøjer nært beslægtede med big data-trenden.
Den logiske forklaring er, at det meste hænger sammen, når det kommer til stykket.
Big data er dog i øjeblikket det begreb, der om noget favner de underliggende teknologiske trends.
Det kan du opnå med big data
Sorterer man den sædvanlige salgsgas fra, ligger der inden for big data reelle gevinster og venter for brugerne. Det svære er naturligvis altid at vurdere, om gevinsterne står mål med de krævede investeringer, men de mulige gevinster er ganske reelle.
Forrester har vurderet, at virksomhederne i dag udnytter mindre end fem procent af deres data effektivt.
"Resten er simpelthen for dyrt at have at gøre med. Big data er nyt, fordi det lader firmaerne få råd til at dykke ned i de resterende 95 procent."
Big data-eksplosionen har, som Deloitte skriver været helt uundgåelig med de stigende datamængder og de mange nye former for data-input.
"Afgørende ny indsigt kan indsamles med den største værdi for dem, der lærer at isolere signalerne fra støjen og omsætte det til handling."
Her har big data en afgørende betydning
Big data er således ikke blot varm luft fra omsætnings-hungrende it-leverandører. At datamængder stiger eksplosivt, og at der er et betydeligt behov for at kunne overskue, håndtere og udnytte den store viden, der ligger gemt i data, er der næppe mange, der vil anfægte.
Ofte er det inden for bestemte brancher, man tale om at anvende big data, men flere kommer helt sikkert til i de kommende år.
Det kan eksempelvis være i forbindelse med meteorologiske eller miljømæssige beregninger, men også inden for medicinal- eller vindmølleindustrien, hvor man arbejder med ekstremt store datasæt, når nye, bedre produkter skal udvikles.
Andre eksempler kunne være store web-selskaber som Facebook og Google, der hver eneste dag udnytter de massive data-input fra brugerne til at skræddersy deres tjenester og kommercielle tiltag i den helt rigtige retning.
Eller hvad med den klassiske supermarkedskæde, den store produktionsfabrik eller flyselskaberne - de vil alle kunne drage nytte af big data.
Hvornår er big data modent?
Analysefirmaet IDC udgav i marts 2012 en rapport om det globale marked for big data-teknologier og services.
I den kan man læse, at markedet i 2010 omsatte for omkring 19 milliarder danske kroner på verdensplan, mens det ventes, at det tal vil være steget til omkring 102 milliarder i 2015.
Det svarer til en årlig vækst på 40 procent eller omkring syv gange mere end det generelle marked for informations- og kommunikationsteknologier, skriver IDC, og det er formentlig forklaringen på, at så mange leverandører markerer sig inden for big data i disse tider.
"Markedet for big data vokser hurtigt, efterhånden som store it-virksomheder og nystartede virksomheder jagter kunder og markedsandele. For teknologi-købere er der mulighed for at udnytte big data-teknologier til at forbedre drifts-effektiviteten og skabe innovation," forklarer IDC-analytiker Dan Vesset.
Gartners hype cycle
Gartners Hype Cycle 2011. (Klik for større grafik)
Som det er med alle nye it-begreber og -trends, er også big data præget af nogle massive forventninger i markedet, som - hvis alt går, som det plejer - vil blive efterfulgt af en vis skuffelse, inden det reelle big data-potentiale kan indfries.
Gartners velkendte hype cycle beskriver denne bevægelse, og på den seneste version ligger big data på den del af kurven, hvor hypen og forventningerne endnu ikke er toppet.
Det skal bemærkes, at denne hype cycle er næsten et år gammel, og at Gartners vurdering af, at big data først vil være klar til mainstream-udbredelse om to til fem år, skal ses i det lys.
Udfordringerne ved big data
IDC har her i 2012 peget på, at en udfordring inden for big data er, at der er mangel på it-folk med kompetencer på netop dette område.
"Denne begrænsning i arbejdsstyrken vil fungere som en hæmning i udbredelsen af og brugen af big data-teknologier, og det vil også få leverandører til at levere big data-teknologier som cloud-baserede løsninger."
Samtidig ligger i hele konceptet med big data også, at der er tale om ikke bare store mængder data, men også store investeringer fra de virksomheder, der ønsker at udnytte potentialet i big data-teknologierne.
Hvordan det passer ind i en dansk kontekst, hvor der er mange små og mellemstore virksomheder, har vi endnu til gode at se.
Indtil videre synes det dog klart, at big data er kommet for at blive, og at specielt store virksomheder allerede er i gang med eller har kig på at udnytte det muligheder, der ligger i lige netop denne teknologi-trend.
Mere information om big data
Deloitte har udgivet en video, der beskriver konceptet med big data:
Wikipedia har også en fin beskrivelse af big data, ligesom der er mere information at hente hos de store it-leverandører og it-analysefirmaer.
Hent blandt andet information hos IDC og Gartner.
Du kan læse alle Computerworlds artikler om big data her.
Læs også: