Open source frameworket Hadoop er, som vi tidligere har skrevet, i fokus hos en lang række it-giganter og it-afdelinger i øjeblikket.
Analysefirmaet Gartner har vurderet, at Hadoop om blot to år vil være anvendt i 65 procent af de avancerede analyse-applikationer på verdensplan.
Hadoop er således omdrejningspunktet i mange af de big data-projekter, der skydes i gang rundt omkring i virksomhederne.
Et eksempel er Karnov Groups brug af Hadoop til at arbejde med ustrukturerede data.
Hvad er Hadoop?
Hadoop, der har en gul elefant som varemærke, blev lanceret i 2005 af den Yahoo-ansatte Doug Cutting og Mike Cafarella. Navnet Hadoop stammer efter sigende fra en tøjelefant, der tilhørte Doug Cuttings søn.
Siden 2005 har elefanten vokset sig større og større, og i dag er Hadoop nærmest synonymt med en af tidens hotteste it-trends, big data.
Som det fremgår af en liste over Hadoop-brugere og -støtter, er der tale om en stribe af verdens absolut største it-selskaber, heriblandt Amazon, Apple, IBM, Facebook, Google og Microsoft.
Hadoop bygger videre på teknologien MapReduce, som blandt andre Google benytter til behandling af store datasæt via distribuerede systemer. Hadoop er skrevet i Java og licenseret under Apache.
Bliv klogere på Hadoop
It-folk med kompetencer inden for Apache Hadoop er nogle af de mest eftertragtede for tiden, og en McKinsey-rapport har konkluderet, at der i de kommende år vil være en voldsom mangel på kompetencer inden for big data.
Derfor er der måske god grund til at se nærmere på den nedenstående video, hvor Forrester-rådgiver Mike Gualtieri meget pædagogisk forklarer, hvad Hadoop egentlig handler om:
Stanford University har publiceret en længere undervisningsvideo om open source projektet. Den kan du se her:
Læs også:
Open source-projektet som alle it-giganterne elskede