Facebook har været meget hemmelighedsfuld omkring sine datacentre indtil nu, men nu har selskabet for første gang afsløret detaljer om databehandlingen bag verdens største sociale netværk. Hver eneste dag håndterer systemet omkring 2,5 milliarder indholds-elementer og mere end 500 terabyte nye data.
Der bliver registreret 2,7 milliarder "synes godt om" tilkendegivelser og uploadet 300 millioner nye billeder hver dag.
Facebook fortæller også, at man har 100 petabyte data gemt i et enkelt Hadoop disk-cluster.
"Vi mener, at vi har det største enkeltstående Hadoop cluster i verden," fortalte Facebooks udviklingschef Jay Parikh på et møde med journalister i selskabets hovedkvarter.
Denne enorme datasamling bruges til at forstå brugernes handlinger, foretage hurtige ændringer i designet og udvikle nye produkter. En del af disse data går også videre til annoncørerne.
"Vi registrerer, hvordan annoncer klarer sig i forskellige grupper af brugere på vores site, baseret på køn, alder, interesser. Så vi kan sige 'denne annonce klarer sig bedre i Californien så vi skal vise den mere i dette område'", sagde Parikh ifølge Techcrunch.
Selskabet har også et system kaldet Gatekeeper, hvor man kan lave ændringer på sitet og teste det på en meget lille procentdel af brugerne. Så er der "Project Prism", hvor man vil sprede hele bruger-databasen over flere datacentre.
I øjeblikket ligger hele databasen i et enkelt datacenter, og den bliver så spejlet andre steder, men fremover skal den deles mellem forskellige datacentre - selv om den stadig fremstår som én samlet database.
Der er næsten én milliard Facebook-brugere nu og antallet vokser konstant, så datamængden stiger tilsvarende.
En anden interessant detalje er, at Facebook-udviklere har adgang til at trække data fra alle selskabets forskellige dataarkiver. Der er ingen barrierer mellem de forskellige forretningsenheder som f.eks. annoncer og kundesupport. Men Facebook understreger, at man logger alle medarbejdernes aktiviteter for at undgå misbrug.
Facebook har i øjeblikket datacentre i blandt andet Californien, Virginia, Oregon og North Carolina, og inden længe er man klar med et nyt stort datacenter i svenske Luleå. Den svenske by tæt ved polarcirklen skal huse det første Facebook-datacenter i Europa.
Datacenteret bliver det største af sin slags i Europa med et samlet areal på 84.000 kvadratmeter fordelt på tre serverhaller.