Computerworld News Service: Diggs hold af ingeniører er holdt op med at bruge MySQL og følger dermed i fodsporene på et andet stort socialt netværk, Twitter.
Digg stopper brugen af MySQL til fordel for et "NoSQL"-miljø på grund af "de stadigt større problemer med at bygge en high-performance, skriveeffektiv applikation på et data-sæt, der vokser hurtigt og tilsyneladende uendeligt," skrev Diggs vice president of engineering John Quinn i et blogindlæg i sidste uge.
Digg har også gennemført andre forandringer, blandt andet i applikationskoden, ved at installere en ny klient- og server-arkitektur og ved at gå bort fra open source program-pakken LAMP. Men skiftet fra MySQL er nok den mest betydningsfulde forandring i infrastrukturen, skriver John Quinn.
"For sådan en som mig, der gennem 20 år næsten udelukkende har bygget systemer på relationelle databaser, så føles det som et drastisk skridt," siger han.
I dag er MySQL i hænderne på Oracle, der er den nye ejer af Sun Microsystems. Skaberen af MySQL, Michael Widenius, har givet udtryk for bekymring over Oracles kontrol over MySQL. Det står endnu ikke klart, hvordan MySQL vil klare sig under den nye ledelse, men John Quinn nævnte ikke Oracle/Sun-sammenlægningen som en afgørende faktor i beslutningen.
Vil anvende Facebook-database
Digg vil i stedet anvende Cassandra, der er et distribueret databasehåndteringssystem, som er udviklet af Facebook. Digg er ikke det eneste sociale netværk, der dropper MySQL - Twitter gør det samme.
Indtil videre har Digg reimplementeret de fleste funktioner i Cassandra, og selskabet arbejder desuden på at tilføje sine egne forbedringer i den open source-baserede software, fortæller John Quinn videre.
"Digg går i høj grad ind for brugen og udviklingen af open source-software, og vi er meget interesserede i at undgå udgifterne ved store, proprietære storage-løsninger," skriver han.
"Cassandra er kolonne-orienteret og tillader storage af relativt struktureret data. Det bygger på en fuldt ud decentraliseret model, hver node er identisk og der findes ikke et enkelt 'point of failure'. Det er desuden ekstremt fejltolerant; data bliver replikeret på flere noder af gangen og på tværs af datacentre. Cassandra er derudover meget elastisk; læse- og skrive-hastighed bliver forøget i takt med, at nye maskiner bliver tilføjet."
Oversat af Marie Dyekjær Eriksen