Microsofts Azure-platform blev natten til onsdag ramt af et omfattende nedbrud, der varede i flere timer.
Det har givet betydelige problemer for kunderne, der da også har brugt knap så pæne ord om Microsoft på de sociale medier i det seneste døgn.
Azure-nedbruddet ramte en stribe forskellige teknologier og løsninger, og det fandt sted på tværs af forskellige regioner og lande.
I et længere blogindlæg forsøger Microsoft nu at forklare, hvad der helt præcis gik galt:
"Azure storage services oplevede en service-afbrydelse på tværs af USA, Europa og dele af Asien, hvilket påvirkede flere cloud-tjenester i disse regioner. Først vil jeg oprigtigt undskylde for de afbrydelser, det har forårsaget," skriver Jason Zander, der er corporate vice president for Microsofts Azure-team.
Han forklarer, at problemerne opstod i forbindelse med en performance-opdatering til Azure Storage.
"... der blev opdaget et problem, der resulterede i reduceret kapacitet på tværs af services, der udnytter Azure Storage, inklusiv Virtual Machines, Visual Studio Online, Websites, Search og andre Microsoft-services."
Havde ellers testet opdateringen
"Før performance-opdateringen blev tilføjet, var den blevet testet over adskillige uger i en del af vores kundevendte storage-service til Azure Tables. Vi kalder typisk dette 'flighting,' da vi arbejder på at identificere problemer, før vi udruller nogen opdatering bredt," skriver Jason Zander videre.
Alligevel gik det altså galt for Microsoft, og Azure-løsningen blev sendt helt eller delvist til tælling til store frustration for kunderne.
"I forbindelse med udrulingen opdagede vi et problem, der resulterede i, at storage blob frontends gik i et uendeligt loop, hvilket ikke var blevet opdaget, da vi testede."
"Nettoresultatet var, at frontends ikke kunne modtage yderligere traffik, hvilket så igen skabte problemer for andre tjenester, der er bygget oven på."
Jason Zander skriver videre, at Microsoft med det samme trak ændringerne af systemet tilbage, men at det krævede en genstart af de ramte storage frontends for helt at annullere opdateringen.
Lover yderligere afklaring
Herefter blev problemet løst for de fleste kunder, oplyser Microsoft, der dog samtidig også erkender, at nogle kunder stadig oplever problemer som følge af Azure-nedbruddet.
"Når vi har en begivenhed som denne, er vores hovedfokus hurtig recovery for vores kunder, men vi arbejder også på at undersøge grundigt, hvad der gik galt, så det aldrig sker igen," lyder det fra Microsoft, der lover yderligere information om nedbruddet på et senere tidspunkt.
Læs også:
Tre fejl Microsoft begik ved ved det store cloud-nedbrud
Microsofts cloud-løsning brager ned: Sådan rammer det kunderne