Tilbage til artiklen: IBM løfter omsider sløret for dansk gigant-nedbrud.
Via aktindsigt har Computerworld fået adgang til brev, som IBM sendte til Københavns Kommune som forklaring på nedbrud 9. april.
Her hedder det blandt andet:
Nedbruddet var forårsaget af et loop af data udvekslet i infrastrukturen som gav anledning til 100 procents CPU-udnyttelse på nogle af de større netværksenheder (Core Routers) i infrastrukturen. På grund af den høje belastning var disse netværksenheder ikke i stand til at videresende kundetrafik.
Den kritiske situation opstod efter en kundekonfiguration af en 2nd RSPAN session (Remote SPAN) på tværs af switche for at tillade sporing af nogle data for kunden. Dette forårsagede en uventet reaktion fra switchen.
Ændringen i konfigurationen var en rutinehåndtering og en "Business as usual" operation og er ikke i strid med vores procedurer for ændringshåndtering. Ingen kunne have forudset at konfigurationsændringen kunne forårsage et intensivt loop af data, som udløste det kritiske nedbrud.
Skift til backup router løste ikke problemet, idet forudsætningerne for fejltriggeren - konfigurationsændringen - også gjaldt denne router.
I løbet af eftermiddagen blev den switch som genererede 'datastøjen' isoleret fra netværket, hvilket løste problemet for de fleste kunder. Da vi efterfølgende fik elimineret den definition, som reelt udløste problemet i den isolerede switch, blev driften helt normaliseret for de resterende kunder.
En række "her og nu" ændringer af vores procedurer for ændringshåndtering, incidenthåndtering og softwareopgraderingersamt tekniske anbefalinger er blevet gennemført for at sikre et endnu mere robust miljø og forhindre disse problemer i at opstå igen."
Tilbage til artiklen: IBM løfter omsider sløret for dansk gigant-nedbrud.