En af landets mest besøgte hjemmesider dr.dk fik sidste tirsdag travlt, fordi megasitets to forsideservere gik i et såkaldt loop, der bevirkede, at DR's forside af brugerne oplevedes som svært tilgængelig eller helt død i et par timer.
Public Service-institutionen har et set-up, hvor forsiden ligger hostet på to servere, som samler indhold fra en lang række undersystemer i mediehuset.
Derfor kunne forsiden være nede, mens undersider, som brugerne klikkede sig direkte ind på, virkede fint.
Manglende test
Hos DR's afdeling for it-infrastruktur fortæller Søren Hansen, at tirsdagens problem skyldes, at et stykke ASP-kode, som skulle give ny funktionalitet på forsiden, ikke var blevet ordentligt testet igennem, før det blev opdateret.
"Det resulterede i, at de servere som skulle afvikle koden, simpelthen gik i loop," siger Søren Hansen.
Han forklarer, at serverne dermed brugte så meget processortid på at køre den fejlramte kode, at de ikke havde mulighed for at tage imod forespørgsler fra brugerne.
Tog tid at lokalisere
Søren Hansen fortæller, at det omfattende indhold på forsiden betød, at det tog noget tid at lokalisere, hvilken kode der forårsagede problemet og efterfølgende isolere den, så afviklingen af hjemmesiden ikke blev yderligere forstyrret.
DR's set-up på den massive internetside er ifølge Søren Hansen ret dynamisk, hvor det er forholdsvis hurtigt at gennemføre ændringer, hvilket er efterspurgt af huset.
"Men det indebærer også en vis risiko for, at der kan blive lagt kode ud, som ikke er hensigtsmæssig," siger Søren Hansen.
For travlt
Han forklarer, at hændelsen er et eksempel på et paradoks ved ønsket om, at ting skal gå stærkt. Og så er det ikke altid, at der er tid til at få tjekket tingene ordentligt igennem.
"Med den hastighed, der er på tingene, er det umuligt at undgå sådan nogle ting (fejlkode, red.). Det som så er vigtigt, er at kunne komme tilbage til noget, som fungerer, så hurtigt som muligt," siger Søren Hansen.
Overvåger ændringer
Derfor forsøger afdelingen at holde styr på de mange ændringer af systemerne gennem en dag ved at registrere, hvad og hvornår der bliver lagt noget ud på hjemmesiden, for hurtigt at kunne få et overblik.
Pillede nye ting af
Med udgangspunkt i denne oversigt kunne afdelingen ved at pille nye ting af lokalisere den fejlramte kode og konstatere, at forsiden blev stabil uden netop den opdaterede kode.
Ifølge Søren Hansen var der tale om ASP-kode, som er i stand til at afvikle kode på serverne. Og sker dette på en uhensigtsmæssig måde, kan serverne blive overbelastet og gå i loop, forklarer han.
"De blev simpelthen overbelastede og brugte alle deres ressourcer på at håndtere det her fejlkode," siger Søren Hansen.
Registrer alt
Derfor er Søren Hansens råd til andre i samme stol at sørge for at registrere, alt hvad der sker af ændringer på systemet.
"Når man så får et problem, er man i stand til at gå tilbage og se, hvad der er sket. For problemet opstår jo sjældent ud af den blå luft. Hvis ikke man begynder at pille i et system, er det jo som regel stabilt. Registrering af ændringer er en meget vigtig ting," siger han.