Fibia er en af de førende internetudbydere på markedet, og de er blandt Danmarks største fiberselskaber med 300.000 kunder. Fibia vil gerne være landsdækkende, have deres kunder i fokus og levere kundeoplevelser i høj klasse. De mener, at alle skal have ret til lynhurtigt internet, og som udbyder vil de gerne levere det nyeste i branchen uden at gå på kompromis med stabilitet og driftssikkerhed.
Sikkerhed og stabilitet i samfundskritisk infrastruktur
Fibia leverer samfundskritisk infrastruktur, og derfor er det vigtigt at have en velfungerende og proaktiv drift- og beredskabsplan.
De har valgt at outsource al udvikling og hosting til leverandører, hvor den ene er IT-konsulenthuset, Novataris, der står for udvikling, og som Fibia har haft et tæt samarbejde med siden 2018.
”Fordi vi skal have stabil drift, har vi et krav til vores leverandører om, at de kan overvåge, løse kritiske fejl og være i stand til at gøre det døgnet rundt. Det er alfa og omega for os,” fortæller Karina Schultz, Service Delivery Manager i Fibia.
Hun tilføjer, at Fibia har forskellige reaktionstider og behandlingstider afhængigt af fejlens alvor, og at de løbende skal holdes orienteret: ”Når der er en fejl, vil vi vide, hvad status er, og hvad der skal til for at komme i mål med en løsning,” siger hun.
For at kunne leve op til disse krav, skal Novataris som leverandør sikre hurtig udvikling uden fejl, opretholde en stabil drift, da nedetid kan få konsekvenser, og have sikkerheden i absolut top, da der er tale om samfundskritisk infrastruktur. Desuden skal eventuelle fejl kunne løses på alle tidspunkter.
”Det er ikke en nem opgave, men vi har i samarbejde med Fibia bygget et rigtig godt samarbejde op, ” siger Mikael Nordgren, Partner i Novataris.
Kubernetes og Enterprise Service Bus – hjertet af infrastrukturen
”Fibia bruger et Kubernetes cluster, som kører flere applikationer. Den vigtigste er deres Enterprise Service Bus. Den er hjertet i hele infrastrukturen. Med den kan vi se alle interaktioner mellem alle systemerne,” fortsætter han.
Som overvågningsværktøj har Novataris valgt at bruge Datadog til alle systemerne. Datadog giver et komplet billede af alt fra logfiler til CPU og systemdata. Skulle der opstå en fejl, vil den helt automatisk sende en alarm til vagtordningen, som håndteres af OpsGenie.
”Hvis den primære vagt ikke tager den hurtigt nok, ringer den til den sekundære vagt, og hvis den person ikke tager den, ringer den til hele holdet. Så er det alle på holdet, der har et ansvar for at fikse fejlen og sikre den stabile drift.” fortæller Mikael.
Mikael Nordgren forklarer videre, at et af de vigtigste aspekter af samarbejdet har været at sikre, at alle alarmer og overvågningssystemer er konfigureret korrekt og undgår at skabe unødig alarmtræthed hos teamet.
"Vi har nøje overvejet, hvilke fejl og problemer der skal udløse en alarm. Når en alarm går, skal det være selvforklarende og målrettet de rigtige personer, så vi kan reagere hurtigt og effektivt," fortæller han.
Håndtering af fejl og sikkerhed
Mikael nævner to forskellige eksempler. Det første er et eksempel på en interne hændelse, hvor Fibia modtog en alarm om langsomme ordrer. "Vi opdagede gennem Datadog, at der opstod fejl mellem klokken 11 og 15. Vores første skridt var at analysere årsagen – om der var sket ændringer hos os, hos Fibia eller hos en tredjepart. Det viste sig, at Fibias kundeservice havde startet en synkronisering af alle kunder for at sikre, at de havde den rette internetforbindelse. Vores analyse viste, at en intern komponent var overbelastet, og vi løste problemet ved at opdele processen i mindre batches og justere implementeringen. Heldigvis var det et internt problem, og ingen kunder blev påvirket."
Herefter beskriver han et eksempel på en sikkerhedshændelse, der fik opmærksomhed både i pressen og hos Center for Cybersikkerhed. "Det var en alvorlig sårbarhed, der scorede 10,0 – den højeste risikoscore. Sammen med Fibia kunne vi analysere, at de lag af sikkerhed, vi havde på plads, allerede beskyttede dem mod denne sårbarhed. Alligevel foretog vi kontrollerede ændringer baseret på anbefalingerne fra Center for Cybersikkerhed og opdaterede de nødvendige frameworks."
Konstant overvågning og tæt samarbejde
Fibia har nu en høj grad af fleksibilitet i deres overvågning. "Vi er nået langt med vores overvågning, og vi kan hele tiden justere og opsætte nye alarmer, hvis der er behov. " siger Karina Schultz fra Fibia.
Det tætte samarbejde mellem Fibia og Novataris er en vigtig faktor i at sikre denne stabilitet. Hver måned gennemgår de i fællesskab de rapporterede fejl og alarmer og diskuterer, hvad der kunne være gjort anderledes, og hvordan de kan optimere overvågningen fremadrettet.
"Vi holder hinanden ansvarlige på begge sider og sørger for, at vi altid er i gang med at forbedre processerne," tilføjer Mikael.