Konfigurationsfejl skyld i stort Microsoft-nedbrud

Se hvorfor Microsofts store Azure-tjeneste bragede ned i sidste uge.

Artikel top billede

Computerworld News Service: Det var en fejl i systemkonfigurationen, der var årsag til det nedbrud, der ramte vesteuropæiske Windows Azure-kunder i sidste uge, oplyser Microsoft.

På grund af denne fejl var Microsofts platform til hosting og udvikling af offentlige cloud-applikationer utilgængelig i cirka to en halv time torsdag.

Microsoft har ikke sat tal på, hvor mange kunder, der fik nedbruddet at føle.

Problemet havde at gøre med en "sikkerhedsventil" i Azures netværksinfrastruktur, der har til formål at forhindre netværksnedbrud i at sprede sig ude af kontrol.

Ny kapacitet

For at bremse en kaskadevirkning begrænser denne mekanisme antallet af forbindelser, som kan oprettes til netværkshardwareenheder.

"Forud for denne hændelse tilføjede vi ny kapacitet til den vesteuropæiske underregion på grund af øget efterspørgsel. Begrænsningen af antallet af enheder var dog ikke blevet justeret under valideringsprocessen til at modsvare den nye kapacitet," skriver Mike Neil, der er chef for Windows Azure, i et blogindlæg.

En pludselig stigning i brugen af den påvirkede klynge førte til, at sikkerhedsventilens tærskel blev overskredet, hvilket genererede en storm af advarselsbeskeder i netværksadministrationen.

"Den øgede administrationstrafik udløste fejl i nogle af klyngens hardwareenheder, hvilket fik deres CPU'ers udnyttelsesgrad op på 100 procent, hvilket påvirkede datatrafikken," forklarer Neil.

Sådan løste Microsoft problemet

Microsoft løste hurtigt problemet ved at øge grænseværdierne for den påvirkede klynges sikkerhedsventil.

For at forhindre situationen i at gentage sig er Microsoft nu ved at rette de identificerede fejl i netværkshardwareenhederne og arbejder desuden på at forbedre systemerne til netværksovervågning, så de kan opdage og løse sådanne problemer, før de fører til nedbrud.

Analytiker James Staten fra Forrester Research påpeger, at PaaS-clouds (platform as a service) såsom Azure er meget komplekse og stærkt automatiserede miljøer, og understreger, at der kan opstå tekniske problemer i produktionsmiljøer, som ikke kan forudses i et testmiljø.

"Dette ser ud til at være et sådant tilfælde," vurderer han.

I takt med at der tilføjes nye funktioner, anvendelsen øges og andre faktorer træder i kraft, er administratorerne nødt til at sørge for at justere og optimere det kørende system, og nogen gange vil noget gå i stykker, siger han.

Ingen grund til bekymring

"Bør det bekymre klienterne? Faktisk ikke. Dette er et eksempel på, hvad der kan ske i et cloud-miljø. Men i et typisk datacenter sker der oftere langt værre ting," fremhæver Staten.

It-chefer og udviklere med planer om at hoste applikationer i skyen bør designe og konfigurere dem til at være fejltolerante. "Det er en grundlæggende ændring i tilgangen, som udviklere og driftsteam er nødt til at forstå, når de kaster sig over cloud-udrulning," siger han.

"Disse former for nedbrud udgør læringsmuligheder både for cloud-leverandørerne og for cloud-kunderne. I stedet for at se en sådan hændelse som et argument imod cloud bør man se den som en mulighed for at forbedre sin viden om cloud," tilføjer han.

Oversat af Thomas Bøndergaard

Læses lige nu

    Event: Computerworld Summit 2026 - Aarhus

    Digital transformation | Aarhus C

    Styrk din digitale strategi med konkret brug af AI og ny teknologi. Mød 200 it-professionelle, få indsigter, løsninger og netværk på én dag. Computerworld Summit i Aarhus viser hvordan teknologi skaber forretningsværdi – her og nu.

    21. april 2026 | Gratis deltagelse

    En kaotisk verden kræver stærk cybersikkerhed, resiliens og digital suverænitet

    Mød David Heinemeier, Flemming Splidsboel Hansen, Casper Klynge, Rasmus Knappe, Jens Myrup Pedersen og forfattere som fhv. jægersoldat Thomas Rathsack og adfærdsforsker Henrik Tingleff.

    Computerworld afholder d. 4. og 5. november Cyber Security Festival i København - med fokus på sikkerhed, resiliens og digital suverænitet. Det er helt gratis - men reserver din plads allerede nu.

    Hele programmet er online lige nu - og du kan reservere din gratis plads lige her - jeg håber vi ses! 

    Lars Jacobsen

    Chefredaktør på Computerworld

    Se alle Lars's artikler her

    Navnenyt fra it-Danmark

    IT Confidence A/S har pr. 1. oktober 2025 ansat Henrik Thøgersen som it-konsulent med fokus på salg. Han skal især beskæftige sig med rådgivende salg, account management og udvikling af kundeporteføljer på tværs af it-drift, sikkerhed og cloud-løsninger. Han kommer fra en stilling som freelancer i eget firma og client manager hos IT Relation og IT-Afdelingen A/S. Han er uddannet elektromekaniker. Han har tidligere beskæftiget sig med salg af it-løsninger, account management, it-drift og rådgivning samt undervisning og ledelse. Nyt job

    Henrik Thøgersen

    IT Confidence A/S

    Enterprise Rent-A-Car har pr. 1. september 2025 ansat Christian Kamper Garst som Senior Key Account Manager. Han skal især beskæftige sig med at vinde markedsandele i hele Norden som led i en storstilet turnaround-strategi. Han kommer fra en stilling som Salgsdirektør hos Brøchner Hotels. Nyt job

    Christian Kamper Garst

    Enterprise Rent-A-Car

    Norriq Danmark A/S har pr. 1. september 2025 ansat Søren Vindfelt Røn som Data & AI Consultant. Han skal især beskæftige sig med at effektivisere, planlægge og implementere innovative, digitale løsninger for Norriqs kunder. Han kommer fra en stilling som Co-founder & CMO hos DrinkSaver. Han er uddannet Masters of science på Københavns IT-Universitet. Nyt job

    Søren Vindfelt Røn

    Norriq Danmark A/S