Artikel top billede

Konfigurationsfejl skyld i stort Microsoft-nedbrud

Se hvorfor Microsofts store Azure-tjeneste bragede ned i sidste uge.

Computerworld News Service: Det var en fejl i systemkonfigurationen, der var årsag til det nedbrud, der ramte vesteuropæiske Windows Azure-kunder i sidste uge, oplyser Microsoft.

På grund af denne fejl var Microsofts platform til hosting og udvikling af offentlige cloud-applikationer utilgængelig i cirka to en halv time torsdag.

Microsoft har ikke sat tal på, hvor mange kunder, der fik nedbruddet at føle.

Problemet havde at gøre med en "sikkerhedsventil" i Azures netværksinfrastruktur, der har til formål at forhindre netværksnedbrud i at sprede sig ude af kontrol.

Ny kapacitet

For at bremse en kaskadevirkning begrænser denne mekanisme antallet af forbindelser, som kan oprettes til netværkshardwareenheder.

"Forud for denne hændelse tilføjede vi ny kapacitet til den vesteuropæiske underregion på grund af øget efterspørgsel. Begrænsningen af antallet af enheder var dog ikke blevet justeret under valideringsprocessen til at modsvare den nye kapacitet," skriver Mike Neil, der er chef for Windows Azure, i et blogindlæg.

En pludselig stigning i brugen af den påvirkede klynge førte til, at sikkerhedsventilens tærskel blev overskredet, hvilket genererede en storm af advarselsbeskeder i netværksadministrationen.

"Den øgede administrationstrafik udløste fejl i nogle af klyngens hardwareenheder, hvilket fik deres CPU'ers udnyttelsesgrad op på 100 procent, hvilket påvirkede datatrafikken," forklarer Neil.

Sådan løste Microsoft problemet

Microsoft løste hurtigt problemet ved at øge grænseværdierne for den påvirkede klynges sikkerhedsventil.

For at forhindre situationen i at gentage sig er Microsoft nu ved at rette de identificerede fejl i netværkshardwareenhederne og arbejder desuden på at forbedre systemerne til netværksovervågning, så de kan opdage og løse sådanne problemer, før de fører til nedbrud.

Analytiker James Staten fra Forrester Research påpeger, at PaaS-clouds (platform as a service) såsom Azure er meget komplekse og stærkt automatiserede miljøer, og understreger, at der kan opstå tekniske problemer i produktionsmiljøer, som ikke kan forudses i et testmiljø.

"Dette ser ud til at være et sådant tilfælde," vurderer han.

I takt med at der tilføjes nye funktioner, anvendelsen øges og andre faktorer træder i kraft, er administratorerne nødt til at sørge for at justere og optimere det kørende system, og nogen gange vil noget gå i stykker, siger han.

Ingen grund til bekymring

"Bør det bekymre klienterne? Faktisk ikke. Dette er et eksempel på, hvad der kan ske i et cloud-miljø. Men i et typisk datacenter sker der oftere langt værre ting," fremhæver Staten.

It-chefer og udviklere med planer om at hoste applikationer i skyen bør designe og konfigurere dem til at være fejltolerante. "Det er en grundlæggende ændring i tilgangen, som udviklere og driftsteam er nødt til at forstå, når de kaster sig over cloud-udrulning," siger han.

"Disse former for nedbrud udgør læringsmuligheder både for cloud-leverandørerne og for cloud-kunderne. I stedet for at se en sådan hændelse som et argument imod cloud bør man se den som en mulighed for at forbedre sin viden om cloud," tilføjer han.

Oversat af Thomas Bøndergaard




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
EG A/S
Udvikling, salg, implementering og support af software og it-løsninger til ERP, CRM, BA, BI, e-handel og portaler. Infrastrukturløsninger og hardware. Fokus på brancheløsninger.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Brand din forretning og skab nye leads med Microsoft Dynamics 365 til marketing

Vidste du, at Microsoft Dynamics også byder på stærk funktionalitet til marketingafdelingen? På kun 1 1/2 time inspirerer vi dig til, hvordan du kan bruge Dynamics 365 Marketing til at brande din forretning og skabe nye leads.

17. maj 2021 | Læs mere


Vælg den rigtige infrastruktur og it-arkitektur

Få indblik i, hvordan du kan sikre sammenhæng og overblik i et it-landksab, der konstant ændres. Dette kan blandt andet gøres med de rette strategisk og teknologiske vlag, så effektiviteten, stabiliteten og sikkerheden opretholdes. Den rigtige infrastruktur og it-arkitektur kan uden tvivl hjælpe dig med at skabe overblikket over dit it-landskab.

18. maj 2021 | Læs mere


Digital transformation og innovation: Inspiration til digitale succeshistorier

Kom ind bag facaden hos nogle af Danmarks bedste it-folk, og lær hvordan de arbejder med digital transformation og innovation. Du får muligheden for at høre, hvordan du kan bruge den nye teknologi til at få etableret det mest effektive udviklings- og innovationsmilø.

19. maj 2021 | Læs mere






Premium
De virker skræmmende godt: Med Apples nye Airtags kunne jeg spore mine chefer (og mine ting) med mobilen
Apples Airtags er uhyre effektive og lette at anvende - og det giver grund til bekymring.
Computerworld
Stor krise i den danske it-stjerne David Heinemeiers Hanssons firma: Her er historien om dramaet, der fik en tredjedel af de ansatte i Basecamp til at smække med døren
De ansatte har i hobe forladt David Heinemeier Hanssons amerikanske succes-firma Basecamp efter en intern racisme-debat. Hvordan kunne det gå så galt?
CIO
Har du rost din mellemleder i dag? Snart er de uddøde - og det er et tab
Computerworld mener: Mellemledere lever livet farligt: Topledelsen får konstant ideer med skiftende hold i virkeligheden, og moden går mod flade agile organisationer. Men mellemlederen er en overset hverdagens helt med et kæmpe ansvar. Her er min hyldest til den ofte latterliggjorte mellemleder.
Job & Karriere
Eva Berneke stopper som topchef i KMD og flytter til Paris: Her er KMD's nye topchef
Efter syv år på posten som topchef for KMD forlader Eva Berneke selskabet. Nu flytter hun med familien til Paris, hvor hun vil fortsætte sit bestyrelsesarbejde. KMD har allerede afløser på plads.
White paper
Ryk SAP-workloads i skyen – og tag alle de kendte fordele med
SAP-kunder verden over har gennem de seneste 15 år draget fordel af løsninger baseret på NetApps ONTAP-data management-platform. Herunder en mere sikker og stabil drift samt forenklet administration, hvilket er afgørende for at gennemføre projekter effektivt og for at reducere deres risikoprofil. Gennem de seneste år er det i høj grad også blevet muligt at rykke SAP-workloads i skyen, og det ønsker mange virksomheder rimeligvis at drage fordel af – men uden at sige farvel til mulighederne med NetApp ONTAP. I dette whitepaper stiller vi skarpt på mulighederne for at indarbejde NetApp Cloud Volumes ONTAP and Azure NetApp Files som del af en SAP-strategi baseret på Microsoft Azure.