Derfor blev AWS ramt af kæmpenedbrud i sidste uge

Store dele af internettet var lagt ned i sidste uge, da verdens største cloud-tjeneste blev ramt af nedbrud. Her er forklaringen på, hvad der skete.

Artikel top billede

(Foto: Dan Jensen)

25. november blev verdens største cloud-tjeneste Amazon Web Services (AWS) ramt af et stort nedbrud, der betød, at store dele af de største internet-tjenester var lagt ned.

Amazon Kinesis, der var den afdeling, der blev ramt, muliggør behandling i realtid af streamingdata.

Flere apps og tjenester meldte ud, på Twitter, at de havde problemer med AWS-tjenesterne. Blandt andet Adobe Spark, Flickr og The Washington Post, skriver mediet MENAFN.

Læs også: Dele af internettet lagt ned: AWS ramt af stort nedbrud

AWS forklarer nu, at nedbruddet ikke skyldtes – som før rapporteret – manglende hukommelse, men derimod installering af nye servere til netværket.

Implementeringen af de nye servere blev igangsat klokken 02.44 om morgenen lokal tid i AWS' datacenter i den amerikanske delstat Virginia og var afsluttet klokken 03.47.

Klokken 05.15 gik den første alarm, der underrettede Kinesis-medarbejderne om, at der var fejl i systemet.

Da medarbejderne kiggede nærmere på problemet, opdagede de, at der var fejl i alle aspekter af de forskellige opkald, der blev foretaget af eksisterende og nye front-end-servere, hvilket ifølge AWS "forværrede vores mulighed for at adskille bivirkninger fra grundårsagen".

Klokken 07.51 havde medarbejderne indsnævret mulighederne for, hvad der kunne være grundårsagen.

De indså, at nogen af ​​de mest sandsynlige kilder til problemet ville kræve en fuldstændig genstart af front-end-serverne.

Umiddelbart så det ud til, at der var tale om mangel på hukommelse.

Og denne fejlantagelse fordoblede restitutionstiden, da Kinesis endelig opdagede, at den nye kapacitet havde fået alle serverne til at overstige det maksimale antal tråde, der er tilladt af en operativsystem-konfiguration.

Da den egentlige årsag klokken 09.39 blev opdaget, begyndte Kinesis-teamet at tilføje de nye servere igen i langsomt tempo for at undgå overbelastning af systemet igen.

"Front-end-flåden består af mange tusinde servere, og af de årsager, der er beskrevet tidligere, kunne vi kun tilføje servere med et par hundrede i timen. Vi fortsatte med langsomt at tilføje trafik til front-end-flåden med Kinesis-fejlprocenten, der faldt støt fra middagstid og fremefter," forklarer AWS.

Først klokken 22.23 om aftenen var Kinesis tilbage på fuld kraft.

Læs mere på AWS' egen blog.

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    Andre events | København

    Executive Conversations: Når geopolitisk usikkerhed udfordrer Danmarks digitale suverænitet

    Geopolitisk usikkerhed og værdikonflikter mellem USA og Europa rammer nu direkte den danske it-dagsorden. Få indsigt i konsekvenserne – og hvordan du minimerer risikoen i en ny teknologisk virkelighed.

    Sikkerhed | København

    Cyber Security Festival 2025

    Mød Danmarks skrappeste it-sikkerhedseksperter og bliv klar til at planlægge og eksekvere en operationel og effektiv cybersikkerhedsstrategi, når vi åbner dørene for +1.200 it-professionelle. Du kan glæde dig til oplæg fra mere end 50 talere og...

    It-løsninger | Online

    ERP Insights 2025

    Få den nyeste viden om værktøjer, der kan optimere hele din virksomhed med udgangspunkt i AI og fleksibilitet.

    Se alle vores events inden for it

    Forsvarsministeriets Materiel- og Indkøbsstyrelse

    IT-supporterelev til Lokal IT på Aalborg Kaserne

    Nordjylland

    Capgemini Danmark A/S

    Enterprise Architect - Data Intelligence Platform

    Københavnsområdet

    Styrelsen For It og Læring

    Ambitiøs it-arkitekt til tværgående arkitekturenhed

    Midtjylland

    Navnenyt fra it-Danmark

    Danske Spil har pr. 1. oktober 2025 ansat Jesper Krogh Heitmann som Brand Manager for Oddset. Han skal især beskæftige sig med at udvikle og drive brandets strategi og sikre en rød tråd på tværs af alle platforme og aktiviteter. Han kommer fra en stilling som Marketing & Communications Manager hos Intellishore. Nyt job

    Jesper Krogh Heitmann

    Danske Spil

    Netip A/S har pr. 19. august 2025 ansat Jacob Vildbæk Jensen som Datateknikerelev ved afd. Herning og afd. Rødekro. Han har tidligere beskæftiget sig med tjenerfaget,. Nyt job
    Signifly har pr. 1. august 2025 ansat Anders Kirk Madsen som Tech Lead. Anders skal især beskæftige sig med at hjælpe Signiflys offentlige og private kunder med at styrke forretningen gennem teknisk solide løsninger. Anders kommer fra en stilling som Business Architect hos SOS International. Nyt job