(Foto: Dan Jensen)

Derfor blev AWS ramt af kæmpenedbrud i sidste uge

Store dele af internettet var lagt ned i sidste uge, da verdens største cloud-tjeneste blev ramt af nedbrud. Her er forklaringen på, hvad der skete.

25. november blev verdens største cloud-tjeneste Amazon Web Services (AWS) ramt af et stort nedbrud, der betød, at store dele af de største internet-tjenester var lagt ned.

Amazon Kinesis, der var den afdeling, der blev ramt, muliggør behandling i realtid af streamingdata.

Flere apps og tjenester meldte ud, på Twitter, at de havde problemer med AWS-tjenesterne. Blandt andet Adobe Spark, Flickr og The Washington Post, skriver mediet MENAFN.

Læs også: Dele af internettet lagt ned: AWS ramt af stort nedbrud

AWS forklarer nu, at nedbruddet ikke skyldtes – som før rapporteret – manglende hukommelse, men derimod installering af nye servere til netværket.

Implementeringen af de nye servere blev igangsat klokken 02.44 om morgenen lokal tid i AWS' datacenter i den amerikanske delstat Virginia og var afsluttet klokken 03.47.

Klokken 05.15 gik den første alarm, der underrettede Kinesis-medarbejderne om, at der var fejl i systemet.

Da medarbejderne kiggede nærmere på problemet, opdagede de, at der var fejl i alle aspekter af de forskellige opkald, der blev foretaget af eksisterende og nye front-end-servere, hvilket ifølge AWS "forværrede vores mulighed for at adskille bivirkninger fra grundårsagen".

Klokken 07.51 havde medarbejderne indsnævret mulighederne for, hvad der kunne være grundårsagen.

De indså, at nogen af ​​de mest sandsynlige kilder til problemet ville kræve en fuldstændig genstart af front-end-serverne.

Umiddelbart så det ud til, at der var tale om mangel på hukommelse.

Og denne fejlantagelse fordoblede restitutionstiden, da Kinesis endelig opdagede, at den nye kapacitet havde fået alle serverne til at overstige det maksimale antal tråde, der er tilladt af en operativsystem-konfiguration.

Da den egentlige årsag klokken 09.39 blev opdaget, begyndte Kinesis-teamet at tilføje de nye servere igen i langsomt tempo for at undgå overbelastning af systemet igen.

"Front-end-flåden består af mange tusinde servere, og af de årsager, der er beskrevet tidligere, kunne vi kun tilføje servere med et par hundrede i timen. Vi fortsatte med langsomt at tilføje trafik til front-end-flåden med Kinesis-fejlprocenten, der faldt støt fra middagstid og fremefter," forklarer AWS.

Først klokken 22.23 om aftenen var Kinesis tilbage på fuld kraft.

Læs mere på AWS' egen blog.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Ed A/S
Salg af hard- og software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Nye muligheder for lynhurtig planning optimization i Dynamics 365 SCM

Hurtigere omstilling i virksomhedens supply chain er blevet et must og med de nye muligheder for lynhurtig planning optimization i Dynamics 365 SCM får du en fleksibel og skalerbar MRP-motor.

20. januar 2021 | Læs mere


Digital Vækst 2021

Vi ved, at fremtidens vindervirksomheder er digitale. På konferencen undersøger vi de tre vigtigste aspekter i den digitale transformation: Forretningsmodellerne, de menneskelige og organisatoriske faktorer samt valget af teknologier. I tre Digitale Dilemmaer giver vi en række digitale frontløbere fem minutter hver til at levere deres bedste guldkorn, og herefter åbner vi for spørgsmål fra salen – også digitalt. Diskussionen modereres af chefredaktør på Computerworld, Lars Jacobsen.

21. januar 2021 | Læs mere


Strategiske it-sikkerhedsdage 2021

God it-sikkerhed er blevet en strategisk disciplin der kombinerer ledelse, adfærd, processer og teknologi. Men hvor lægger du niveauet? Hvad er vigtigt for forretningen og den drift? Hvad er knapt så vigtigt? Hvordan indtænker du it-sikkerheds-indsatsen strategisk? Hvad gør du, når skaden er sket? Bliv klogere på ”Strategiske it-sikkerhedsdage 2021: Trusler, tendenser og værktøjer”.

26. januar 2021 | Læs mere






Premium
IBM fortsætter offensiv opkøbsstrategi: Køber en af de største og ældste multicloud-leverandører i USA
IBM opkøber cloud-virksomheden MSP Taos. Det er blot det seneste opkøb fra IBM i jagten på de store cloud-giganter og falder i tråd med IBM's offensive hybrid cloud-strategi.
Computerworld
IBM vinder millionaftale om nyt toldsystem
Skatteforvaltningen har tegnet en tiårig kontrakt IBM om levering af det sidste it-system til i en omfattende systemudskiftning i toldsystemerne og som først forventes afsluttet i 2025. Se alle detaljerne her.
CIO
Podcast: Hos Viking Life-Saving Equipment er it gået fra at være backend til at være noget, som kunderne spørger aktivt efter
Podcast, The Digital Edge: Viking leverer en stadig større del af deres produkt som en tjeneste. Som en del af tjenesten tager Viking ansvar for sikkerheden ved at levere, dokumentere og vedligeholde det nødvendige sikkerhedsudstyr. Hør hvordan Henrik Balslev senior digital director hos Viking har løftet den opgave.
Job & Karriere
Microsoft i kæmpe dansk satsning - åbner tre store datacentre i Danmark
Microsoft lancerer kæmpe satsning fra hovedkvarteret i Lyngby. Selskabet åbner tre store bæredygtige datacentre på Sjælland.
White paper
Gratis whitepaper: Hvad er EDI, og hvordan kan det styrke min forretning?
Overvejer du EDI, og ønsker du at undersøge, om EDI er den rette investering for din virksomhed? Har en af dine kunder eller leverandører for nyligt bedt dig om at udveksle elektroniske dokumenter (EDI)? Så hent dette whitepaper og få et overblik over, hvad EDI er, og hvilke fordele producenter og grossister som dig kan se frem til, når du investerer i EDI til din forretning.