Artikel top billede

(Foto: Dan Jensen)

Derfor blev AWS ramt af kæmpenedbrud i sidste uge

Store dele af internettet var lagt ned i sidste uge, da verdens største cloud-tjeneste blev ramt af nedbrud. Her er forklaringen på, hvad der skete.

25. november blev verdens største cloud-tjeneste Amazon Web Services (AWS) ramt af et stort nedbrud, der betød, at store dele af de største internet-tjenester var lagt ned.

Amazon Kinesis, der var den afdeling, der blev ramt, muliggør behandling i realtid af streamingdata.

Flere apps og tjenester meldte ud, på Twitter, at de havde problemer med AWS-tjenesterne. Blandt andet Adobe Spark, Flickr og The Washington Post, skriver mediet MENAFN.

Læs også: Dele af internettet lagt ned: AWS ramt af stort nedbrud

AWS forklarer nu, at nedbruddet ikke skyldtes – som før rapporteret – manglende hukommelse, men derimod installering af nye servere til netværket.

Implementeringen af de nye servere blev igangsat klokken 02.44 om morgenen lokal tid i AWS' datacenter i den amerikanske delstat Virginia og var afsluttet klokken 03.47.

Klokken 05.15 gik den første alarm, der underrettede Kinesis-medarbejderne om, at der var fejl i systemet.

Da medarbejderne kiggede nærmere på problemet, opdagede de, at der var fejl i alle aspekter af de forskellige opkald, der blev foretaget af eksisterende og nye front-end-servere, hvilket ifølge AWS "forværrede vores mulighed for at adskille bivirkninger fra grundårsagen".

Klokken 07.51 havde medarbejderne indsnævret mulighederne for, hvad der kunne være grundårsagen.

De indså, at nogen af ​​de mest sandsynlige kilder til problemet ville kræve en fuldstændig genstart af front-end-serverne.

Umiddelbart så det ud til, at der var tale om mangel på hukommelse.

Og denne fejlantagelse fordoblede restitutionstiden, da Kinesis endelig opdagede, at den nye kapacitet havde fået alle serverne til at overstige det maksimale antal tråde, der er tilladt af en operativsystem-konfiguration.

Da den egentlige årsag klokken 09.39 blev opdaget, begyndte Kinesis-teamet at tilføje de nye servere igen i langsomt tempo for at undgå overbelastning af systemet igen.

"Front-end-flåden består af mange tusinde servere, og af de årsager, der er beskrevet tidligere, kunne vi kun tilføje servere med et par hundrede i timen. Vi fortsatte med langsomt at tilføje trafik til front-end-flåden med Kinesis-fejlprocenten, der faldt støt fra middagstid og fremefter," forklarer AWS.

Først klokken 22.23 om aftenen var Kinesis tilbage på fuld kraft.

Læs mere på AWS' egen blog.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
IT Relation A/S
Outsourcing, hosting, decentral drift, servicedesk, konsulentydelser, salg og udleje af handelsvarer, udvikling af software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Summit 2021

En moderne digital vindervirksomhed bringer nye teknologier i spil, skaber digital innovation, udnytter data som styringsværktøj og ser verden som én stor markedsplads. Men succes kræver, at du ved, hvor den dyre teknologi kan gøre den største forskel i forretningen. Den kræver, at du ved i hvilken retning den øgede politiske regulering af teknologi og data bevæger sig hen. Og den succes kræver, at du kan udnytte teknologien til at automatisere og skalere til gavn for bundlinjen og budgettet.

26. oktober 2021 | Læs mere


CIO Trends 2021: Sådan ser teknologiradaren ud hos Danmarks bedste CIOs

Teknologien i virksomheder spiller i den grad en større og større rolle, hvor vi er nødt til at stille endnu større krav til, hvordan vi udnytter den, og hvilke muligheder den giver. Spørgsmålet er dog, hvordan man formår at lede en virksomhed, der konstant skal forholde sig til teknologiens forandringer.

16. november 2021 | Læs mere


How to Sikkerhed: Awareness, email fraud og phishing

Man kan aldrig vide sig sikker, for uanset hvor godt man sikrer sig mod hackerangreb og anden svindel, vil hacker næsten altid være et skridt foran. De går efter organisationernes svageste led i håbet om at kunne snyde sig til data, penge eller andet værdifuldt. Få derfor konkrete bud på, hvordan du kan gribe opgaven an og understøtte et effektivt awareness-niveau i din organisation med enkel, men velfungerende, teknologi.

17. november 2021 | Læs mere