(Foto: Dan Jensen)

Derfor blev AWS ramt af kæmpenedbrud i sidste uge

Store dele af internettet var lagt ned i sidste uge, da verdens største cloud-tjeneste blev ramt af nedbrud. Her er forklaringen på, hvad der skete.

25. november blev verdens største cloud-tjeneste Amazon Web Services (AWS) ramt af et stort nedbrud, der betød, at store dele af de største internet-tjenester var lagt ned.

Amazon Kinesis, der var den afdeling, der blev ramt, muliggør behandling i realtid af streamingdata.

Flere apps og tjenester meldte ud, på Twitter, at de havde problemer med AWS-tjenesterne. Blandt andet Adobe Spark, Flickr og The Washington Post, skriver mediet MENAFN.

Læs også: Dele af internettet lagt ned: AWS ramt af stort nedbrud

AWS forklarer nu, at nedbruddet ikke skyldtes – som før rapporteret – manglende hukommelse, men derimod installering af nye servere til netværket.

Implementeringen af de nye servere blev igangsat klokken 02.44 om morgenen lokal tid i AWS' datacenter i den amerikanske delstat Virginia og var afsluttet klokken 03.47.

Klokken 05.15 gik den første alarm, der underrettede Kinesis-medarbejderne om, at der var fejl i systemet.

Da medarbejderne kiggede nærmere på problemet, opdagede de, at der var fejl i alle aspekter af de forskellige opkald, der blev foretaget af eksisterende og nye front-end-servere, hvilket ifølge AWS "forværrede vores mulighed for at adskille bivirkninger fra grundårsagen".

Klokken 07.51 havde medarbejderne indsnævret mulighederne for, hvad der kunne være grundårsagen.

De indså, at nogen af ​​de mest sandsynlige kilder til problemet ville kræve en fuldstændig genstart af front-end-serverne.

Umiddelbart så det ud til, at der var tale om mangel på hukommelse.

Og denne fejlantagelse fordoblede restitutionstiden, da Kinesis endelig opdagede, at den nye kapacitet havde fået alle serverne til at overstige det maksimale antal tråde, der er tilladt af en operativsystem-konfiguration.

Da den egentlige årsag klokken 09.39 blev opdaget, begyndte Kinesis-teamet at tilføje de nye servere igen i langsomt tempo for at undgå overbelastning af systemet igen.

"Front-end-flåden består af mange tusinde servere, og af de årsager, der er beskrevet tidligere, kunne vi kun tilføje servere med et par hundrede i timen. Vi fortsatte med langsomt at tilføje trafik til front-end-flåden med Kinesis-fejlprocenten, der faldt støt fra middagstid og fremefter," forklarer AWS.

Først klokken 22.23 om aftenen var Kinesis tilbage på fuld kraft.

Læs mere på AWS' egen blog.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
IT Relation A/S
Outsourcing, hosting, decentral drift, servicedesk, konsulentydelser, salg og udleje af handelsvarer, udvikling af software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Fuel your IT with the best-kept secret in IBM

It takes massive computing power to accurately calculate weather forecasts – and to secure that people and businesses are able to access detailed information about whether it is going to rain, shine, storm, or snow. In this seminar, you will have the chance to hear the British Met Office describe how they do exactly that.

28. januar 2021 | Læs mere


Sandheden om Schrems II – erhvervslivets nye Cuba-krise

Konsekvenserne af Schrems II kan meget vel gå hen og blive en af de største udfordringer for danske virksomheder i 2021. Så tjek ind på denne onlinebriefing, hvor den hemmelige Schrems II gæst, ComplyCloud og Datatilsynet giver dig indsigt i, hvad dommen i virkeligheden handler om, og hvilke menneskelige hensyn der ligger bag.

29. januar 2021 | Læs mere


GDPR i dagligdagen: Fokus på Datatilsynets nye strategi ”Tilsyn med effekt” og Schrems II

GDPR er ikke statisk. Nu øger Datatilsynet GDPR-kontrollen med ny strategi i tre faser. Strategien har fået navnet 'Tilsyn med effekt', og med den åbner Datatilsynet op for et nyt koncept. Derudover er der med Schrems II kommet flere EU-retningslinjer, som man skal tage stilling til.

09. februar 2021 | Læs mere






Computerworld
Biden sender skjult besked til kode-folket: "Hvis du læser dette, har vi brug for din hjælp”
En stående invitation er blevet opdaget i kildekoden på Det Hvide Hus' hjemmeside. Men den er kun til de eksperter, der selv kan finde den.
CIO
Podcast: Hos Viking Life-Saving Equipment er it gået fra at være backend til at være noget, som kunderne spørger aktivt efter
Podcast, The Digital Edge: Viking leverer en stadig større del af deres produkt som en tjeneste. Som en del af tjenesten tager Viking ansvar for sikkerheden ved at levere, dokumentere og vedligeholde det nødvendige sikkerhedsudstyr. Hør hvordan Henrik Balslev senior digital director hos Viking har løftet den opgave.
White paper
Digital transformation tvinger organisationer til at nå deres digitale mål på nye måder
Allerede for to år siden hævdede nordiske virksomheder, at virksomhedernes konkurrenceevne og sågar overlevelse var afhængig af en vellykket digitalisering. De var klar, fulde af håb og på vej mod det digitale paradis. Hvordan gik det så? Hvor er de nu? For at finde ud af det, interviewede DigiPlex og Norstat 377 forretningsledere og IT-beslutningstagere fra organisationer fordelt over hele Danmark, Sverige og Norge om deres digitaliseringsfremskridt, om hvordan de har håndteret pandemien, og om hvordan IT understøtter eller står i vejen for indfrielsen af deres bæredygtighedsmål. DigiPlex kan nu dele en rapport med resultaterne fra undersøgelsen samt tanker om, hvordan man håndterer dem. De deler også nogle nyttige tips til, hvordan man skaber en pålidelig infrastruktur, der kan tilskynde til og understøtte ambitioner i den digitale økonomi. Læs mere i rapporten Nordic Data Center Trends 2020: Riding out the Storm.