Under motorhjelmen: Sådan sikrer Netflix sig mod nedbrud

Netflix er blandt verdens største cloud-kunder. Se her, hvordan selskabet har opbygget sin cloud-service, så du undgår at blive ramt af fejl og nedbrud.

Artikel top billede

Netflix har med sine 38 millioner kapacitets-krævende kunder fordelt på 40 lande katapulteret sig op i superligaen af verdens største og mest krævende cloud-kunder

Selskabet streamer flere hundrede millioner timers indhold hver eneste måned, og det er noget, der stiller krav til leverandørernes muskler.

Lad os tage et kig på nogle af denne gigantiske cloud-forbrugers erfaringer, som vi (måske) kan lære noget af.

Erfaringerne stammer fra selskabets cloud-direktør Ariel Tseitlin, der for nylig talte med Computerworlds amerikanske nyhedsbureau.

Selskabets kunde-rettede tjenester - blandt andet en stor database, der på baggrund af den enkelte brugers seer-vaner kommer med udvalgte anbefalinger - kører på Amazons store public-cloud tjeneste, Amazon Web Service.

Netflix' indholdsplatform hedder Open Connect, som selskabet driver sammen med lokale ISP'ere.

Mikro-tjenester

En af Netflix' erklærede mål er at bygge et system, hvor effekten af nedetid eller service-nedbrud i cloud'en har mindst mulig effekt for det mindst mulige antal brugere - mindst mulig 'blast radius,' som Netflix selv betegner det.

Løsningen: Enkle og simple backup-løsninger, der minimerer abstraktions-nivauet.

Eksempel: Crasher databasen, der præsenterer forslag til den enkelte bruger på baggrund af historik, vil Netflix præsentere en generisk liste med nogle af de mest populære titler, der ikke er personlige.

På den måde minimeres system-belastningen ved et crash, hvorved andre systemer ikke overbelastes.

Skalering - masser af redundans

Suget på Netflix' varierer, og det er derfor vigtigt for selskabet at kunne skalere i en fart, så der hele tiden er kapacitet nok til alle kunder, der logger på tjenesten.

Netflix' løsning er at anvende forskellige systemer.

Hver tjeneste bliver således udsendt til mindst tre såkaldte 'Availability Zones,' der er isolerede lokationer i Amazons cloud-løsning.

Open source-systemer får det hele til at crashe

Hver af de tre 'Availability Zones' kan skalere individuelt.

Det betyder blandt andet, at Netflix kan lede trafikken over på en sund AZ'er, hvis en af dem går ned.

Hertil kommer, at hele Netflix-tjenesten er spejlet i to gigantiske regioner i Amazon-clouden - nemlig US East og EU West, der replikerer asynkront.

Det betyder, at den ene af de to regioner kan tage over, hvis den anden fejler, så tjenesten hele tiden vil være tilgængelig.

Vær modstandsdygtig

Netflix er plastret til med monitoreringsløsninger og alert-løsninger, der melder, når der opstår fejl.

Selskabet har selv udviklet en ny platform til monitorering af selskabets tjenester og til at løse de fejl, der finder sted.

Værktøjskassen hedder 'The Simian Army' og består af en serie open source-baserede værktøjer, som anvendes til løbende test af systemerne.

Blandt dem finder vi værktøjer med navne som Chaos Monkey, der løbende nedlukker tilfældige tjenester for at teste, om backup-systemerne i applikations-laget nu også virker.

Hertil kommer værktøjet Chaos Gorilla, der sporadisk kan finde på at lukke en helt 'Availability Zone' ned for på samme måde at se, om nødsystemerne virker.

Selskabet arbejder for tiden på at udvikle værktøjet Chaos Kong, som på samme måde skal kunne lukke en hel region ned.

Cloud-chef Ariel Tseitlin siger til Computerworlds amerikanske nyhedsbureau, at selskabet går så meget op i monitorering og test, at den interne snak ofte går på, at Netflix egentlig er et monitorerings-selskab, der af og til leverer film til brugerne.

Netflix forventer inden for de kommende år også at flytte alle selskabets in-house back-end tjenester over i cloud'en. Målet er slet ikke at køre egne datacentre overhovedet.

Selskabet har allerede flyttet fra Exchange til Google Apps.

Blandt de kommende udfordringer er arbejdet med at flytte betalingsløsningerne ud i skyen.

Læs også: Sådan får du adgang til den amerikanske udgave af Netflix

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    Andre events | København Ø

    People Tech 2025 – hvor HR møder IT

    Deltag og oplev, hvordan People Tech 2025 kan gøre HR til en nøglespiller i fremtidens forretningsstrategi.

    Infrastruktur | Frederiksberg

    Roundtable: Hybrid og cloud – sikre og strategiske it-valg i en ustabil verden

    Eksklusive danske digitale ledere mødes til rundbordssamtale om balancen mellem fart, sikkerhed og compliance. Hør hvordan CIO’er bygger robuste hybrid cloud-strategier, der skaber reel forretningsværdi og styrker modstandskraften.

    Sikkerhed | København

    Strategisk It-sikkerhedsdag 2026 - København

    Få overblik over cybersikkerhedens vigtigste teknologier, trusler og strategiske valg. Hør skarpe oplæg om AI-risici, forsvar, compliance og governance. Vælg mellem to spor og styrk både indsigt og netværk. Deltag i København 20. januar.

    Se alle vores events inden for it

    Styrelsen for Danmarks Fængsler

    Souschef til tekniske projekter og arkitektur

    Københavnsområdet

    Aller Leisure A/S

    Aller Leisure søger en Frontend-udvikler (.Net)

    Københavnsområdet

    Statens IT

    Databaseadministrator med fokus på MS-SQL

    Københavnsområdet

    Rambøll Management Consulting

    Senior Software Engineer

    Midtjylland

    Navnenyt fra it-Danmark

    Norriq Danmark A/S har pr. 1. september 2025 ansat Ahmed Yasin Mohammed Hassan som Data & AI Consultant. Han kommer fra en stilling som selvstændig gennem de seneste 3 år. Han er uddannet cand. merc. i Business Intelligence fra Aarhus Universitet. Nyt job

    Ahmed Yasin Mohammed Hassan

    Norriq Danmark A/S

    Norriq Danmark A/S har pr. 1. oktober 2025 ansat Huy Duc Nguyen som Developer ERP. Han skal især beskæftige sig med at bidrage til at udvikle, bygge og skræddersy IT-løsninger, der skaber vækst og succes i vores kunders forretninger. Han kommer fra en stilling som Software Developer hos Navtilus. Han er uddannet i bioteknologi på Aalborg University. Nyt job

    Huy Duc Nguyen

    Norriq Danmark A/S

    Norriq Danmark A/S har pr. 1. september 2025 ansat Hans Christian Thisen som AI Consultant. Han skal især beskæftige sig med at bidrage til udvikling og implementering af AI- og automatiseringsløsninger. Nyt job

    Hans Christian Thisen

    Norriq Danmark A/S

    Industriens Pension har pr. 3. november 2025 ansat Morten Plannthin Lund, 55 år,  som it-driftschef. Han skal især beskæftige sig med it-drift, it-support og samarbejde med outsourcingleverandører. Han kommer fra en stilling som Head of Nordic Operations Center hos Nexi Group. Han er uddannet HD, Business Management på Copenhagen Business School. Han har tidligere beskæftiget sig med kritisk it-infrastruktur og strategiske it-projekter. Nyt job

    Morten Plannthin Lund

    Industriens Pension