Google: Sådan sikrer vi høj oppetid på vores tjenester

Google henter meget høj oppetid ved at give team-folkene bag hver enkelt Google-tjeneste lov til, at tjenesterne går ned. Se her, hvordan det hænger sammen.

Artikel top billede

(Foto: Dan Jensen)

Oppetid er afgørende for et internet-selskab af Googles størrelse - ikke mindst når det gælder selskabets satsning rettet mod erhvervslivet og professionelle, cloud-baserede løsninger.

Google har gennem årene udviklet en særlig tilgang til oppetid, som Ben Treynor, der er udviklingschef og grundlægger af Googles såkaldte reliability-team, har stået i spidsen for.

Først og fremmest sigter Google ikke efter 100 procent oppetid, da det er et urealistisk mål at sætte sig, mener Ben Treynor.

Hvert Google-produkt har derfor fået fastlagt den maksimalt acceptable nedetid i de SLA'er, der hører til hvert produkt.

Med en maksimal acceptabel nedetid på for eksempel 0,01 procent (altså oppetid på 99,9 procent) kan en tjeneste 'lovligt' være nede i 43 minutter om måneden eller otte timer og 40 minutter om året.

Ben Treynor kalder denne tilladte nedetid for 'fejl-budgettet.'

Internt i Google-organisationen gælden den tommelfinger-regel, at de forskellige team-ledere og deres hold ikke behøver at være helt perfekte - sålænge de kan levere mindre nedetid end SLA'en for det produkt, som de passer, tilsiger.

Det betyder, at hvert produkt-team kan trække på deres eget 'fejl-budget,' som bare ikke må overskrides - og som helst skal være langt fra udfyldt.

Ben Treynor siger, at de traditionelle modeller for oppetid næsten altid er plaget af, at de såkaldte 'site reliability engineers' - altså driftsfolkene - ikke har samme tilgang til arbejdet som produkt-cheferne.

Produkt-cheferne vil nemlig altid gerne tilføre flere services og flere løsninger til produktet, mens drifts-folkene ikke bryder sig om forandringer, fordi alle forandringer - og ikke mindst nye løsninger - altid medfører nye problemer.

Ifølge Ben Treynor giver 'fejl-budgettet' i SLA'erne plads til, at produkt-cheferne og drifts-folkene kan mødes et sted på midten.

Er nødt til at fokusere på stabilitet

For produkt-folkene kan kun launche nye løsninger, hvis produktet lever op til oppetids-kravene i SLA'en. Er nedetiden større, end det maksimalt er tilladt i SLA'en, kan teamet ikke sætte nye løsninger og services i søen.

Ifølge Google ligger fidusen i, at produkt-folkene med denne regel er nødt til at fokusere på at udvikle pålidelige og stabile systemer, fordi de ellers får problemer med den videre udvikling.

Med plads til en smule nedetid får udviklerne til gengæld en smule spillerum, så udviklingen ikke bliver forkrampet og for langvarig, fordi ingen tør tage chancer.

Tilgangen ser faktisk ud til at virke. I hvert fald viser tal fra analysehuset CloudHarmony, at Googles cloud-platform er blandt de mest stabile af de store platforme.

I fjor var Google Cloud Platform således nede i alt 4,46 timer, mens Microsoft Azure til sammenligning var nede i 39,77 timer med i alt 92 nedbrud.

Amazon Web Services - der især er stor på det amerikanske marked - var kun nede i 2,41 timer hele sidste år.

Du kan se mere om de store cloud-tjenesters nedetid her: Opgørelse: Så ofte går dine cloud-løsninger i sort

Du kan se Ben Treynor fortælle om Googles tilgang til nedetid og oppetid her.

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    Sikkerhed | Online

    Connected sikkerhed: Sådan samles netværk, drift og sikkerhed i én platform

    Få indblik i, hvordan NaaS og SOC samler netværk og sikkerhed i én platform. Hør Semler Group dele erfaringer med hurtigere trusselsrespons, færre leverandører og mindre kompleks drift. Deltag og se, hvordan moderne sikkerhedsdrift skalerer i...

    Infrastruktur | Frederiksberg

    Roundtable: Suverænitet, risk management og resiliens i en urolig verden

    Digital suverænitet er rykket fra politisk debat til konkret risikostyring.På dette eksklusive dinner roundtable samler Computerworld, T-Systems og Palo Alto Networks 12-15 ledende it- og sikkerhedsbeslutningstagere til en fortrolig samtale om...

    Se alle vores events inden for it

    Navnenyt fra it-Danmark

    SAP SuccessFactors Partner Pentos har pr. 1. marts 2026 ansat Plamena Cherneva som Seniorkonsulent indenfor SuccessFactors HCM. Hun skal især beskæftige sig med konfiguration og opsætning af SuccessFactors suiten, samt udvikle smarte løsninger til mellemstore danske virksomheder. Hun kommer fra en stilling som løsningsarkitekt indenfor HR IT hos LEO Pharma. Hun har tidligere beskæftiget sig med HR procesdesign, stamdata og onboarding. Nyt job

    Plamena Cherneva

    SAP SuccessFactors Partner Pentos

    Elbek & Vejrup A/S har pr. 1. juni 2026 ansat Mikkel Bernt Buchvardt som AI Architect & Product Manager. Han skal især beskæftige sig med udviklingen af AI-Services og AI-Agenter i og omkring Business Central. Han kommer fra en stilling som Lead Data & Analytics hos IBM. Han er uddannet MSc. i softwareudvikling fra ITU. Han har tidligere beskæftiget sig med Data og BI hos KMD og Seges Innovation. Nyt job

    Mikkel Bernt Buchvardt

    Elbek & Vejrup A/S

    Netip A/S har pr. 1. april 2026 ansat Claus Berg som Account Manager ved netIP's kontor i Esbjerg. Han kommer fra en stilling som Client Manager hos itm8. Nyt job

    Claus Berg

    Netip A/S

    Den danske eID-virksomhed Idura har pr. 1. april 2026 ansat Kari Lehtimäki som Country Manager. Han skal især beskæftige sig med at styrke kendskabet til Iduras løsninger i Finland samt fremme samarbejdet med økosystemet omkring det finske Trust Network. Han kommer fra en stilling som Salgschef hos Telia Finland. Han er uddannet uddannet civilingeniør (M.Sc. Tech.) og medbringer ledelse, markedsindsigt og praktisk erfaring. Han har tidligere beskæftiget sig med salg og forretningsudvikling inden for Telias trust services-forretning. Nyt job

    Kari Lehtimäki

    Den danske eID-virksomhed Idura