Podcast:Her er de nye (dyre) iPads og den nye Surface Laptop - men kan manglen på chips drille?

Google: Sådan sikrer vi høj oppetid på vores tjenester

Google henter meget høj oppetid ved at give team-folkene bag hver enkelt Google-tjeneste lov til, at tjenesterne går ned. Se her, hvordan det hænger sammen.

Oppetid er afgørende for et internet-selskab af Googles størrelse - ikke mindst når det gælder selskabets satsning rettet mod erhvervslivet og professionelle, cloud-baserede løsninger.

Google har gennem årene udviklet en særlig tilgang til oppetid, som Ben Treynor, der er udviklingschef og grundlægger af Googles såkaldte reliability-team, har stået i spidsen for.

Først og fremmest sigter Google ikke efter 100 procent oppetid, da det er et urealistisk mål at sætte sig, mener Ben Treynor.

Hvert Google-produkt har derfor fået fastlagt den maksimalt acceptable nedetid i de SLA'er, der hører til hvert produkt.

Med en maksimal acceptabel nedetid på for eksempel 0,01 procent (altså oppetid på 99,9 procent) kan en tjeneste 'lovligt' være nede i 43 minutter om måneden eller otte timer og 40 minutter om året.

Ben Treynor kalder denne tilladte nedetid for 'fejl-budgettet.'

Internt i Google-organisationen gælden den tommelfinger-regel, at de forskellige team-ledere og deres hold ikke behøver at være helt perfekte - sålænge de kan levere mindre nedetid end SLA'en for det produkt, som de passer, tilsiger.

Det betyder, at hvert produkt-team kan trække på deres eget 'fejl-budget,' som bare ikke må overskrides - og som helst skal være langt fra udfyldt.

Ben Treynor siger, at de traditionelle modeller for oppetid næsten altid er plaget af, at de såkaldte 'site reliability engineers' - altså driftsfolkene - ikke har samme tilgang til arbejdet som produkt-cheferne.

Produkt-cheferne vil nemlig altid gerne tilføre flere services og flere løsninger til produktet, mens drifts-folkene ikke bryder sig om forandringer, fordi alle forandringer - og ikke mindst nye løsninger - altid medfører nye problemer.

Ifølge Ben Treynor giver 'fejl-budgettet' i SLA'erne plads til, at produkt-cheferne og drifts-folkene kan mødes et sted på midten.

Er nødt til at fokusere på stabilitet
For produkt-folkene kan kun launche nye løsninger, hvis produktet lever op til oppetids-kravene i SLA'en. Er nedetiden større, end det maksimalt er tilladt i SLA'en, kan teamet ikke sætte nye løsninger og services i søen.

Ifølge Google ligger fidusen i, at produkt-folkene med denne regel er nødt til at fokusere på at udvikle pålidelige og stabile systemer, fordi de ellers får problemer med den videre udvikling.

Med plads til en smule nedetid får udviklerne til gengæld en smule spillerum, så udviklingen ikke bliver forkrampet og for langvarig, fordi ingen tør tage chancer.

Tilgangen ser faktisk ud til at virke. I hvert fald viser tal fra analysehuset CloudHarmony, at Googles cloud-platform er blandt de mest stabile af de store platforme.

I fjor var Google Cloud Platform således nede i alt 4,46 timer, mens Microsoft Azure til sammenligning var nede i 39,77 timer med i alt 92 nedbrud.

Amazon Web Services - der især er stor på det amerikanske marked - var kun nede i 2,41 timer hele sidste år.

Du kan se mere om de store cloud-tjenesters nedetid her: Opgørelse: Så ofte går dine cloud-løsninger i sort

Du kan se Ben Treynor fortælle om Googles tilgang til nedetid og oppetid her.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Despec Denmark A/S
Distributør af forbrugsstoffer, printere, it-tilbehør, mobility-tilbehør, ergonomiske produkter, kontor-maskiner og -tilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Sådan gør IT bæredygtighed til en god forretning

Presset øges i disse år på virksomheder for at begrænse klimabelastningen. IT og teknologi spiller en nøglerolle i arbejdet, hvilket er emnet for denne konference. Her kan du blive klogere på, hvordan du aktivt arbejder for at kombinere effektiv og lønsom forretningsdrift med en effektiv bæredygtighedsindsats.

20. april 2021 | Læs mere


The Successful Journey to the Cloud

Cloud usage on enterprise level is growing rapidly and for good reason. With the flexibility and scalability offered by cloud, businesses and organizations can harness new technologies, increase resiliency and adapt to changing demands at an unprecedented level. In this webinar we address some of the important issues to consider when embarking on your cloud adoption journey.

21. april 2021 | Læs mere


IT Security 2021

Strategic IT Security 2021 will focus on the never-ending story about security and cyber-defense, and how you can defend your business and your customer’s data and information. Together with several leading experts and digital executives from all over the Nordic countries, this conference seeks to give you the best input to focus even more on cyber security in the future.

22. april 2021 | Læs mere






Premium
Efter vanskeligt år jagter aarhusianske Mjølner nu tocifrede vækstrater: Vil for alvor indtage Sjælland - her er planen
Interview: Efter et corona-plaget år er aarhusianske Mjølner Informatics nu klar til at trykke på speederen. Topchef Brian Gottorp Jeppesen forventer tocifrede vækstrater, der især skal hentes fra det sjællandske marked. Se hans plan for 2021 her.
Computerworld
Næste uge går det løs: Apple inviterer til event på utraditionel vis
Apples store event i næste uge blev afsløret af Siri før tid. Få overblik over, hvad Apple ventes af løfte sløret for.
CIO
Har du rost din mellemleder i dag? Snart er de uddøde - og det er et tab
Computerworld mener: Mellemledere lever livet farligt: Topledelsen får konstant ideer med skiftende hold i virkeligheden, og moden går mod flade agile organisationer. Men mellemlederen er en overset hverdagens helt med et kæmpe ansvar. Her er min hyldest til den ofte latterliggjorte mellemleder.
Job & Karriere
"Vi var nødt til at sige til dem, at I er nødt til at sende ham hjem nu, for han begynder at knække"
"Vi var nødt til at sige til dem, at I er nødt til at sende ham hjem nu, for han begynder at knække"
White paper
Har du både dine applikationer og dit hoved i skyen?
Kan du nikke ja til en eller flere af disse situationer? • I bruger mange cloud-applikationer • I logger ind fra flere lokationer • I logger ind fra flere forskellige typer af devices Så kan du få stort udbytte af at læse dette whitepaper … Hver dag tilgår, navigerer og arbejder jeres medarbejdere i de applikationer, I har liggende i ”skyen”. Antallet af cloud-baserede applikationer stiger eksplosivt, så hvordan sikrer I ADGANGEN til dem og til de data, som applikationerne indeholder? Vel at mærke uden at gå på kompromis med BRUGERVENLIGHEDEN? Løsningen er Access Management, som er hovedtemaet for dette whitepaper.