ANNONCE:
Indholdsfortegnelse:
Som regel kan fejlene afhjælpes, uden at brugerne bemærker noget, men i enkelte tilfælde forplanter små fejl sig til hele datacentret og kan medføre et decideret nedbrud, som det skete den 9. april for IBM.
Fejl er en del af virkeligheden i et datacenter. Erfarne datacenterkonsulenter beskriver her, hvad der kan gå galt, og hvordan katastroferne kan undgås.
Failover er mange ting
Noget af det første, man skal gøre sig klart vedrørende failover, er, at det ikke kun er ét begreb.
I et datacenter er der mange hardware- og softwarekomponenter, der indgår i et kompliceret samspil. Ved at have en - eller flere - kopier af komponenterne i datacentret kan man have såkaldt redundans.
Hvis en komponent fejler, tager kopien over fra den fejlende komponent, og systemet kører videre, uden at brugerne bemærker noget.
Det lyder enkelt, men i realiteten er det en kompleks opgave, da det skal foregå i et komplekst miljø.
"Der indgår mange, mange, mange forskellige komponenter inden for storage, netværk og servere," siger Josh Krischer, der betragtes som en af de mest indsigtsfulde og erfarne datacenterkonsulenter.
Som research vice president hos analysevirksomheden Gartner specialiserede han sig i en årrække inden for server-, storage- og datacenterteknologi.
Han fremhæver, at failover-mekanismerne skal sørge for at bevare datakonsistens, hvis man foretager failover fra et primært datacenter til et sekundært datacenter.
Fejl er en daglig foreteelse
Netop muligheden for failover mellem datacentre er noget, som IBM's kunder forventer, og noget som IBM selv fremhæver.
I en Computerworld CTO-artikel fra 2006 beskriver IBM, hvordan højhastighedsfiber forbinder IBM's datacentre og skaber et virtuelt datacenter:
"Datacentrene er bundet sammen med dark fiber, så de kan betragtes som ét datacenter. En mainframe i Ballerup kan have storage i Ejby; højhastighedsforbindelsen betyder, at den geografiske afstand ikke har nogen betydning. Rent sikkerhedsmæssigt har den geografiske afstand dog betydning, da centrene kan aflaste hinanden i tilfælde af en ulykke som brand eller lignende," sagde nordic site manager Henrik Melms.
IBM har ikke ønsket at kommentere oplysningerne fra 2006-artiklen yderligere.
Leder af et datacenter, der står bag et højt profileret website, er Amazons CTO Werner Vogels.
"Amazon.com fejler hele tiden. Det kan være fejl i alt fra memory-chips over en server til et helt datacenter. Det er ikke interessant, hvor mange gange der er nedbrud. Det er interessant, hvor lang tid et nedbrud varer. Hvis vi har et udfald på et par sekunder, betyder det ikke så meget, som hvis udfaldet måles i timer. Vi bygger så vidt muligt autonomi ind i vores arkitektur. Enhver komponent skal helst være i stand til at træffe uafhængige beslutninger og må ikke være afhængig af andre," udtalte Amazons øverste tekniske chef til Computerworld CTO i 2006.
Fortsættes ...


