Sådan undgår du totalt kollaps i dit datacenter


Publiceret d. 23. maj 2008 kl. 07.00


Annonce:
 
ANNONCE:
 
 
 
I datacentre opstår der hver dag mange fejl, som på den ene eller anden måde skal afhjælpes.

Som regel kan fejlene afhjælpes, uden at brugerne bemærker noget, men i enkelte tilfælde forplanter små fejl sig til hele datacentret og kan medføre et decideret nedbrud, som det skete den 9. april for IBM.

Fejl er en del af virkeligheden i et datacenter. Erfarne datacenterkonsulenter beskriver her, hvad der kan gå galt, og hvordan katastroferne kan undgås.

Failover er mange ting
Noget af det første, man skal gøre sig klart vedrørende failover, er, at det ikke kun er ét begreb.

I et datacenter er der mange hardware- og softwarekomponenter, der indgår i et kompliceret samspil. Ved at have en - eller flere - kopier af komponenterne i datacentret kan man have såkaldt redundans.

Hvis en komponent fejler, tager kopien over fra den fejlende komponent, og systemet kører videre, uden at brugerne bemærker noget.

Det lyder enkelt, men i realiteten er det en kompleks opgave, da det skal foregå i et komplekst miljø.

"Der indgår mange, mange, mange forskellige komponenter inden for storage, netværk og servere," siger Josh Krischer, der betragtes som en af de mest indsigtsfulde og erfarne datacenterkonsulenter.

Som research vice president hos analysevirksomheden Gart­ner specialiserede han sig i en årrække inden for server-, storage- og datacenterteknologi.

Han fremhæver, at failover-mekanismerne skal sørge for at bevare datakonsistens, hvis man foretager failover fra et primært datacenter til et sekundært datacenter.
Fejl er en daglig foreteelse

Netop muligheden for failover mellem datacentre er noget, som IBM's kunder forventer, og noget som IBM selv fremhæver.

I en Computerworld CTO-artikel fra 2006 beskriver IBM, hvordan højhastighedsfiber forbinder IBM's datacentre og skaber et virtuelt datacenter:

"Datacentrene er bundet sammen med dark fiber, så de kan betragtes som ét datacenter. En mainframe i Ballerup kan have storage i Ejby; højhas­tighedsforbindelsen betyder, at den geografiske afstand ikke har nogen betydning. Rent sikkerhedsmæssigt har den geografiske afstand dog betydning, da centrene kan aflaste hinanden i tilfælde af en ulykke som brand eller lignende," sagde nordic site manager Henrik Melms.

IBM har ikke ønsket at kommentere oplysningerne fra 2006-artiklen yderligere.

Leder af et datacenter, der står bag et højt profileret website, er Amazons CTO Werner Vogels.

"Amazon.com fejler hele tiden. Det kan være fejl i alt fra memory-chips over en server til et helt datacenter. Det er ikke interessant, hvor mange gange der er nedbrud. Det er interessant, hvor lang tid et nedbrud varer. Hvis vi har et udfald på et par sekunder, betyder det ikke så meget, som hvis udfaldet måles i timer. Vi bygger så vidt muligt autonomi ind i vores arkitektur. Enhver komponent skal helst være i stand til at træffe uafhængige beslutninger og må ikke være afhængig af andre," udtalte Amazons øverste tekniske chef til Computerworld CTO i 2006.

Fortsættes ...
« forrige side
1 2 3






Kommentarer - Debatoversigt


Der er endnu ikke nogen kommentarer til denne artikel. Du kan skrive en kommentar ved at udfylde nedenstående formular
Kommentér
Titel:

Ytringer på debatten er afsenders eget ansvar - læs debatreglerne

Forsiden lige nu

Nyudnævnt KMD-direktør skal lukke digitale huller og gafle gevinster i en ny KMD-storsatsning på skole-området. Læs her, hvad it-gigantens planer er med vores skolebørn.
25. maj 2012 kl. 12.59 | læs »

ComputerViews: Microsoft har endnu ikke nogen Office-pakke til hverken iOS eller Android. Det er der flere gode grunde til.
25. maj 2012 kl. 07.00 | (3) | læs »

I flere områder af landet skal et nu konkursramt firma være garant for bredbånds-forbindelser.
25. maj 2012 kl. 11.40 | læs »

I hundredvis af it-ansatte får i denne tid en fyringsseddel. Her er opskriften på at finde et andet job.
25. maj 2012 kl. 12.20 | læs »





 
White papers
Oracle SOA Suite er medlem i familien af Oracle Fusion Middleware-produkter, der giver dig en...

Få i denne Computerworld Guide seneste nyt om, hvordan business intelligence spiller en større og...

Læs i denne Computerworld Guide fra september 2011 to oplysende artikler om emnet business...

 


Mest læste seneste uge

Kan gratis sikkerhedssoftware virkelig beskytte din pc? Svaret er ja, hvis du vælger det rette produkt. Læs her en test af de mest pålidelige gratis sikkerhedsprogrammer.

Næsten 200 IBM-ansatte får med få timers varsel sidste arbejdsdag i dag. Ingen var orienteret forud for dagens massefyring, som effektueres øjeblikkeligt.

Flyselskabet SAS har brugt op mod trekvart milliarder kroner og seks år på at udskifte sit bookingsystem. Undervejs har der været flere projekt-udfordringer, som kulminerede en vinternat med en big bang-migrering.

To danske it-studerende har udviklet et program, der kan suge kundernes CPR-numre ud af teleselskaberne.

Her er forklaringen på, at IBM Danmark med direktør Lars Mikkelgaard-Jensen i spidsen fyrer 170 medarbejdere.