Alarmer forebygger systemnedbrud

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 30. september 2005.


Hempel Skibsfarver prøver at forebygge problemerne.

Det er bedre at forebygge end at helbrede. Med over 90 servere og brugere fordelt ud over Skandinavien og Europa tilslutter it-driftsafdelingen hos Hempel Skibsfarver i Lundtofte sig den recept. Den fem mand store gruppe foretrækker at forebygge problemerne.
- Vi anvender forskellige former for alarmer, der kan gøre os opmærksom på, at der er noget, der er ved at gå galt. Eksempelvis har vi defineret nogle grænseværdier for vores netværkstrafik. Hvis de grænseværdier brydes, er der højst sandsynligt et problem et eller andet sted. Næsten ingen netværkstrafik kan betyde problemer, ligesom meget netværkstrafik er et faresignal, siger Ole Hermansen, datacenter manager hos Hempel Skibsfarver.
I driftsafdelingen anvender man i vid udstrækning SNMP (Simple Network Management Protocol) til overvågning.
- SNMP er ikke er så simpel endda. Man kan få en masse information ved hjælp af den. Oplysninger om eksempelvis memory-forbrug, CPU-belastning og ledig diskplads. Fordelen ved SNMP er, at man ikke skal installere software-agenter på de forskellige netværksenheder, man ønsker at overvåge, da SNMP er en del af operativsystemet, siger Ole Hermansen.
Hempel Skibsfarver har afprøvet overvågningsprodukter, hvor man skulle installere særlig software på servere og andre netværksenheder, der skulle opsamle information om memory-forbrug,
- Hvis man begynder at installere agenter, kan man begynde at citere Bohr og kvantefysikken. Man påvirker det system, man observerer. Vi har afprøvet produkter, hvor agenterne fik maskinerne til at skvatte om, siger Ole Hermansen.
I dag anvender Hempel Skibsfarvers it-driftsafdeling i Lundtofte produktet Capmon fra Nworks til at opsamle en masse information om netværk, servere og applikationer. Ole Hermansen bruger informationen proaktivt, så nedbrud kan undgås.
- Hvis man for eksempel kan gå ind til økonomichefen og sige: "Vi havde 400 gigabyte ledig plads til at begynde med på den her disk, nu har vi 4 gigabyte. Hvis det fortsætter, går vi ned i næste uge", så er det noget, som han kan forstå, og problemerne kan dermed afbødes i tide, siger Ole Hermansen.

Driftsafdelingen praktiserer stadig, hvad Ole Hermansen kalder præventiv reboot.
- I et Windows-miljø kan det være nødvendigt at boote maskinerne præventivt. Det er
dog ikke så meget, som det har været. NT4 tabte stille og roligt ressourcer. Her var det nødvendigt at boote serveren engang imellem for at få frigivet RAM. Windows 2000 blev lidt bedre, og Windows 2003 er ret god, idet reboot ikke er så nødvendigt, fortæller Ole Hermansen.

Forebyggelsen handler dog ikke kun om teknik. Hempel Skibsfarver er i gang med at indføre IT Infrastructure Library (ITIL), der skal hjælpe til at strukturere arbejdsgangen i driftsafdelingen.
- Det var ikke så aktuelt, da vi kun havde to servere stående. Nu står der altså mange. Vi har behov for at få overblik og få struktureret vores arbejdsprocesser, siger Ole Hermansen, der ser frem til at få indført ITIL, selvom han har en sund skepsis over for standarden.
- ITIL er et sæt fornuftige spilleregler. Ingen tvivl om det. Der er dog lidt en tendens til, at der bygges et helt præsteskab op, der prædiker ITIL, holder kurser og skriver bøger. Det fylder lige pludseligt meget, siger Ole Hermansen.