Avatar billede andersbodilsen Nybegynder
18. december 2004 - 20:10 Der er 35 kommentarer og
1 løsning

Problemer med raid array

Jeg har lige været så uheldig at min Linux server er gået ned. Jeg tror det er en del af filsystemet der er gået kold... Det er virker ikke som en fysisk fejl.
Min Promise SX6000 raid controller melder ihvertfald ikke fejl på array'et.

Array'et består af 6 120GB diske af mærket Maxtor.

Er der mulighed for at jeg kan regenere data'en der lå på diskene???
Ville være surt hvis jeg skal bruge tid på at lave alle mine konfigurations filer igen.
Avatar billede lap Nybegynder
18. december 2004 - 20:12 #1
går ud fra, at det er hardware raid?
Hvad sker der, når maskinen startes op?
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 20:16 #2
ja, det er et hardware raid...
Når jeg starter kommer den med en bios fejl: bip - pause - bip - pause - bip - pause osv...
Derudover kommer der en fejl omkring på skærmen... 2sek tjekker lige.
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 20:17 #3
det er forresten en raid bios fejl
Avatar billede lap Nybegynder
18. december 2004 - 20:18 #4
det ligner indtil videre en hardware fejl - ikke nødvendigvis diske men men strøm, controller eller noget andet (:-).

Hvilen fejl kommer fra raid bios?
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 20:22 #5
fejl på skærmen:

write scsi: aborting command due to timeout: pid 122, scsi0, channel 0, id 0, lun 0
WRITE (10) 00 00 03 30 20 00 00 08 00
Avatar billede lap Nybegynder
18. december 2004 - 20:24 #6
det ligner død disk - raid level? forhåbentlig er det fejltolerant - så burde det hele jo køre videre.

Kan du komme i raid bios og få status på de enkelte diske?
Avatar billede lap Nybegynder
18. december 2004 - 20:25 #7
http://www.promise.com/support/download/download2_eng.asp?productId=86&category=All&os=100

Har du nyeste bios på - ser ud til, at det kan gå ned hvis en disk fejler?
Avatar billede lap Nybegynder
18. december 2004 - 20:28 #8
Avatar billede lap Nybegynder
18. december 2004 - 20:42 #9
write scsi: aborting command due to timeout: pid 122, scsi0, channel 0, id 0, lun 0
WRITE (10) 00 00 03 30 20 00 00 08 00

ligner til gengæld en besked fra linux??
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 21:54 #10
Jeg har været inde i bios, alle diske ser ud til at være i orden. Jeg køre raid 5.
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 21:59 #11
Det vil sige at alle diske står til at være "Functional"
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 22:32 #12
Den opdatering som du (lap) nævner i starten virker som en god ide. Men kan jeg godt opdatere uden at jeg mister den nuværende konfiguration?????
Avatar billede lap Nybegynder
18. december 2004 - 23:11 #13
tja, det ved jeg ikke - kender ikke controlleren. De fleste raidcontrollere gemmer konfiguration både i controller og på disk (hvis den skulle ryge).

Har du mulighed for at checke dine arrays?

Linux beskeden er, at det ikke er muligt at skrive til disken - har du opdateret kerne eller lignende?

Dit raid - er det 6 diske i et stort raid 5 - altså en disk bliver præsenteret for operativsystem?
Avatar billede andersbodilsen Nybegynder
18. december 2004 - 23:42 #14
Jeg har lige formateret serveren... Det vil sige alt på nær /var/ftp/ hvorunder jeg gemmer alle mine konfigurations filer.... Det er en stor patition på ca. 500 GB...

Resten af partionerne som /etc, /usr, /tmp, /boot er lige blevet formateret...

Efter formateringen flyttede jeg alle mine konfigurations filer, fra /var/ftp/* tilbage til hvor de plejede at ligge...
Dette har jeg gjordt masser  af gange før hvor det har virket. Men bare ikke denne gange..
Så jeg har altså ikke lavet en kerne opgradering men en formatering af det MESTE af mit filsystem.

Og ja, alle diskene sidder i et stort raid 5, som ligner en stor disk for operativ systemet...
Men den er delt op i mange mindre partitioner... og en stor på 500GB "/var/ftp"
Avatar billede lap Nybegynder
19. december 2004 - 09:32 #15
det virker fortsat underligt, at kontroller melder alt ok, hvis du ikke kan skrive til disken.

Jeg mener fortsat, at array skal kontrolleres på kontrolleren (den bør sætte et eller andet til "fail").
Avatar billede andersbodilsen Nybegynder
19. december 2004 - 11:31 #16
ok, jeg prøver at tjekker array'et igen
Avatar billede andersbodilsen Nybegynder
19. december 2004 - 14:35 #17
Nu har jeg gået kontrolleren igennem igen... Det virker ikke som om der er noget der fejler.. Array'et er "functional" og hvis kigger og array komfiguration for det pågældende array finder kontrolleren alle 6 diske.. Alle diskene står asignet til det rigtige array...

Det virker ikke umidbart som om der er noget galt med det array...
Kan det ikke være filsystemet der er gået koldt???
Avatar billede lap Nybegynder
19. december 2004 - 15:16 #18
næppe, fejlen fra linux er en hård fejl - ingen skriveadgang til scsi-disken (kontroller præsenterer åbenbart diske som scsi - meget normalt).

Nu kan jeg ikke se, hvornår fejlen kommer - og hvilke andre beskeder som kommer under opstart - kan du opsummere?
Avatar billede andersbodilsen Nybegynder
20. december 2004 - 13:43 #19
Først gennemgår serveren POST opstarten uden problemer...
Dernæst starter raid controlleren. Den tester array'et og sætter status på array'et til "Functional"
Nu stater Linux op og dette kommer frem på skærmen:

Loading pti_st.o module
AMD756: dev 8086:1962, router pirq : 2 get irq : 10
PCI: Found IRQ 10 for device 02:05.1
IRQ routing conflict for 00:09.1, have irq 5, want irq 10
IRQ routing conflict for 00:05.1, have irq 5, want irq 10
Found PTI SuperTrak at mbase: 0xf70000000, irq 5.
scsi0: PROMISE SuperTrak SX6000 Driver
    Vendor: PTI     Modil: SuperTrak     REV:
    Type:     Direct-Access                 ANSI SCSI revision: 02
    Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
SCSI device sda: 1191406080 512-byte hdwr sectors(610000 MB)
Partition check:
sda: sda1 sda2 sda3 sda4 ( sda5 sda6 sda7 sda8 )
Loading jbd.o module
Jouralled Block Device driver loaded
Loading ext3.o module
Mouting /proc filesystem
Creating block devices
Creating root devices
Mouting root filesystem
EXT3-fs: INFO: recovery required on readonly filesystem.
EXT3-fs: write access will be enabled dyring recovery
kjournald starting. Commit interval 5 seconds
EXT3-fs: recovery complete.

Efter denne linje begynder den at melde fejl.
Og denne fejl begynder at gentage sig:

write scsi: aborting command due to timeout: pid 122, scsi0, channel 0, id 0, lun 0
WRITE (10) 00 00 03 30 20 00 00 08 00

Samtidigt med at den siger:

bip - pause - bip - pause - bip - pause osv...
Avatar billede lap Nybegynder
20. december 2004 - 13:54 #20
puha, den er slem - jeg ved ikke hvad du skal gøre - jeg er nødt til at give fortabt. Tydeligvis ses controlleren (udover irq-konflikt) - diske ses - chkdisk skal startes - men det går galt når der skrives til disken.

Kan du løse irq-konflikten?
Avatar billede andersbodilsen Nybegynder
20. december 2004 - 13:56 #21
hmm, har ikke prøvet det under linux!!!

Hvad hvis jeg prøver at reinstallere igen... Bliver der så ikke udelt nye IRQ addr. til enhederne???
Avatar billede lap Nybegynder
20. december 2004 - 14:31 #22
tja, jeg tror det er din boot-kerne, men du kan muligvis rette det direkte i bios.
Avatar billede andersbodilsen Nybegynder
21. december 2004 - 13:17 #23
ok, Jeg går ud fra at det er pci portens IRQ der skal rettes, da min raid kontroller sidder i pci port nr. 3.

IRQ routing conflict for 00:09.1, have irq 5, want irq 10
IRQ routing conflict for 00:05.1, have irq 5, want irq 10

Så den skal vel sættes til 10??? Er det korrekt formodet????
Avatar billede lap Nybegynder
21. december 2004 - 14:23 #24
mon ikke - jeg er ikke sikker - prøv evt. at sætte controller i anden pci-port.
Avatar billede andersbodilsen Nybegynder
21. december 2004 - 16:51 #25
nå, det hjalp ikke lige at sætte raid kotrolleren et andet sted. Samme fjel forekommer. men tilgengæld ændrede fejlbeskeden på skærmen sig... Fyre den ind om et øjeblik.
Avatar billede andersbodilsen Nybegynder
21. december 2004 - 17:15 #26
Det er denne Fejlbesked man bliver præsenteret for, efter raid kontrolleren er blevet sat over i et andet pci slot:

Loading pti_st.o module
AMD756: dev 8086:1962, router pirq : 3 get irq : 0
AMD756: dev 8086:1962, router pirq : 3 set irq : 5
PCI: Assigned IRQ 5 for device 02:08.1
PCI: Sharing IRQ 5 with 02:08.1
Found PTI SuperTrak at mbase: 0xf70000000, irq 5.
scsi0: PROMISE SuperTrak SX6000 Driver
    Vendor: PTI     Modil: SuperTrak     REV:
    Type:     Direct-Access                 ANSI SCSI revision: 02
Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
SCSI device sda: 1191406080 512-byte hdwr sectors(610000 MB)
Partition check:
sda: sda1 sda2 sda3 sda4 ( sda5 sda6 sda7 sda8 )
Loading jbd.o module
Jouralled Block Device driver loaded
Loading ext3.o module
Mouting /proc filesystem
Creating block devices
Creating root devices
Mouting root filesystem
EXT3-fs: INFO: recovery required on readonly filesystem.
EXT3-fs: write access will be enabled dyring recovery
kjournald starting. Commit interval 5 seconds
EXT3-fs: recovery complete.

Herefter begynder fejlen som tidligere er beskrevet!!!
Avatar billede lap Nybegynder
21. december 2004 - 22:47 #27
tja, fortsat samme fejl - ingen mulighed for at skrive til disken.

driveren til din controller - findes den i en recue-disk som f.eks. RedHat (jeg ved faktisk ikke hvilken distribution du bruger), således at du kan komme i luften?

Så har vi i hvert fald en kørende maskine og kan prøve at fejlsøge på diskene - partition for partition.
Avatar billede andersbodilsen Nybegynder
22. december 2004 - 18:52 #28
Jep, jeg køre RH90. Men jeg fik ikke lige fat i hvad du mente med en recue-disk?? Jeg kan ikke set nogen rescue værktøjer på

http://www.promise.com/support/download/download2_eng.asp?productId=86&category=All&os=3

Når man downloader driveren, skrives der heller ikke noget omkring hjælpe værktøjer i readme.txt
Avatar billede lap Nybegynder
22. december 2004 - 21:20 #29
1. installations cd er faktisk en rescue-disk - prøv at boote op på den og i boot-prompt skrive "linux rescue".

Så burde du få maskinen i luften - se om du kan arbejde med controlleren/disken.
Avatar billede andersbodilsen Nybegynder
26. december 2004 - 15:05 #30
Ok, så er julen næsten overstået:-)

Nå, men jeg får heller ikke lov til at se hvad der ligger på disken med denne metode...
Jeg brugte en "linux rescue dd" da jeg har brug for en driver disken for at få liv i min raid kontroller...
Det første man kan vælge at gøre når man booter op i rescue mode er at kigge efter en installation...
Hvis man vælger dette begynder raid kontrolleren lige med det samme at bippe ligesom hvis man booter i normal tilstand...

Det er en lidt sjov fejl vi roder med:-) Jeg kunne jo boote op første gang efter installationen... Hvor det hele virkede en dags tid??
Avatar billede andersbodilsen Nybegynder
27. december 2004 - 16:57 #31
Jeg har stadig ikke opdateret firmwaren... Tør man gøre dette uden at arrayet bliver ødelagt??
Avatar billede lap Nybegynder
28. december 2004 - 01:07 #32
det ved jeg ikke - har gjort det flere gange på andre raid controllere, men har aldrig brugt ide-raid.
Avatar billede andersbodilsen Nybegynder
23. februar 2005 - 13:11 #33
lukket... Det var en af diskene der var gået kold. Men controlleren så den stadig som en alm. disk.
Jeg skiftede disken ud og lavede en rebuildt af array'et. Nu køre det igen. Men jeg er skam ved at smide et backup drev i serveren:-)
Avatar billede andersbodilsen Nybegynder
23. februar 2005 - 13:11 #34
LUKKET
Avatar billede lap Nybegynder
23. februar 2005 - 14:11 #35
tja, burde jeg ikke have lidt points - der blev peget på diskfejl fra starten på trods af manglende meldinger fra controller :-) ?
Avatar billede andersbodilsen Nybegynder
23. februar 2005 - 14:23 #36
jo, det er sgu i orden... Jeg opretter en tråd der hedder til "raid point til lap" på 100 point, som du kan svare på
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester