<07> kernel panic: Aiee, killing interrupt handler! In interrupt handler - not syncing
I min /var/log/messages står der intet om hvad der har foresaget dette! Serveren har ellers kørt upåklageligt uden fejl i lidt mere end 30 dage.
Mit spørgsmål er så: 1. Hvad er der sket her? 2. Har jeg evt. noget defekt hardware? Kan jeg teste det? 3. Er det en hacker / cracker der er på spil her? 4. Hvordan kan jeg undgå det kommer fremover?
det mest sandsynlige er at det er en hardwaredefekt (ram eller disk). Prøv evt at lade den køre og se om det sker på tidpunkter som når den bliver belastet.
Jeg lader den køre - og den ser ud til at køre fint efter restart, men jeg har svært ved at se om det er når den bliver belastet, da det er en lille server, der ikke hoster alverden.
Jeg har fået samme fejl ved at smide en ældgammel harddisk i, med masser af fejl på. Når den så gik på netværket og gemte på harddisken gik der ikke længe før interrupt-fejlen kom.
Så mit gæt er at det er en eller anden disk - har du gamle disks i den? Hvilke andre enheder har du (tænker her især kort...)
Trustix kommer som standard med kernel 2.2.24 mener jeg det er.
Maskinen har kørt upåklageligt i lidt over 30 dage. og før det har jeg kørt med den i cirka 10 dage eller lign.
Jeg aner ikke om jeg har fået oversat de korrekte drivere ind i kernen, så meget kender jeg ikke til linux, men jeg gjorde et godt forsøg ;o) - men det har kørt hidtil så er det vel ikke der der er probs?
problemet med denne slags fejl er jo at de kan være svære at genskabe .. selv hvis det f.eks. skyldes belastning på netkortet og du er i stand til at genskabe denne belastning, så kan det afhænge af at systemet er igang med at synkronisere disken.
du skal være i det katalog hvor kernel-src ligger naturligvis. Hvis du kører make clean, så fjerner du alle de oversatte filer .. ellers når du kører make så løber den blot filerne igennem og siger ok.
når du kører "make" så belaster du cpuen og harddisken fordi du kører c-oversætteren (du kan evt logge ind på en anden virtuel skærm og se med top hvormeget du belaster cpuen).
det eneste jeg kan sige er at du skal have fat i dokumentationen til bundkortet og sikre dig at de enheder som sidder på det er dem du har valgt (ide-controller og lign).
har du tjekket om du har konflikter på nogle af dine IRQ ? det virker som om det der der den går galt i byen (altså interrupt-håndteringen). Prøv evt at lave en lspci -v -x
Den tråd ser ud til at omhandle en aktiv ppp connection der bliver afbrudt af en lokal enhed. Men jeg har intet specielt siddende på den lokalt, og det er sket et tidspunkt jeg ikke har haft ssh-adgang til den eller lign.
Det er måske også vær at bemærke at jeg hellere ikke har ksymoops til tådighed men kun ksyms - sig til hvis du vil have outputtet fra den!
Hmmm - kan ikke finde ud af hvad der gik galt desværre!
mfalck>> Vil du smide et svar?
Og har du evt. lige de afsluttende guldkorn ;o) - evt. nogle tool jeg kan installere så jeg kan finde ud af hvad der går galt, eller monitere hvad der sker?
det eneste andet jeg kan sige er at du kan prøve at gennemgå din kerneopsætning og være sikker på at den matcher hardwaren. Ellers må du lige lade maskinen køre og se hvad der så sker.
Takker - vi må se om den crasher igen, hvis det er tilfældet er der ikke andet for en at recompilere sin kerne, og så være sikker på den ;o) - jeg har installeret ksymoops til senere brug! Rart at have værktøjerne parate hvis det skulle ske igen!
Synes godt om
Ny brugerNybegynder
Din løsning...
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.