Avatar billede htm Nybegynder
21. juni 2003 - 22:15 Der er 28 kommentarer og
1 løsning

Kernel panic

Hej

Jeg fandt lige ud af at min server ikke svarede via netværket overhovedet, så jeg smed en skærm og keyboard på, og så fik jeg da lidt af en chok!

For det første stod tastatur og blinkede i capslock og scroll lock. Derudover stod der følgende på skærmen:

    Oops: 0000
CPU: 0
EIP: 0010: [<c018d3de>] Not tainted
EFLAGS: 00010002
eax: 00000000    ebx: 00000040    ecx: 00000010    edx: 00000001
esi: 00000007    edi: 00000001    ebp: 00000008    esp: c02fbefc
ds: 0018 es: 0018 ss: 0018

Process Swapper    Cpid: 0, stakpage=c02fb000

stack:    00000000  c018d3ac  00000000  c034ad60  c011ed40  00000000  c034b160  00000000
    00000000  c034ad60  00000000  c01113b9  00000000  c02fbf98  20000001  c02fbf38
    c02fbf38  c011b8cc  c011b7b3  00000000  c03215e0  00000001  fffffffe  00000000

Call trace:    [<c018d3ac>]  [<c011ed40>]  [<c01113b9>]  [<c011b8cc>]  [<c011b7b3>]
[<c011b540>]  [<c0108992>]  [<c0105290>]  [<c010aed8>]  [<c01052a0>]  [<c01052cc>]
[<c0105332>]  [<c0105000>]  [<c0105050>]

Code 83 bb b4 00 00 00 00 74 39 6a 01 53 e8 c3 f8 ff ff 8b

<07> kernel panic: Aiee, killing interrupt handler!
In interrupt handler - not syncing


I min /var/log/messages står der intet om hvad der har foresaget dette!
Serveren har ellers kørt upåklageligt uden fejl i lidt mere end 30 dage.

Mit spørgsmål er så:
1. Hvad er der sket her?
2. Har jeg evt. noget defekt hardware? Kan jeg teste det?
3. Er det en hacker / cracker der er på spil her?
4. Hvordan kan jeg undgå det kommer fremover?

Det er en Trustix 1.5, med kernel 2.4.20.
Avatar billede mfalck Praktikant
21. juni 2003 - 22:33 #1
det mest sandsynlige er at det er en hardwaredefekt (ram eller disk). Prøv evt at lade den køre og se om det sker på tidpunkter som når den bliver belastet.
Avatar billede htm Nybegynder
21. juni 2003 - 22:37 #2
Jeg lader den køre - og den ser ud til at køre fint efter restart, men jeg har svært ved at se om det er når den bliver belastet, da det er en lille server, der ikke hoster alverden.
Avatar billede dragen Nybegynder
21. juni 2003 - 22:46 #3
Jeg har fået samme fejl ved at smide en ældgammel harddisk i, med masser af fejl på. Når den så gik på netværket og gemte på harddisken gik der ikke længe før interrupt-fejlen kom.

Så mit gæt er at det er en eller anden disk - har du gamle disks i den? Hvilke andre enheder har du (tænker her især kort...)

2 kan udelukkes.
Avatar billede htm Nybegynder
21. juni 2003 - 22:49 #4
Det er en Pentium 1 MMX 200 mhz med 96 mb ram! - jeg er ved at teste ram nu!

Jeg tvivler trods alt på at det er hraddisk, da denne er omtrent helt ny, og der sidder kun denne i!

Derudover sidder der kun et netkort i maskinen.
Avatar billede htm Nybegynder
21. juni 2003 - 23:05 #5
OK ingen fejl på ram (Brugt Memtest86 til at teste med)
Avatar billede htm Nybegynder
21. juni 2003 - 23:06 #6
Har set man kan bruge badblocks for at teste harddisken med, men hvordan er korrekte syntaks?
Avatar billede htm Nybegynder
21. juni 2003 - 23:11 #7
Forresten så har jeg ingen kort i, da mit netkort er onboard intel netkort (eepro100)
Avatar billede mfalck Praktikant
21. juni 2003 - 23:12 #8
er det standard kernen fra Trustix ?
Avatar billede htm Nybegynder
21. juni 2003 - 23:15 #9
Nej jeg har opgraderet kernen til 2.4.20 som jeg skrev i mit spørgsmål
Avatar billede mfalck Praktikant
21. juni 2003 - 23:18 #10
ok- nu kender jeg ikke trustix, så jeg vidste ikke om 2.4.20 var standard.

Hvorlænge har du kørt med den kerne ?!?! Og har du fået oversat de korrekte drivere ind i kernen ?
Avatar billede htm Nybegynder
21. juni 2003 - 23:21 #11
Trustix kommer som standard med kernel 2.2.24 mener jeg det er.

Maskinen har kørt upåklageligt i lidt over 30 dage. og før det har jeg kørt med den i cirka 10 dage eller lign.

Jeg aner ikke om jeg har fået oversat de korrekte drivere ind i kernen, så meget kender jeg ikke til linux, men jeg gjorde et godt forsøg ;o) - men det har kørt hidtil så er det vel ikke der der er probs?
Avatar billede htm Nybegynder
21. juni 2003 - 23:24 #12
Avatar billede mfalck Praktikant
21. juni 2003 - 23:24 #13
tja - måske, det kan jo være at dit problem kun opstår når maskinen er under belastning, og der f.eks. er meget belastning på ram eller disken.
Avatar billede htm Nybegynder
21. juni 2003 - 23:27 #14
Hmmm ja det kan det da - nogen ide til hvordan jeg kan teste det? eller finde ud af hvad der skulle være galt i min kernel?
Avatar billede mfalck Praktikant
21. juni 2003 - 23:31 #15
hvis du kører en webserver, kan du f.eks. hente Web Application Stress tool (http://www.microsoft.com/technet/treeview/default.asp?url=/technet/itsolutions/intranet/downloads/webstres.asp) og få den til at banke løs på serveren.

ellers kan du sætte den til at oversætte din kerne .. det belaster processoren og diskene (bare lav en make clean; make)
Avatar billede mfalck Praktikant
21. juni 2003 - 23:33 #16
problemet med denne slags fejl er jo at de kan være svære at genskabe .. selv hvis det f.eks. skyldes belastning på netkortet og du er i stand til at genskabe denne belastning, så kan det afhænge af at systemet er igang med at synkronisere disken.
Avatar billede mfalck Praktikant
21. juni 2003 - 23:34 #17
men en ting du måske kan gøre er at tjekke at de ting du har oversat ind i kernen er de korrekte ..
Avatar billede htm Nybegynder
21. juni 2003 - 23:38 #18
Jeg prøver og henter stress tool for webserver, så må jeg se om det er problemet!

Make  clean, make? Skal jeg bare prøve og køre dem, for at lave noget belastning?

Hvordan tjekker jeg om de ting jeg har oversat ind i kernen er det korrekte?
Avatar billede mfalck Praktikant
21. juni 2003 - 23:42 #19
du skal være i det katalog hvor kernel-src ligger naturligvis.
Hvis du kører
make clean, så fjerner du alle de oversatte filer .. ellers når du kører make så løber den blot filerne igennem og siger ok.

når du kører "make" så belaster du cpuen og harddisken fordi du kører c-oversætteren (du kan evt logge ind på en anden virtuel skærm og se med top hvormeget du belaster cpuen).

det eneste jeg kan sige er at du skal have fat i dokumentationen til bundkortet og sikre dig at de enheder som sidder på det er dem du har valgt (ide-controller og lign).
Avatar billede htm Nybegynder
21. juni 2003 - 23:52 #20
OK - jeg vil prøve forskellige ting - vender tilbage med noget status ;o)

Måske skal man recompilere sin kerne og være sikker på at de ting nu er i orden :o)
Avatar billede htm Nybegynder
22. juni 2003 - 16:49 #21
Hmmm nu har jeg prøvet og stressteste min server via Web Application Stress tool i fem timer i træk ;o)

Samtidig med det har jeg prøvet at køre en make clean, make et par gange. CPU-forbrug har stået til 99,8% hele tiden, målt med top.

Men jag har ikke fået den til at fejle endnu!

Endvidere har jeg også testet harddisken med badblocks, hellere ikke her bliver der givet nogle fejl!

Er der nogen der har forslår til hvad jeg ellers kan prøve for at teste den af? Eller Nogen ideer til hvad der gik galt?
Avatar billede htm Nybegynder
22. juni 2003 - 16:50 #22
Skal lige bemærke at jeg ikke har kigget noget i min kernel konfiguration, men ville være perfekt med en måde til teste denne af?
Avatar billede mfalck Praktikant
22. juni 2003 - 18:14 #23
har du tjekket om du har konflikter på nogle af dine IRQ ? det virker som om det der der den går galt i byen (altså interrupt-håndteringen). Prøv evt at lave en lspci -v -x
Avatar billede htm Nybegynder
22. juni 2003 - 18:16 #24
bash: lspci: command not found

Desværre den har jeg ikke til rådighed, er der en anden måde jeg kan se irq konflikter med?
Avatar billede mfalck Praktikant
22. juni 2003 - 18:17 #25
Avatar billede htm Nybegynder
22. juni 2003 - 18:23 #26
Den tråd ser ud til at omhandle en aktiv ppp connection der bliver afbrudt af en lokal enhed. Men jeg har intet specielt siddende på den lokalt, og det er sket et tidspunkt jeg ikke har haft ssh-adgang til den eller lign.

Det er måske også vær at bemærke at jeg hellere ikke har ksymoops til tådighed men kun ksyms - sig til hvis du vil have outputtet fra den!
Avatar billede htm Nybegynder
24. juni 2003 - 13:57 #27
Hmmm - kan ikke finde ud af hvad der gik galt desværre!

mfalck>> Vil du smide et svar?

Og har du evt. lige de afsluttende guldkorn ;o) - evt. nogle tool jeg kan installere så jeg kan finde ud af hvad der går galt, eller monitere hvad der sker?
Avatar billede mfalck Praktikant
24. juni 2003 - 17:50 #28
du kan hente sourcen til ksymoops på:
http://www.matrix.lkams.kernel.org/linux/utils/kernel/ksymoops/v2.4/

det eneste andet jeg kan sige er at du kan prøve at gennemgå din kerneopsætning og være sikker på at den matcher hardwaren. Ellers må du lige lade maskinen køre og se hvad der så sker.
Avatar billede htm Nybegynder
24. juni 2003 - 18:27 #29
Takker - vi må se om den crasher igen, hvis det er tilfældet er der ikke andet for en at recompilere sin kerne, og så være sikker på den ;o) - jeg har installeret ksymoops til senere brug! Rart at have værktøjerne parate hvis det skulle ske igen!
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester