Oops - woher?

Jan 'RedBully' Seiffert redbully at cc.fh-luh.de
Sun Oct 29 03:07:23 CET 2006


Florian Schwarz wrote:
> Jan 'RedBully' Seiffert schrieb:
>> Florian Schwarz wrote:
>>> Jan-Benedict Glaw schrieb:
>>>> On Thu, 2006-10-26 19:43:57 +0200, Florian Schwarz <floh at linland.de> wrote:
>>>>> Das war das, was mir der syslogd auf die SSH Konsole gekotzt hat. Auf
>>>>> der "richtigen" Konsole stand noch mehr, aber ich weiß nicht wie ich das
>>>>> ordentlich logge. In der messages habe ich noch was gefunden, hängt ma
>>>> $ dmesg > outputdatei
>>> So, habs jetzt mal geschafft son Oops einzufangen! Hängt mal wieder als
>>> Anhang dran.
>>>
>>> Hilft das weiter?
>>>
>> Ja ... und Nein.
> 
> Schön. ;)
> 
>> Also:
>>> BUG: unable to handle kernel NULL pointer dereference at virtual address 00000044
>> Dein kernel hat sich "vergegriffen", das sollte nicht passieren.
>> Moegliche Gruende sind, das irgendwo ein Test auf NULL vergessen wurde,
>> oder das irgendwo NULL ankam, wo nach Programm-konventionen keins
>> ankommen sollte.
>> Ein blick in deine Register zeigt ja genug 0-len ;)
>> Mit dem "at virtual address 00000044" spekulier ich jetzt mal wild, das
>> vorher ein Pointer verbogen wurde in unsinnige gefilde, und dann
>> letzteres passierte.
>>
>> Der callstack zeigt in das Memorysystem des Kernels (so mit
>> swapper-thread und shrink_slab), aber, der ist wohl nur der, der da
>> drueber gestolpert ist, also nicht der Ausloeser. Den Fehler verursacht
>> warsch. wer anders.
>>
>> Was uns zum "Hauptproblem" bringt: Der Kernel ist Tainted. Binaer modul
>> geladen? fcpci? FritzCard?
>> _So_ wird sich das keiner angucken, und ist auch oft der Grund fuer
>> sowas. (Sowas kommt von sowas? ^_^ )
> 
> Das Problem tritt ohne fcpci auch auf, damit habe ich erst in den letzen
> 2 Tagen rumgespielt. Liegt also nicht daran.
> 
No risk, no fun?
hmmm, *sigh*

Grosses Indianer Ehrenwort?

Na egal, wies aussieht, meiner Meinung nach waren wohl alle Calltraces
die du bisher gezeigt hast, warsch. nicht die, die das ausgeloest haben,
mehr die drueber gestolpert sind.

Da kommt man so nicht weiter.

Da du ja, so wie ich es verstanden habe, den Fehler reproduzieren
kannst, mach im Kernel mehr Debuging an. (Das ist auch fuer so faelle
gedacht, wenn man den Fehler nicht dem Trace zuordnen kann, so das
verstaerkte Checks den wahren Schuldigen hoff. zeigen)

Nett waere noch das disassambly der Funktion genau an der stelle wo es
abgeschmiert ist, damit man zurueckschliessen kann, welche
Kernelstruktur in Mitleidenschaft gezogen wurde, aber das erklaer ich
morgen, ich geh jetzt ins Bett...

> Gruß,
> Floh
> 
> 
Gruss
	Jan

-- 
Windows Cluster:
Hardware cost for 1000 nodes: 2,5 Million Euro
Gigabit network infrastructure and switches: 250,000 Euros
Additional infrastructure and cooling: 400,000 Euros
1000 Licences of "Windows Compute Cluster Server 2003": 469,000 Euros
1 Copy "Microsoft Visual Studio for Dummies": 39 Euros
Pager wakes you up at 4 in the morning; "Illegal error occured at
00432:0000F01A in application ScreenSaver.exe. Click here to find out
how to contact Microsoft about this problem": Priceless



More information about the Linux mailing list