Gentoo Archives: gentoo-user-de

From: Christoph Probst <chris-usenet@×××××××××.org>
To: gentoo-user-de@l.g.o
Subject: Re: [gentoo-user-de] Spontane Reboots alle 7 Tage
Date: Tue, 21 Sep 2004 07:45:48
Message-Id: 20040921074546.GJ2112@netzpunkt.org
In Reply to: Re: [gentoo-user-de] Spontane Reboots alle 7 Tage by Matthias Teege
1 Hallo.
2
3 Matthias Teege schrieb am 21.09.2004 um 08:44 Uhr:
4
5 > > ich betreibe auf einem dedizierten Server ein aktuelles Gentoo
6 > > mit Kernel 2.4.26-gentoo-r9. Seit dem Update von -r3 auf -r9
7 > > habe ich das Problem, dass sich der Rechner einmal pro Woche
8 > > neustartet. Momentan liegt dieser Zeitpunkt auf Montagnachmittag.
9 >
10 > Du hast nicht gesagt, was auf dem Rechner läuft.
11
12 Stimmt, denn eigentlich sollte ein Userspace Program sowas nicht
13 ausloesen duerfen. Aber vielleicht hilft es ja. Staendig laufende
14 Software ist (jeweils gentoo-aktuellen Versionen):
15
16 sshd
17 courier-imap (pop3, pop3-ssl, imapd, imap-ssl)
18 apache (php, perl, ssl)
19 qmail
20 tinydns
21 mysql
22 metalog
23 dhcpcd
24 clamav
25 vcron
26 spamassassin (spamd)
27
28
29 Installiert ist ein X und zum fraglichen Zeitpunkt lief jedes Mal
30 der Jabber-Client psi. Wie schon geschrieben hat aber ein Dauertest
31 den Crash nicht ausgeloest. In einer Woche werde ich dann sehen,
32 ob der psi etwas damit zu tun hat. (Nachdem ich den erwarteten
33 Crash-Zeitpunkt durch einen manuellen reboot um einige Tage
34 verschoben habe)
35
36
37 > > Sep 20 14:52 (Differenz: 6 Tage, 21 h, 10 min = 9910 min)
38 > > Sep 13 17:42 (Differenz: 6 Tage, 23 h, 47 min = 10067 min)
39 > > Sep 6 17:55 (Differenz: 6 Tage, 12 h, 45 min = 9405 min)
40 > > Aug 31 05:10
41 >
42 > Das sind nicht genau sieben Tage aber vielleicht ist ein cron job die
43 > Ursache.
44
45 Weder in den user-crons noch in den systemweiten crons steht zum
46 fraglichen Zeitpunkt etwas drin. Die Aufrufe von cron scheinen
47 alle Problemlos abzulaufen und zu enden.
48
49
50 > Ansonsten alles mögliche deaktivieren und ggf. Accounting
51 > aktivieren. Aus den Logs kann man dann hoffentlich sehen, was als
52 > letztes lief.
53
54 Naja, das habe ich ja mit meinem laufenden "top" zu erreichen versucht.
55 Aber da war um den fraglichen Zeitpunkt gar nichts auffaelliges zu
56 entdecken.
57
58 Ich vermute momentan etwas in folgende Richtungen:
59
60 1. Kernelfehler allgemein: Im Kernel wird all n Zeiteinheiten irgendwas
61 gemacht, was unter bestimmten Umstaenden auch mal haeufiger oder
62 seltener erfolgen kann und nach etwa einer Woche zu einem Panic
63 fuehrt.
64
65 2. nfs/coda Problem. Beides ist nicht aktiv, aber z. B. habe ich
66 folgendes zu nfs gefunden:
67
68 "rety=n; The number of minutes to retry an NFS mount operation in
69 the foreground or background before giving up. The default value
70 is 10000 minutes, which is roughly one week."
71
72 das wuerde zeitlich passen, auch wenn es fuer mich momentan trotzdem
73 keinen Sinn macht.
74
75 3. cron, userspace, Rechenzentrum-Fehler: Um das auszuschiessen, werde
76 ich als erstes den Reboot-Zeitpunkt verschieben.
77
78 4. Gentoo-Patchset bugs. Der naechste Schritt ist dann herauszufinden,
79 ob das Problem auch mit dem vanilla-Kernel besteht.
80
81 Chris
82
83 --
84 A man was reading The Canterbury Tales one Saturday morning, when his
85 wife asked "What have you got there?" Replied he, "Just my cup and Chaucer."