1 |
Hallo. |
2 |
|
3 |
Matthias Teege schrieb am 21.09.2004 um 08:44 Uhr: |
4 |
|
5 |
> > ich betreibe auf einem dedizierten Server ein aktuelles Gentoo |
6 |
> > mit Kernel 2.4.26-gentoo-r9. Seit dem Update von -r3 auf -r9 |
7 |
> > habe ich das Problem, dass sich der Rechner einmal pro Woche |
8 |
> > neustartet. Momentan liegt dieser Zeitpunkt auf Montagnachmittag. |
9 |
> |
10 |
> Du hast nicht gesagt, was auf dem Rechner läuft. |
11 |
|
12 |
Stimmt, denn eigentlich sollte ein Userspace Program sowas nicht |
13 |
ausloesen duerfen. Aber vielleicht hilft es ja. Staendig laufende |
14 |
Software ist (jeweils gentoo-aktuellen Versionen): |
15 |
|
16 |
sshd |
17 |
courier-imap (pop3, pop3-ssl, imapd, imap-ssl) |
18 |
apache (php, perl, ssl) |
19 |
qmail |
20 |
tinydns |
21 |
mysql |
22 |
metalog |
23 |
dhcpcd |
24 |
clamav |
25 |
vcron |
26 |
spamassassin (spamd) |
27 |
|
28 |
|
29 |
Installiert ist ein X und zum fraglichen Zeitpunkt lief jedes Mal |
30 |
der Jabber-Client psi. Wie schon geschrieben hat aber ein Dauertest |
31 |
den Crash nicht ausgeloest. In einer Woche werde ich dann sehen, |
32 |
ob der psi etwas damit zu tun hat. (Nachdem ich den erwarteten |
33 |
Crash-Zeitpunkt durch einen manuellen reboot um einige Tage |
34 |
verschoben habe) |
35 |
|
36 |
|
37 |
> > Sep 20 14:52 (Differenz: 6 Tage, 21 h, 10 min = 9910 min) |
38 |
> > Sep 13 17:42 (Differenz: 6 Tage, 23 h, 47 min = 10067 min) |
39 |
> > Sep 6 17:55 (Differenz: 6 Tage, 12 h, 45 min = 9405 min) |
40 |
> > Aug 31 05:10 |
41 |
> |
42 |
> Das sind nicht genau sieben Tage aber vielleicht ist ein cron job die |
43 |
> Ursache. |
44 |
|
45 |
Weder in den user-crons noch in den systemweiten crons steht zum |
46 |
fraglichen Zeitpunkt etwas drin. Die Aufrufe von cron scheinen |
47 |
alle Problemlos abzulaufen und zu enden. |
48 |
|
49 |
|
50 |
> Ansonsten alles mögliche deaktivieren und ggf. Accounting |
51 |
> aktivieren. Aus den Logs kann man dann hoffentlich sehen, was als |
52 |
> letztes lief. |
53 |
|
54 |
Naja, das habe ich ja mit meinem laufenden "top" zu erreichen versucht. |
55 |
Aber da war um den fraglichen Zeitpunkt gar nichts auffaelliges zu |
56 |
entdecken. |
57 |
|
58 |
Ich vermute momentan etwas in folgende Richtungen: |
59 |
|
60 |
1. Kernelfehler allgemein: Im Kernel wird all n Zeiteinheiten irgendwas |
61 |
gemacht, was unter bestimmten Umstaenden auch mal haeufiger oder |
62 |
seltener erfolgen kann und nach etwa einer Woche zu einem Panic |
63 |
fuehrt. |
64 |
|
65 |
2. nfs/coda Problem. Beides ist nicht aktiv, aber z. B. habe ich |
66 |
folgendes zu nfs gefunden: |
67 |
|
68 |
"rety=n; The number of minutes to retry an NFS mount operation in |
69 |
the foreground or background before giving up. The default value |
70 |
is 10000 minutes, which is roughly one week." |
71 |
|
72 |
das wuerde zeitlich passen, auch wenn es fuer mich momentan trotzdem |
73 |
keinen Sinn macht. |
74 |
|
75 |
3. cron, userspace, Rechenzentrum-Fehler: Um das auszuschiessen, werde |
76 |
ich als erstes den Reboot-Zeitpunkt verschieben. |
77 |
|
78 |
4. Gentoo-Patchset bugs. Der naechste Schritt ist dann herauszufinden, |
79 |
ob das Problem auch mit dem vanilla-Kernel besteht. |
80 |
|
81 |
Chris |
82 |
|
83 |
-- |
84 |
A man was reading The Canterbury Tales one Saturday morning, when his |
85 |
wife asked "What have you got there?" Replied he, "Just my cup and Chaucer." |