Gentoo Archives: gentoo-user-ru

From: Konstantin Astafjev <konstantin@××××××××.com>
To: gentoo-user-ru@l.g.o
Subject: [gentoo-user-ru] Kernel Panic при высокой сетевой загрузке
Date: Thu, 26 Feb 2009 21:21:00
Message-Id: 616168865.20090226232058@astafjev.com
1 Приветствую!
2
3 Вероятнее всего эта проблема не относится напрямую к Gentoo, но я
4 хотел бы сначала попросить совета у единственного известного мне
5 русскоязычного комьюнити. :)
6
7 Есть несколько маршрутизаторов на базе Intel Serverboard Aspen 3000AH,
8 основной функцией которых является шейпинг. Дерево HTB имеет не более
9 2 тысяч классов. Для фильтров используются hash tables. При суммарной
10 загрузке свыше 400 Mbps машинка начинает случайным образом
11 поругиваться и убивать процессы. В конечном итоге это всё приводит к
12 kernel panic. Пример ругани привожу в приложенном текстовом файле.
13 wr-up в примере это скрипт, который посредством запуска tc формиурет
14 классы и фильтры для шейпера. В данном случае он спровоцировал
15 убийство других процессов, но реально даже если ничего не делать
16 начинается: swapper: page allocation failure. order:0, mode:0x20
17 Налицо проблема в том, что кому-то не хватает памяти, судя по top'у
18 свободная память есть. На более сложные проверки у меня не хватает
19 знаний.
20
21 ~ # top
22 top - 22:49:11 up 3 days, 3:06, 1 user, load average: 0.06, 0.06, 0.01
23 Tasks: 85 total, 1 running, 84 sleeping, 0 stopped, 0 zombie
24 Cpu(s): 0.1%us, 0.1%sy, 0.0%ni, 92.2%id, 0.1%wa, 1.3%hi, 6.1%si, 0.0%st
25 Mem: 4148644k total, 832628k used, 3316016k free, 852k buffers
26 Swap: 4000056k total, 160k used, 3999896k free, 13100k cached
27
28 Чем больше трафик - тем выше вероятность ошибки. Иногда проходит 3
29 дня, а иногда достаточно и 5 минут. Вариант сбойного железа исключаю,
30 так как машинка не одна и на всех наблюдаются одинаковые симптомы тест
31 и проверку памяти они проходят исправно. Версии ядра менял начиная с
32 2.6.20, сейчас стоит 2.6.25-hardened-r10. Использование не hardened, а
33 gentoo ядра не помогло. Для сетевых интерфейсов использую модули e1000
34 и e1000e. Кажется в модуле e1000e видел совет увеличить значение
35 vm.min_free_kbytes. Увеличил до 65536, но в моём случае не помогло.
36
37 Может быть кто-нибудь сталкивался с такой проблемой и/или знает её
38 решение? В крайнем случае, подскажите как правильно дебагить такую
39 проблему и куда лучше обратиться. Спасибо.
40
41 --
42 Konstantin Astafjev

Attachments

File name MIME type
kern_log_error_parts.txt text/plain

Replies