1 |
On 11/27/10 22:18, Alex Efros wrote: |
2 |
> Hi! |
3 |
> |
4 |
> On Sat, Nov 27, 2010 at 10:06:27PM +0200, Охрименко Александр wrote: |
5 |
>> 2.6.35-r12 у меня ядро, текущее из стабильной ветки. Планировщик вроде менял |
6 |
>> на deadline. Попробую cfq. Про баг прочитал, спасибо за ссылку на номер |
7 |
>> бага. Я вот думаю как такое может быть что разработчики бьются над багом 16 |
8 |
>> ревизий ядра. Это ж просто смешно. Возможности дебага у них есть и знания |
9 |
>> как это вычислить. Или они ядро линукса первый раз увидели когда что то |
10 |
>> туда писали. Странно все это, мировой заговор против линукса. |
11 |
> |
12 |
> Насколько я понимаю, между ядрами .18 и .19 была заменена целая подсистема |
13 |
> в ядре, которая отвечает за дисковый i/o. Т.е. это был не набор патчей |
14 |
> что-то меняющий в текущем коде, а полная замена этого кода на другой. |
15 |
> Это раз. Из-за этого стало невозможным выявить конкретный небольшой патч |
16 |
> который вызвал эту проблему. |
17 |
> |
18 |
> Дальше, тормоза дисковой подсистемы вызванные новым кодом проявляются |
19 |
> далеко не на каждом железе. Разработчикам ядра (как минимум большинству из |
20 |
> них) с железом явно повезло, и они появившиеся тормоза просто не заметили. |
21 |
> Это два. Из-за этого ушло примерно полтора года только на то, чтобы |
22 |
> доказать им что проблема реально существует у многих пользователей и |
23 |
> повесить этот баг. |
24 |
> |
25 |
> Когда этот баг появился, и в нём начали жаловаться на тормоза дисковой |
26 |
> подсистемы, то довольно быстро стало ясно, что симптомы у людей разные, и |
27 |
> проблемы у них тоже разные. И всё это намешалось в одну кучу в этом баге. |
28 |
> Это три. Из-за этого управлять этим багом стало практически невозможно, по |
29 |
> имеющейся мешанине симптомов разработчики не могли ничего понять. |
30 |
> |
31 |
> В результате ушло реально много времени на то, чтобы разработчики смогли |
32 |
> выявить хоть какие-то конкретные проблемы и начать их исправлять… Примерно |
33 |
> с ядра .30 начали поступать отзывы пользователей что у них проблема с |
34 |
> тормозами ушла - но т.к. это была одна из многих несвязанных проблем |
35 |
> описанных в том баге, то у других пользователей, с другими проблемами, |
36 |
> тормоза оставались. |
37 |
> |
38 |
> В общем, это не заговор, просто реально очень не повезло. |
39 |
|
40 |
Мои 5 центов: |
41 |
|
42 |
Симпоты в принципе одни - при нескольких параллельно пишущих процессах |
43 |
на диск взлетает LA и падает disk IO speed. CPU проводит 90% времени в |
44 |
iowait state. |
45 |
|
46 |
У меня некоторые сервера с 2.6.19 ок, а на некоторых баг явно |
47 |
проявляется. С 2.6.2х - вообще абзац. Работать при нагрузках просто |
48 |
невозможно. |
49 |
|
50 |
Это даже не один баг, а целый микс м действительно проявляющийся далеко |
51 |
не всегда и не на каждом железе. Мне повезло - 30% серверов на которых |
52 |
баг явно есть. |
53 |
|
54 |
Тот же простой пример 3ware 9500 - все ОК, 3ware 8500 полные тормоза |
55 |
даже на 2.6.19. |