drbd - зависание хостов, ssh911, 12-Фев-09, 11:30 [смотреть все]Добрый день! Имеется 2 хоста на Centos5.2, между которыми с помощью drbd82 реплицируются блочные устройства, передаваемые в гостевые xen-системы. Спустя около месяца непрерывной работы стала наблюдаться следующая картина - примерно раз в стуки зависает один их хостов, иногда оба. Периодичность зависаний носит вероятностный характер - от часа до 15 часов работы. На момент деадлоков в логах полная тишина, не знаю даже куда копать. В данный момент drbd-устройства работают в режиме StandAlone, аптайм - несколько дней. Синхронизацию делаю руками раз в стуки :( Часть drbd.conf:resource win2003_1 { protocol C; syncer { rate 30M; } net { allow-two-primaries; after-sb-0pri discard-least-changes; after-sb-1pri call-pri-lost-after-sb; after-sb-2pri call-pri-lost-after-sb; } on xen01 { device /dev/drbd0; disk /dev/vg_main/lv_win2003_1; address 10.10.10.1:7790; meta-disk /dev/vg_main/lv_drbdmeta[0]; } on xen02 { device /dev/drbd0; disk /dev/vg_main/lv_win2003_1; address 10.10.10.2:7790; meta-disk /dev/vg_main/lv_drbdmeta[0]; } } Заранее спасибо
|
- drbd - зависание хостов, Valentine31, 11:58 , 12-Фев-09 (1)
- drbd - зависание хостов, ssh911, 13:15 , 12-Фев-09 (2)
>Я правильно понял что виртуальные машины в файлах, в которые передается drbd0. >Причем drbd работает в режима мастер-мастер? Да, drbd работает как primary-primary, а виртуальные машины в lvm-разделах
- drbd - зависание хостов, Valentine31, 16:03 , 12-Фев-09 (3)
- drbd - зависание хостов, ssh911, 17:06 , 12-Фев-09 (4)
>>>Я правильно понял что виртуальные машины в файлах, в которые передается drbd0. >>>Причем drbd работает в режима мастер-мастер? >> >>Да, drbd работает как primary-primary, а виртуальные машины в lvm-разделах > >вирт. машины в различных лвм разделах на drbd устройстве, так? Нет, поверх lvm-разделов подняты различные drbd-устройства. (pv -> lv -> drbd) И соответствено в конфигах виртуальных машин disk = [ 'phy:/dev/drbd0(1,2,3....),hda,w' ]
- drbd - зависание хостов, dolphinik, 11:19 , 16-Апр-09 (7)
- drbd - зависание хостов, ssh911, 11:43 , 16-Авг-09 (8)
>>resource win2003_1 { >> protocol C; >> syncer { >> rate 30M; >> } >> > >А rate не великоват?? для синхронизации отдельные карты стоят? Для синхронизации стоит 2 гигабитных адаптера, объединённых в bond-интерфейс
|