The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"FreeBSD виснет"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Открытые системы на сервере (Система. проблемы, диагностика / FreeBSD)
Изначальное сообщение [ Отслеживать ]

"FreeBSD виснет"  +/
Сообщение от mr brightside (ok) on 04-Янв-11, 20:24 
Добрый день всем!

Я работаю с unix не так давно, поэтому прошу сильно не пинать, но помощь очень нужна.

Итак, есть шлюз, выполняющий функции DNSa, PF, FIREWALLa, обеспечивающий инетом сразу на два канала. Сдохнет шлюз - сдохнет инет, поэтому мне очень хочется решить проблему.

В последнее время ни с того ни с сего он начал зависать просто так. Т.е. работает часа три себе, потом зависнет. На консоль не отзывается, - спасает только кнопка reset.

После reset'a я внимательно изучил все, что пишет FreeBSD при загрузке и меня смутили следующие строки:

+++++++++++++++++++++
....
Module_register_init: MOD_LOAD (splash_pcx, 0xc0bc878c)
....
acpi0: reservation of fee00000, 10000 failed
acpi0: reservation of ffb80000, 80000 failed
acpi0: reservation of fff80000, 80000 failed
....
ACPI HPEI table warning: sequence is non zero
....
sio0: configured irq 4 not bitmap of probed irq0
sio1: configured irq 3 not bitmap of probed irq0
.....
Warning: / was not properly dismounted
....
Starting file system checks:
/dev/mirror/gm0s1a: UNREF FILE I=4828448 OWNER=root Mode=140666
/dev/mirror/gm0s1a: SIZE=0 MTIME= Jan 4 20:09 (CLEANED)
/dev/mirror/gm0s1a: Free BLK count(s) wrong in superblk (SALVAGED)
/dev/mirror/gm0s1a: Summary information bad (SALVAGED)
/dev/mirror/gm0s1a: BLK(s) missing in bit maps (SALVAGED)
.....
+++++++++++++++++++++

Больше всего смущают, конечно, последние строки, потому что внутри стоят диски в рейде.

Настраивал это все дело не я, я умею только почту собирать, да веб серверы, а вот ДНСы/шлюзы поднимать пока не научился. Поэтому надо постараться решить проблему без сноса и переустановки системы.

С сервером ничего не делалось, вообще. В нем ничего не менялось, не переставлялось.
Оперативку проверил memtest'om - не битая. Разъем оперативки менял, сами планки менял на другие тоже - из всего этого делаю вывод, что дело не в оперативке.

Кулер на процессоре прочистил, сервер стоит в хорошо охлаждаемом месте, т.е. не перегревается.

Не знаю, посоветуйте, пожалуйста, что мне сделать/проверить?

Надеюсь на скорейшие ответы... Спасибо!

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "FreeBSD виснет"  +/
Сообщение от freelsd email on 05-Янв-11, 03:31 
Прогоняй диски смартом
http://hotfreebsd.ru/monitoring-smart-hdd-vo-freebsd-pri-pom.../
Нужно чтобы было динамики увеличения Reallocated_Sectors и отсутствовали ошибки на дисках.

>[оверквотинг удален]
> постараться решить проблему без сноса и переустановки системы.
> С сервером ничего не делалось, вообще. В нем ничего не менялось, не
> переставлялось.
> Оперативку проверил memtest'om - не битая. Разъем оперативки менял, сами планки менял
> на другие тоже - из всего этого делаю вывод, что дело
> не в оперативке.
> Кулер на процессоре прочистил, сервер стоит в хорошо охлаждаемом месте, т.е. не
> перегревается.
> Не знаю, посоветуйте, пожалуйста, что мне сделать/проверить?
> Надеюсь на скорейшие ответы... Спасибо!

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "FreeBSD виснет"  +/
Сообщение от DeadLoco (ok) on 05-Янв-11, 04:41 
> В последнее время ни с того ни с сего он начал зависать
> просто так. Т.е. работает часа три себе, потом зависнет. На консоль
> не отзывается, - спасает только кнопка reset.

Машинке уже лет шесть-семь, я полагаю?

Судя по симптомам (глюкам ацпи), у вас брыкается южный мост материнки. Брыкаться он может как по причине отлипания чипа от платы, так и по причине проблем с питанием из-за высохших конденсаторов и/или дешевого БП. С винчестерами проблемы вызваны лишь остановкой системы на всем скаку и отсутствием журнализации ФС, аппаратно они, скорей всего, в порядке.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

3. "FreeBSD виснет"  +/
Сообщение от mr brightside (ok) on 05-Янв-11, 11:02 
> Машинке уже лет шесть-семь, я полагаю?

Машинке 4 года...

> Судя по симптомам (глюкам ацпи), у вас брыкается южный мост материнки. Брыкаться
> он может как по причине отлипания чипа от платы, так и
> по причине проблем с питанием из-за высохших конденсаторов и/или дешевого БП.
> С винчестерами проблемы вызваны лишь остановкой системы на всем скаку и
> отсутствием журнализации ФС, аппаратно они, скорей всего, в порядке.

Свет у нас в конторе действительно отключается часто. Конечно, серваки подключены к ИБП, но, если отключение более продолжительно, чем ИБП может держать, то тут уж ничего не поделаешь...

Хотя, где то читал, что как то можно заставить ИБП слать команду на шатдаун, если, например, эл-во отсутствует более 30 секунд...

Ну допустим, поменяю БП.
Но если не поможет, то меня спасет только ремонт? Или есть какие-нибудь моменты, которые можно сделать?

Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "FreeBSD виснет"  +/
Сообщение от mr brightside (ok) on 05-Янв-11, 11:11 
Выполнил:
++++++++++++++++
gmirror list
gmirror status
++++++++++++++++

Получил:

++++++++++++++++
[root@corbina /home/lamerionok]# gmirror list
    Geom name: gm0
    State: DEGRADED
    Components: 2
    Balance: round-robin
    Slice: 4096
    Flags: NONE
    GenID: 1
    SyncID: 1
    ID: 1933856141
    Providers:
    1. Name: mirror/gm0
       Mediasize: 120034123264 (112G)
       Sectorsize: 512
       Mode: r2w2e3
    Consumers:
    1. Name: ad4
       Mediasize: 120034123776 (112G)
       Sectorsize: 512
       Mode: r1w1e1
       State: ACTIVE
       Priority: 0
       Flags: DIRTY
       GenID: 1
       SyncID: 1
       ID: 2704183911

    [root@corbina /home/lamerionok]# gmirror status
          Name    Status  Components
    mirror/gm0  DEGRADED  ad4
++++++++++++++++

Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

5. "FreeBSD виснет"  +/
Сообщение от GD on 05-Янв-11, 11:45 
> Выполнил:
> ++++++++++++++++
> gmirror list
> gmirror status
> ++++++++++++++++
> Получил:
> ++++++++++++++++
> [root@corbina /home/lamerionok]# gmirror list
>     Geom name: gm0
>     State: DEGRADED

развалился gmirror
пересобирайте
и еще, если машине 4 года - просмотрите все конденсаторы на предмет вздутия

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

6. "FreeBSD виснет"  +/
Сообщение от mr brightside (ok) on 18-Янв-11, 12:56 
Посмтрел, какие диски есть в системе

[root@corbina /usr/home/lamerionok]# dmesg | grep ad
FreeBSD is a registered trademark of The FreeBSD Foundation.
re0: Ethernet address: 00:19:db:71:17:e2
uhub0: ATI OHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub1: ATI OHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub2: ATI OHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub3: ATI OHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub4: ATI OHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub5: ATI EHCI root hub, class 9/0, rev 2.00/1.00, addr 1
fxp0: Ethernet address: 00:03:47:73:b2:2c
fxp1: Ethernet address: 00:03:47:73:b2:2d
fxp2: Ethernet address: 00:03:47:73:b9:5c
fxp3: Ethernet address: 00:03:47:73:b9:5d
ad4: 114473MB <SAMSUNG HD120IJ ZL100-47> at ata2-master SATA300
ad6: 114473MB <SAMSUNG HD120IJ ZL100-47> at ata3-master SATA300
GEOM_MIRROR: Device gm0: provider ad4 detected.
GEOM_MIRROR: Device gm0: provider ad6 detected.
GEOM_MIRROR: Component ad6 (device gm0) broken, skipping.
GEOM_MIRROR: Device gm0: provider ad4 activated.

Затем подсунул нерабочий диск гмиррору

[root@corbina /usr/home/lamerionok]# gmirror forget gm0
[root@corbina /usr/home/lamerionok]# gmirror insert gm0 ad6

И еще раз посмотрел, что у меня в итоге получилось с софтовым рейдом:

[root@corbina /usr/home/lamerionok]# gmirror list
Geom name: gm0
State: DEGRADED
Components: 2
Balance: round-robin
Slice: 4096
Flags: NONE
GenID: 1
SyncID: 1
ID: 1933856141
Providers:
1. Name: mirror/gm0
   Mediasize: 120034123264 (112G)
   Sectorsize: 512
   Mode: r3w2e3
Consumers:
1. Name: ad4
   Mediasize: 120034123776 (112G)
   Sectorsize: 512
   Mode: r1w1e1
   State: ACTIVE
   Priority: 0
   Flags: NONE
   GenID: 1
   SyncID: 1
   ID: 2704183911
2. Name: ad6
   Mediasize: 120034123776 (112G)
   Sectorsize: 512
   Mode: r1w1e1
   State: SYNCHRONIZING
   Priority: 0
   Flags: DIRTY, SYNCHRONIZING
   GenID: 1
   SyncID: 1
   Synchronized: 2%
   ID: 857470208

Проверить диск smartmontools не получилось, потому что система не могла попасть в директорию с портом:

cd: can't cd to ....

Жду окончания синхронизации, посмотрим, что будет дальше.

Подскажите, пожалуйста, что мне надо будет делать со строкой:

   Flags: DIRTY, SYNCHRONIZING

Вероятно, ответ будет "кури маны"? =)

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

7. "FreeBSD виснет"  +/
Сообщение от GD on 18-Янв-11, 13:30 
> Посмтрел, какие диски есть в системе
> [root@corbina /usr/home/lamerionok]# dmesg | grep ad

[skip]
>[оверквотинг удален]
>    SyncID: 1
>    Synchronized: 2%
>    ID: 857470208
> Проверить диск smartmontools не получилось, потому что система не могла попасть в
> директорию с портом:
> cd: can't cd to ....
> Жду окончания синхронизации, посмотрим, что будет дальше.
> Подскажите, пожалуйста, что мне надо будет делать со строкой:
>    Flags: DIRTY, SYNCHRONIZING
> Вероятно, ответ будет "кури маны"? =)

ничего,
когда Synchronized дойдет до 100%, Flags изменится на DIRTY, State на ACTIVE
и все...
это если конечно нет проблемы с диском на уровне физики
если есть проблемы - тогда физически менять диск и обратно синхронизировать...


Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

8. "FreeBSD виснет"  +/
Сообщение от mr brightside (ok) on 18-Янв-11, 14:27 
> когда Synchronized дойдет до 100%, Flags изменится на DIRTY, State на ACTIVE

Странно, но у меня FLAGS изменились на NONE

Это не есть гут?

vertigo# gmirror list
Geom name: gm0
State: COMPLETE
Components: 2
Balance: round-robin
Slice: 4096
Flags: NONE
GenID: 1
SyncID: 1
ID: 1933856141
Providers:
1. Name: mirror/gm0
   Mediasize: 120034123264 (112G)
   Sectorsize: 512
   Mode: r2w2e3
Consumers:
1. Name: ad4
   Mediasize: 120034123776 (112G)
   Sectorsize: 512
   Mode: r1w1e1
   State: ACTIVE
   Priority: 0
   Flags: NONE
   GenID: 1
   SyncID: 1
   ID: 2704183911
2. Name: ad6
   Mediasize: 120034123776 (112G)
   Sectorsize: 512
   Mode: r1w1e1
   State: ACTIVE
   Priority: 0
   Flags: NONE
   GenID: 1
   SyncID: 1
   ID: 857470208

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

9. "FreeBSD виснет"  +/
Сообщение от GD on 18-Янв-11, 14:43 
>> когда Synchronized дойдет до 100%, Flags изменится на DIRTY, State на ACTIVE
> Странно, но у меня FLAGS изменились на NONE
> Это не есть гут?

нормально

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "FreeBSD виснет"  +/
Сообщение от DeadLoco (ok) on 18-Янв-11, 23:25 
> Странно, но у меня FLAGS изменились на NONE

Сейчас вы склеили разбитое зеркало, но причину зависаний не устранили. Поэтому готовьтесь к очередному слету.

Проблема на 99% "железная".

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

11. "FreeBSD виснет"  +/
Сообщение от mr brightside (ok) on 19-Янв-11, 00:00 
> Сейчас вы склеили разбитое зеркало, но причину зависаний не устранили. Поэтому готовьтесь
> к очередному слету.

Вы правы. На выходных, когда сервак никем юзаться не будет, сниму харды и проверю сторонними утилитами диски, посмотрю на коденсаторы, проверю оперативку...

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

12. "FreeBSD виснет"  +/
Сообщение от DeadLoco (ok) on 19-Янв-11, 00:33 
> Вы правы. На выходных, когда сервак никем юзаться не будет, сниму харды
> и проверю сторонними утилитами диски, посмотрю на коденсаторы, проверю оперативку...

Винты можете не проверять, если б они были битые, зеркало не отребилдилось бы. Лучше всего погонять на машине стресс-тесты, которые хорошо грузят проц, память, ввод-вывод.

По моему опыту, подобные зависания случаются, когда нарушается пайка BGA-корпуса чипсета. Теоретически эта болячка лечится прогреванием чипа специальным феном, но материнке, которая требует подобного лечения, на сервере не место. Скорей всего, ее придется менять.

Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру