The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..., opennews (?), 07-Окт-10, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


7. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от Mimo (?), 07-Окт-10, 06:39 
zabbix не?
Ответить | Правка | Наверх | Cообщить модератору

8. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  –1 +/
Сообщение от Stanislavvv (?), 07-Окт-10, 07:50 
> zabbix не?

Заббикс при всех его достоинствах - слишком много кушать для мониторинга. То есть, того компа, что выделили для этого, элементарно не хватило на ~40 серверов (2xP4 2.4GHz/512Mb).
С нагиосом - загрузка минимальна.

Ответить | Правка | Наверх | Cообщить модератору

9. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 08:27 
потому что по дефолту, система сохраняет все значения опрашиваемых параметров, для постройки графиков. если эту байду выключить (т.е. стать обыкновенной опрашивалкой), то нагрузка на sql уменьшится до нужд хранения только конфигурационных данных.

p.s. спецы нагиоса объясните мне такое поведение плагина check_snmp_storage

http://s43.radikal.ru/i100/1010/ef/675b40bb850e.png

я вот никак не в восторге от этого)))) что мне теперь подгонять теперь в шаблонах везде "-R" и вручную подставлять процент под каждую файловую систему?

Ответить | Правка | Наверх | Cообщить модератору

11. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от padvoemail (??), 07-Окт-10, 08:55 
> p.s. спецы нагиоса объясните мне такое поведение плагина check_snmp_storage

Не то чтобы я был "спецом нагиоса", но я бы начал с nagios -v <конфиг нагиоса>. Если где-то есть ошибка - данные не обновляются.

Ответить | Правка | Наверх | Cообщить модератору

13. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 09:21 
не видимо я плохо объяснил, данные снимаются как надо, nagios -v отрабатывает на отлично. покажу следующую картину,
картина на узле
prol ~ # df -h /
Filesystem            Size  Used Avail Use% Mounted on
/dev/md0              9.2G  7.9G  932M  90% /
prol ~ # df /
Filesystem           1K-blocks      Used Available Use% Mounted on
/dev/md0               9621816   8179384    953660  90% /

картина на мониторинге
kvm520-sm nagios # check_snmp_storage -H prol -C gJilIogg -w 90% -c 95% -m / -r
OK : /: 85%used(7988MB/9396MB)  : < 90 %  | /=7987MB;8456;8926;0;9396
kvm520-sm nagios # check_snmp_storage -H prol -C gJilIogg -R 6% -w 90% -c 95% -m / -r
WARNING : /: 90%used(7988MB/8833MB)  : > 90 %  | /=7987MB;7949;8390;0;8832

-R 6% это чтобы подогнаться к ext3, для reiserfs - 5% , и этот -R нужно обязательно вводить чтобы получить значения которые соответствуют действительности, иначе получим немного обрезанные данные (без каких-то зарезервированных блоков для рута)
имхо это лишняя фича, и вводит в заблуждение новичков, когда они видят расхождение в значениях)))

и сейчас осваиваю нагиос, наталкиваюсь на такие фокусы почти через раз:)

Ответить | Правка | Наверх | Cообщить модератору

25. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от oops (ok), 07-Окт-10, 10:46 
эээм, а агента на хост поставить и check_disk юзать никак?
Ответить | Правка | Наверх | Cообщить модератору

30. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 12:09 
к сожалению нельзя, нужно использовать только snmp, т.к. дефицит ресурсов.
Ответить | Правка | Наверх | Cообщить модератору

38. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +1 +/
Сообщение от oops (ok), 07-Окт-10, 16:54 
хохох, это вы при дифиците запускаете на наблюдаемой машине snmpd??
Ответить | Правка | Наверх | Cообщить модератору

41. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 08-Окт-10, 09:15 
подскажите мне другие варианты, будет интересно выслушать.
вообще по моим наблюдениям, snmpd отжирает больше памяти чем zabbix_agent (оба работают под одиинаковым количеством запросов), но использование snmpd обусловлено тем чтобы на всем оборудовании был один и тот же инструмент.
Ответить | Правка | Наверх | Cообщить модератору

55. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от oops (ok), 11-Окт-10, 10:56 
аргумент использования snmpd какой-то не очень. На сетевый девайсах - понятно, но вот на серверах лучше использовать агента конкретной системы мониторинга. Для Nagios - это nrpe
Ответить | Правка | Наверх | Cообщить модератору

39. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от FM (??), 07-Окт-10, 18:12 
как-то математика не сходится:
(7.9G / 9.2G) * 100% = 85%\
и даже
(8179384 / 9621816) * 100% = 85%
ну никак не 90% %)
так что Nagios тут непричем.
Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

42. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 08-Окт-10, 09:32 
> как-то математика не сходится:
> (7.9G / 9.2G) * 100% = 85%\
> и даже
> (8179384 / 9621816) * 100% = 85%
> ну никак не 90% %)
> так что Nagios тут непричем.

погуглив узнал что есть такая штука как reserved block ? как оказалось, просто плугин не считает эти зарезервированые блоки, а df - считает. получается расхождение)))
так что вроде и причем, и не причем... просто имхо, подсчет блоков должен быть включен по умолчанию. опять же как я уже писало, разные фс при форматировании по разному определяют процент резервирования.
в ext3 это -m reserved-blocks-percentage ... The default percentage is 5%.


Ответить | Правка | Наверх | Cообщить модератору

15. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 09:34 
вот еще один момент, плугин check_snmp , запрашивает значение OID и выдает warn или crit если полученное значение !БОЛЬШЕ! (и только "больше") образца.
Вот, а мне к примеру надо отслеживать uptime и мне надо получать warn когда значение меньше.
check_snmp -H odion -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 43200
SNMP WARNING - *292528060* | iso.3.6.1.2.1.1.3.0=292528060

как мне указать, что варнинг должен вылазить, только когда полученное значение меньше задаваемого образца?

условий вобщем нехватает мне, или я еще ненашел:)

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

23. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от padvoemail (??), 07-Окт-10, 10:35 
> check_snmp -H odion -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 43200

Если склероз мне не изменяет, там есть еще параметр "-с", для critical, указываете значение для срабатывания, которое вам надо для critical

Ответить | Правка | Наверх | Cообщить модератору

31. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 12:15 
> Если склероз мне не изменяет, там есть еще параметр "-с", для critical,
> указываете значение для срабатывания, которое вам надо для critical

нет не изменяет, "-с" конечно желательно указывать во всех проверках как второй порог, который говорит что настал совсем ахтунг... но деле не в этом, в моем случае это не решит, проблемы. вот смотрите:
аптайм машины - 80 дней. мне нужен одиночный алерт если вдруг аптайм окажется меньше 1 часа. и всё. я поставлю -w 3600 -с 1800, но это бессмысленно, плугин будет возвращать warn когда аптайм будет больше 3600 и crit когда больше 1800 но меньше 3600. вот как мне сделать чтоб warn был только когда значение меньше 3600 ?

Ответить | Правка | Наверх | Cообщить модератору

40. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от сабакка (?), 07-Окт-10, 21:09 
unix way - модифицируй скрипт :)
Ответить | Правка | Наверх | Cообщить модератору

26. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от oops (ok), 07-Окт-10, 10:50 
> вот еще один момент, плугин check_snmp , запрашивает значение OID и выдает
> warn или crit если полученное значение !БОЛЬШЕ! (и только "больше") образца.
> Вот, а мне к примеру надо отслеживать uptime и мне надо получать
> warn когда значение меньше.
> check_snmp -H odion -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 43200
> SNMP WARNING - *292528060* | iso.3.6.1.2.1.1.3.0=292528060
> как мне указать, что варнинг должен вылазить, только когда полученное значение меньше
> задаваемого образца?
> условий вобщем нехватает мне, или я еще ненашел:)

товарищ! ну запусти ты check_snmp --help и воткни в пороги типа -w 1:10 и сразу придумаешь как тебе выполнить твою задачу

Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору

32. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 12:19 
> товарищ! ну запусти ты check_snmp --help и воткни в пороги типа -w
> 1:10 и сразу придумаешь как тебе выполнить твою задачу

пробовал не работает((((

# check_snmp -H torre -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 0:3600
SNMP WARNING - *232208713* | iso.3.6.1.2.1.1.3.0=232208713

это как какая-то идиотская аксиома, аптайм выходит за диапазон, => warning.

Ответить | Правка | Наверх | Cообщить модератору

35. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от Gular (ok), 07-Окт-10, 13:28 
если решения не удается найти действительно, то как крайний вариант - плагины можно писать самому. там bash или perl.
Ответить | Правка | Наверх | Cообщить модератору

57. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от oops (ok), 11-Окт-10, 11:44 
а если подумать и попробовать что-то типа
check_snmp -H torre -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 3600:0

вроде так, или    -w 3600:   (т.е. без нуля, но с двоеточием)

Ответить | Правка | К родителю #32 | Наверх | Cообщить модератору

59. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от Серега (?), 14-Ноя-10, 23:52 
> а если подумать и попробовать что-то типа
> check_snmp -H torre -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 3600:0
> вроде так, или    -w 3600:   (т.е. без
> нуля, но с двоеточием)

-----------------
Да, двоеточие надо, а еще интервал можно указать -w 3600:4000

Ответить | Правка | Наверх | Cообщить модератору

10. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от padvoemail (??), 07-Окт-10, 08:36 
На одном из моих прежних мест работы (крупный хостер, более 1000 серверов в нескольких ДЦ + N-ное количество цисок), ходили легенды про то, как заббикс подавился такими объемами. Дело было до моего там появления, поэтому подробностей не знаю. Собственноручно поднимал там систему мониторинга на нагиосе  (5 серверов мониторили хозяйство, шестой собирал и отображал сводные данные и мониторил остальные нагиосы) - этого вполне хватало, LA выше 7-8 не взлетал, и тормозов не наблюдалось. 2-ядерный Xeon, 4G RAM, nagios, apache2, FreeBSD. Может, заббикс был неудачно приготовлен, но нагиос и до сих пор там живет и пасется.
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

12. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от Nerianemail (?), 07-Окт-10, 09:12 
А каким образом это было сделано? Чтобы 5 серверов мониторили, а 1 собирал?
Единственное что приходит в голову это то что этот единственный сервер запускал на той стороне npre плагины... Или как это сделать в nagios?
Ответить | Правка | Наверх | Cообщить модератору

14. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 09:25 
да интересно послушать про реализацию.. в заббиксе это делается на раз-два через заббикс-прокси, наверняка такие же плюшки есть и в нагиосе
Ответить | Правка | Наверх | Cообщить модератору

17. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от KonstantinK (??), 07-Окт-10, 10:01 
возможно что-то типа:
http://mathias-kettner.de/checkmk_livestatus.html

или аналогичное?

Ответить | Правка | Наверх | Cообщить модератору

18. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +1 +/
Сообщение от nagioser (?), 07-Окт-10, 10:10 
Отвечу за него. В нагиосе есть несколько механизмов, nrpe самый плохой из них, т.к. приходится на каждую проверку запускать новый процесс. Есть merlin (советую посмотреть http://www.op5.org/op5media/op5.org/downloads/merlin-scenari... ) и есть Distributed Nagios Executor ( http://dnx.sourceforge.net/ ). Это NEB модули, которые работают в адресном пространстве нагиоса, поэтому у них нет дополнительных расходдов как в случае nrpe.

Вообще очень странно, что на 1000 хостов автор использует несколько машин. У нас тоже более 1000 хостов, и справляются 2 виртуальных контейнера, один под сам нагиос, второй под базу для хранения всех результатов проверок.

Ответить | Правка | К родителю #14 | Наверх | Cообщить модератору

20. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +1 +/
Сообщение от padvoemail (??), 07-Окт-10, 10:22 
> Вообще очень странно, что на 1000 хостов автор использует несколько машин.

На каждом из этих хостов мониторилось весьма большое количество сервисов. Согласен, это некоторая избыточность, но очень не хотелось лишиться мониторинга, либо его актуальности - это больше политическое, чем техническое решение. А в подходящем железе недостатка не было. И конфигурилось оно централизованно (svn+puppet).

Ответить | Правка | Наверх | Cообщить модератору

21. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от Nerianemail (?), 07-Окт-10, 10:25 
nagioser, padvo - Спасибо Большое!
Ответить | Правка | Наверх | Cообщить модератору

19. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +2 +/
Сообщение от padvoemail (??), 07-Окт-10, 10:14 
Плюшка называется send_nsca. Есть среди плагинов. Хост-коллектор настраивается на мониторинг всего хозяйства (все, что мониторится, должно быть указано в конфиге). Все эти проверки на хосте-коллекторе определяются как пассивные. На остальных хостах - активные. Вот конфиг для этой штуки (пути фряшные, в линуксах будут другие, адаптируйте).

# send_nsca command path
CMD="/usr/local/sbin/send_nsca"
# send_nsca config file
CFG="/usr/local/etc/nagios/send_nsca.cfg"
# where to send passive checks
PASSIVEHOST=<master_host> # Имя хоста-коллектора
# where to log send events
LOG="/opt/nagios/send_host_nsca.log"
# how often send events (per min)
OFTEN="6"
# mv log before send
TMPSEND="/tmp/passive_host_event.log.$$"
# log
TMPREC="/tmp/passive_host_event.log"

А по поводу -R - Вы, похоже правы, у нас было некоторое количество линукс-машин с ext3, но диски мониторил самописный демон, а не этот плагин.

Ответить | Правка | К родителю #12 | Наверх | Cообщить модератору

33. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 12:24 
в том и незадача, при использовании nagios часто приходится прибегать каким то третьим инструментам, например jabber-уведомления, пришлось приделать через pl-скрипт, веб-морда для виндо-админов - nagiosql, графики - cacti или pnp4nagios
хочется пожелать icingа-девелоперам удачи в работе, чтобы они сделали прекрасный инструмент, где все это будет в одном месте:)

Ответить | Правка | Наверх | Cообщить модератору

36. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +1 +/
Сообщение от Gular (ok), 07-Окт-10, 16:22 
не. на самом деле не надо. нагиос - это конструктор. идея как раз в том, чтобы делать только то что нужно. если же требуется уже готовое со всеми возможностями, то используйте лучше заббикс или зеносс.
Ответить | Правка | Наверх | Cообщить модератору

37. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от daevy (ok), 07-Окт-10, 16:38 
желательно чтоб детали конструктора находились хотя бы в одной коробке)))) а так любая система является по сути конструктором.
Ответить | Правка | Наверх | Cообщить модератору

47. "Релиз системы мониторинга Icinga 1.2.0, продолжающей развити..."  +/
Сообщение от mootalemail (?), 09-Окт-10, 16:33 
unix-way. Тут приходится выбирать - либо конструктор, из которого можно собрать всё что угодно, либо "энтерпрайз", немеряно жрущий ресурсов по умолчанию и подразумевающий "шаг влево - шаг вправо - расстрел". Каждый выбирает для себя более удобное.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру