Спустя полгода после выпуска версии 3.0 сформирован (http://www.zabbix.com/whats_new.php) новый значительный выпуск системы мониторинга Zabbix 3.2 (http://www.zabbix.co). Вышедшая версия предлагает новые подходы к конфигурированию системы, существенно расширяющие её возможности и делающие её настройку и использование более гибкими. Код проекта распространяется под лицензией GPLv2.Напомним, что Zabbix состоит из трёх базовых компонентов: сервера для координации выполнения проверок, формирования проверочных запросов и накопления статистики; агентов для осуществления проверок на стороне внешних хостов; фронтэнда для организации управления системой. Для снятия нагрузки с центрального сервера и формирования распределённой сети мониторинга может быть развёрнута серия прокси-серверов, агрегирующих данные о проверке группы хостов. Код агентов и серверной части написан на языке Си, для разработки web-интерфейса использован язык PHP. Данные могут храниться в СУБД MySQL, PostgreSQL, SQLite, DB2 и Oracle. Без агентов Zabbix-сервер может получать данные по таким протоколам как SNMP, IPMI, JMX, SSH/Telnet, ODBC, проводить тестирование доступности Web-приложений и систем виртуализации.
Основные (http://www.zabbix.com/whats_new.php) улучшения (http://www.zabbix.com/rn3.2.0.php):
- Добавление тэгов к триггерам и событиям;- Корреляция событий на основании тэгов;
- Вложенные группы узлов сети;- Эффективное отображение списка проблем;
- Закрытие проблем вручную;
- Отдельные условия для срабатывания и восстановления триггеров;- Просмотр элементов, созданных низкоуровневым обнаружением;
- Остановка эскалаций на период обслуживания;
- Настройка операций восстановления в действиях;
- Экспорт и импорт веб-сценариев из XML;
- Использование регулярных выражений в триггерной функции count();
- Извлечение значений из макросов с помощью регулярных выражений;
- Вычисление триггеров с участием не поддерживаемых элементов данных;
- Новые параметры и элементы данных для быстрорастущих лог-файлов.URL: http://www.zabbix.com/whats_new.php
Новость: https://www.opennet.ru/opennews/art.shtml?num=45147
> Напомним, что Zabbix состоит из трёх базовых компонентовНапомним, что это не так. Еще он состоит из Zabbix Proxy и Zabbix Java gateway. Да, их можно не использовать, но и из них тоже он состоит.
Все слова в предложениях читать не нужно, некоторые, например "базовых", можно не читать. Читать дальше первого предложения в абзаце не нужно.
> некоторые, например "базовых", можно не читатьТы как будто не видел этих, которые из кнутовского высказывания про преждевременную оптимизацию выкидывают слово "преждевременная".
> Все слова в предложениях читать не нужно, некоторые, например "базовых", можно не
> читать. Читать дальше первого предложения в абзаце не нужно.А в моих Zb _базовый_ компонент -- это Postgres. У вас у всех Zb неправильный!! :-P
Экспорт графиков сделали?
Экспорт куда?
например в pdf?
> например в pdf?Я через API за два дня сделал экспорт в RRD например.
> например в pdf?Чем .png-ешечки-то не хороши?? Взял wget-ом - положил в запасник.
>> например в pdf?
> Чем .png-ешечки-то не хороши?? Взял wget-ом - положил в запасник.хваленый поцгрез не справляется их отрисовать по желанию, приходится качать вгетом и архивы в пнг хранить?:-)
>>> например в pdf?
>> Чем .png-ешечки-то не хороши?? Взял wget-ом - положил в запасник.
> хваленый поцгрез не справляется их отрисовать по желанию, приходится качать вгетом и
> архивы в пнг хранить?:-)Эге. Шоб база не пухла больше ОЗУ [=и таки "справлялась" и текущей отрисовкой], ставлю histoty 3 для и trends год.
Прошлогодние скрины теперь понятнее зачем? Или скрины "той проблемы на прошлоц неделе"?
Это такая _аналитика_, которй, да, нет в Zabbix. Понимаешь?! Раз-раз!
Нафиг этот экспорт! Лучше бы сделали, чтобы макросы в графиках обрабатывались! Чтобы по на вставлять туда {$ERUNDA}, {$ERUNDA2} и оно бы всё кааак обработалось! А ещё в комплексных экранах в URL'ах хочется обработка этих макросов, чтобы динамические урэлочки делались.
p.s. просьба слюной не брызгать - "если хочешь, сам возьми и напиши!", я просто поделился наболевшим.
> Экспорт графиков сделали?Конечно, в браузер в виде картинок
А между тем многолетний граблемёт по отсутствию алерта у триггера, часть которого стала UNKNOWN (нет данных от sql-запроса и т.п) дичайшим образом напрягает. Реально пришлось написать свой dashboard, чтобы из-раза в раз не натыкаться на грабли, что у нескольких действительно важных серверов из 100500 всего посредственных? не собираются важные параметры и не работает алерт. Как по мне, это жесть. Nagios/Icinga в этом плане действуют однозначно: нет данных но есть ожидаемая проверка? Нате вам алерт!И ещё очень напрягает флаппирование значений, собирающихся через заббикс-агенты: "item became not supported", "item became supported". Дежурные привыкают к постоянным морганиям триггеров и пропускают действительно важные алерты долгое время. Nagios/Icinga для этого вообще статус flapped ввели, шикарная тема, я считаю.
PS: 23936 узлов, 153985 item-ов, причём бОльшая часть узлов собираются чисто для статистики и никакие алерты по ним не интересны а для нескольких тысяч ключевых триггеров мне важно гарантированно за ними следить.
Что-то мне говорит, что на переходы из normal в unsupported реакция была добавлена в 2.2
https://www.zabbix.com/documentation/2.2/manual/config/notif...
Или у вас какой-то более сложный случай?
А что потом делать с этими нотификациями? Отдавать инженеру, чтобы он целый день сидел в вебинтерфесе и включал их руками или скрипту, чтобы он каждый раз менял статус на supported, чтобы через минуту статус опять стал unsupported?
> А что потом делать с этими нотификациями? Отдавать инженеру, чтобы он целый
> день сидел в вебинтерфесе и включал их руками или скрипту, чтобы
> он каждый раз менял статус на supported, чтобы через минуту статус
> опять стал unsupported?Отдать их администратору мониторинга, что бы разобрался почему у него все кривое и ломается.
Дык это и так понятно, почему. Потому, что пришел ответ который zabbix не ожидал.Однако это не означает, что у администратора мониторинга всё кривое и ломается.
Давайте без трололо, а?
> Дык это и так понятно, почему. Потому, что пришел ответ который zabbix
> не ожидал.
> Однако это не означает, что у администратора мониторинга всё кривое и ломается.Если у вас что-то отдает неправильный ответ, значит у вас это что-то неправильно настроено. А значит надо либо чинить отдачу, либо править заббиксу что он должен принимать. Система мониторинга не должна сама догадываться что вы ей сегодня засунете.
И опять мимо. Не обязательно неправильно настроено. Бывают транспортные проблемы, бывает неожиданное временное поведение софта который отдает не то, что ожидалось. А итог - unsupported по итемам и по триггерам. В багтрекере, кстати, годами висит тикет про кривизну этого архитектурного решения, но вы, в отличие от разработчиков заббикса, почему-то уверены, что с заббиксом всё прекрасно, а оператор сам дурак.Попробую выразиться на понятном вам языке гипербол и слоганов: Система мониторинга должна уклоняться от ошибок, а не падать замертво, как это делает заббикс.
А можно номер тикета? Интересно будет посмотреть на предлагаемые решения.
Не буду отрицать того, что Zabbix не идеален, но
>...неожиданное временное поведение софта который отдает не то, что ожидалось...Это ведь как раз тот самый случай, когда unsupported. Разве нет? Весьма исключительное событие. И, если оно повторяется, то нужно разбираться. М?
Zabbix предоставил весьма и весьма удобный, поддающийся глубокой настройке инструмент.
Задача администратора Zabiix - отследить изменение состояния наблюдаемой среды, выявить причину и отреагировать тем или иным образом.
Кто-то сообщает об изменениях сисадминам наблюдаемых систем.
Кто-то исследует полученные сигналы и вырабатывает комплекс мер.
Кто-то уподобляется белочке-истеричке и по всем форумам заявляет о недоработках ПО
> Это ведь как раз тот самый случай, когда unsupported. Разве нет? Весьма исключительное событие. И, если оно повторяется, то нужно разбираться. М?Простейший пример: хочу по SNMP мониторить состояние OSPF линков, мониторю oid вида 1.3.6.1.2.1.14.10.1.6.ip_адрес_соседа.0
$ snmpwalk -v3 -l authPriv -a SHA -u user -A pass1 -x aes -X pass2 -n ospf-context1 192.168.1.20 .1.3.6.1.2.1.14.10.1.6.192.168.1.177.0
iso.3.6.1.2.1.14.10.1.6.192.168.1.177.0 = INTEGER: 8
Всё работает, циферки возвращаются. Но вот если линк полностью падает, то$ snmpwalk -v3 -l authPriv -a SHA -u user -A pass1 -x aes -X pass2 -n ospf-context1 192.168.1.20 .1.3.6.1.2.1.14.10.1.6.192.168.1.177.0и в Zabbix элемент становится not supported.
iso.3.6.1.2.1.14.10.1.6.192.168.1.177.0 = No Such Instance currently exists at this OID
Есть куча других примеров такого поведения и для всех в Zabbix приходится лепить костыли.
Думаю, что хорошим решением было бы дать возможность пользователям самим определять как реагировать на подобное - просто игнорировать либо каким-то образом оповещать операторов.
Теперь можно юзать nodata, не парьтесь.
> Теперь можно юзать nodata, не парьтесь.nodata не везде катит, например поведение nodata при сборе ивентов с windows-серверов будет вас периодически расстраивать.
Никогда не было проблем с unsupported. Нотификации на unsupported есть. На моём опыте только собственные(пользовательские) item'ы вылетают в unsupported. Если такое просиходит, то косяк со скриптом, который нужно исправлять.
>Нотификации на unsupported есть.Ткните ссылочкой, будьте добры. Слаб стал на старости, ленив, упустил. Извините, спасибо.
> А между тем многолетний граблемёт по отсутствию алерта у триггера, часть которого
> стала UNKNOWN (нет данных от sql-запроса и т.п) дичайшим образом напрягает.Не пробовали багу вешать? Вдруг Вам больше повезёт...
>> А между тем многолетний граблемёт по отсутствию алерта у триггера, часть которого
>> стала UNKNOWN (нет данных от sql-запроса и т.п) дичайшим образом напрягает.
> Не пробовали багу вешать? Вдруг Вам больше повезёт...Так уже ж фсёо: correctly ж уже.
http://www.zabbix.com/rn3.2.0.php
:: Added evaluation of logical expressions with unsupported items in trigger expressions and calculated items
Zabbix will correctly evaluate trigger expressions if one of items is unsupported.
.
.
.
И более того "UNKNOWN"-ов после 2.0 и нету вообще: сплошь ОКеи.http://www.zabbix.com/rn2.2.0.php
:: Removed support of unknown events
Unknown events are no longer generated and supported. New triggers will now be created in OK state.
Как там опять же с дисковым io? Из коробки будет чего-ндь?
Какие платформы интересуют? Для процессов или на уровне всей системы?
> Как там опять же с дисковым io? Из коробки будет чего-ндь?vfs.dev.read[] и vfs.dev.write[] же. Или Вы хотели спрость что-то не то, что спросили?
system.cpu.util[,iowait] вот есть рядом.Или вот местные самоджелкины положили (или с форумов натащили?--) рядом с ними sar -- теперь рисуются правильные "sar-овские" iops-ы (да, то же, что vfs.dev.read[dev,ops]+vfs.dev.write[dev,ops]) и disk util.
Зачем оно "из коробки"?... "Зделайте мен харашоу"? Ну, да, недоработочка. Или Ваш кусок масла на чей-то кусок хлеба.
Выполнения удалённых команд на хостах за прокси как не было так и нет. С 2009 года тикет висит ZBXNEXT-936.
Проголосуете за него кому не лень, может Владышев поймет наконец, что мониторинг без удаленных команд амно, а не мониторинг.
> Выполнения удалённых команд на хостах за прокси как не было так и
> нет.Очень уж непросто это реализовать. А пока можно использовать запуск команд на стороне сервера с транслированием их на нужные устройства через SSH. Да, неверное, и сами это знаете.
Долгая дорога получается, тем более подавляющее большинство объектов мониторинга это вынь-серверы, надо еще их ssh обучить.
Обхожусь NATом на прокси, обеспечивая прямую видимость агента с основного сервера. Но это как-то ненормально, хочется нативного решения, а не костылей.
> Выполнения удалённых команд на хостах за прокси как не было так и
> нет. С 2009 года тикет висит ZBXNEXT-936.А-ага, и мне б кто пропатчил Zb... Вот на прокси, например, нет Zb-API. Я знаю, что его нет, знаю почему. Как бы мне это моим%) External скриптам объяснить. На [центральном] сервере у них API есть, а на прокси -- нет...
> Проголосуете за него кому не лень, может Владышев поймет наконец, что мониторинг
> без удаленных команд амно, а не мониторинг.Это. Всё. Суета.
>Вот на прокси, например, нет Zb-API. Я знаю, что его нет, знаю почему. Как бы мне это моим%) External скриптам объяснить. На [центральном] сервере у них API есть, а на прокси -- нет...Сами костыли придумали, сами и боритесь с ними. Скрипты внешнего опроса должны заниматься ТОЛЬКО опросом (или обнаружением). Если надо чего-то насоздавать, то можно попробовать воспользоваться низкоуровневым обнаружением. Это, правда, полностью API не заменит.
Поставте nginx на прокси, будет Вам и api и интерфейс впридачу.
> Поставте nginx на прокси, будет Вам и api и интерфейс впридачу.Садись, двойка.
Э, да Вам не zabbix пачить надо, а самомнение неуемное.
Самый главный недостаток ИМХО- отсутствие возможности распихать устройства по разным классам, локациям, группам...
> Самый главный недостаток ИМХО- отсутствие возможности распихать устройства по разным классам, локациям, группам..."Групп узлов сети" не хватает?
>> Самый главный недостаток ИМХО- отсутствие возможности распихать устройства по разным классам, локациям, группам...
> "Групп узлов сети" не хватает?Насколько помню- нет. Устройство может находиться по определенному адресу, принадлежать классу устройств (cisco, например) и принадлежать группе- Core. Я когда ставил заббикс, так и не понял как так можно сделать...
>Я когда ставил заббикс, так и не понял как так можно сделать...Наверное - давно это было...
>> Самый главный недостаток ИМХО- отсутствие возможности распихать устройства по разным классам, локациям, группам...
> "Групп узлов сети" не хватает?Н-ну-у... Вложенные группы вот они там наверху имитируют, например. Но как-то неискренне, с оговорочками, мол, берите кривое, как-есть-мы-вас-предупредили.
Мне нужны группы-флаги, иерархия групп, множественые иерархии групп... С содроганием смотрю на движение нашего любимого Спагетти Монстра в этом направлении.
> Самый главный недостаток ИМХО- отсутствие возможности распихать устройства по разным классам,
> локациям, группам...Ну как же! Есть возможность использовать группы, а в 3.2 и иерархические группы. Можно делить устройства по классам, географии, производителям и прочее.
В 3.2 появляется дополнительная возможность делить проблемы абсолютно по любым признакам-меткам (например, имя сервиса) и на основе этих признаков создавать оповещения, фильтровать проблемы в интерфейсе и создавать правила корреляции проблем.
Это буквально на порядок может уменьшить количество правил для отправки сообщений.
>> Самый главный недостаток ИМХО- отсутствие возможности распихать устройства по разным классам,
>> локациям, группам...
> Ну как же! Есть возможность использовать группы, а в 3.2 и иерархические
> группы. Можно делить устройства по классам, географии, производителям и прочее.Можно уже (я дальше whatsnew320 и по диагонали не смотрел) сказать, что _все_ хосты должны иметь _ровно_ одну группу в иерархиях Location/*, Production/*, Operators/* ? И добавить, что у шаблонов нет Location/ и не дОлжно? А при [x]maintanance маскировать Production/24x7x99999 до уровня Production/NoAlertes ....
> В 3.2 появляется дополнительная возможность делить проблемы абсолютно по любым признакам-меткам
> (например, имя сервиса) и на основе этих признаков создавать оповещения, фильтровать
> проблемы в интерфейсе и создавать правила корреляции проблем.
> Это буквально на порядок может уменьшить количество правил для отправки сообщений.И корреляции, надо полагать, уменьшат и _количество_ оповещений? Ух-т, надо. Как уже появится посмотрю.
поддержку php7 судя по всему так и не завезли?
отвечу сам себе - не завезли ещё. как и в прошлой 3.0.х версиях "PHP v7 is not supported yet. "
Официально нет, но видимых проблем не выявлено, работает в связке nginx + php 7.0
А зачем? PHP там для работы веб-морды, ее крутит совершенно любой сервер. А сам Zabbix-сервер далеко не на PHP писан.PHP 7 ускорит веб. Надо ли это?
В Ubuntu 16.04 по умолчанию PHP 7.0 и хотя PHP 5.6 в ppa есть, лучше уж Zabbix 3.x поставить.
> поддержку php7 судя по всему так и не завезли?Zabbix 3.2 поддерживает PHP 7.0! Поправили документацию.
Некоторые пакеты, например, Ubuntu 16.04, уже строятся с PHP 7.0 на борту. Наши тесты показывают значительный прирост производительности.
Однако нельзя использовать (если я не ошибаюсь) 7.0.3, в самом PHP был баг, который ломал много кода. Его исправили в PHP 7.0.4.
еще не хватает в zabbix разделение прав по приложениям. Группы узлов - как то упрощенно. Зачем например давать доступ группе сетевиков к данным по работе баз данных или верхних приложений.
Не плоди сущностей, %username%. Всё это можно сделать группами (устройство может входить в несколько групп) и правами пользователей
> Не плоди сущностей, %username%. Всё это можно сделать группами (устройство может входить$-) Теперь модна конт-ей-нер-изация! Даёшь плюрализм в одном ядре-инстансе-сервере Zb! (только они от тех DM-под-забиксов (как бишь их там?) избавились -- а туточки мы с Благими Пожеланиями!) <warning></empty-talks>
> в несколько групп) и правами пользователей
:/ Политика управления правами = Всем -- Zabbix-SuperAdmin-ов и торжественную клятву под флагом ничего не сломать.
>разделение прав по приложениям. Группы узлов -
> как то упрощенно.В смысле?? Права на _части_ хостов? По-айтемно, что ли? Ух!
ping-и - сетевикам и админам серверов, proc.num[httpd] -- админам серверов и приложений!
("Виды" в хосты: host[view:netadm] - только ping-и, host[view:srvadm], host[view:appops]... - не то же, что просто host[*]. Прям SELinux -- зовите АНБ, нужны патчи!!)
Предлагаю _динамически_ делить (и объединять, гулять так гулять!) хосты на... динамические хосты! Скажем, запустил ты ещё 1 бэкенд веб-сервер. В "динамическом" хосте все-бэкенды ping.icmp поменялся с 4/4 на 5/5... Ой, нужна новая арифметика, что-то из нечёткой логики! А вот зажёгся триггер ping.icmp PROBLEM на одном из этих 5 серверов, а во всех-бэкендах ping.icmp NOT-REALLY-A-PROB.... [[Hint-hint! Даёшь _шкалу_, а не дискретные OK..PROBLEM. Даёшь severity триггера, как функцию (таблично, не усложнять--) того параметра. Страшно подумать о спагетти-изменениях... Как оповещать при переходе триггера из 0.3/Warning в 0.8/Avg? А из 1.0/High прямо в 0.0/ok, минуя и 0.3/W и 0.7/Avg? А туда-сюда пять раз за минуту??... ]]Или, скажем два сервера, db1 и db2. Нет, лучше pg1 и pg2! Делаем 2 динамических pg-master и pg-stabdby и... магически переключаем их туда-сюда?! Можно, конечно вместе со статусом сервиса Pg _таскать_ и ip-шник, но-о-о... оно так же страшнО в [предполагаемой] реализации, как этот воображаемый "динамический" патч забикса.
> Предлагаю _динамически_ делить (и объединять, гулять так гулять!) хосты на... динамические хосты!Браво! Отсыпь?
>> Предлагаю _динамически_ делить (и объединять, гулять так гулять!) хосты на... динамические хосты!
> Браво! Отсыпь?Лови в следующей версии субжа. :-Q
Ради интереса, не холивара ради, чем оно лучше icinga(1) или nagios
много автоматических штук. новые хосты можно сделать чтобы появлялись атоматически в нужной группе со всеми темплейтами. все сервисы дисковерятся автоматом, по ним заводятся алерты. в нагиосе все вручную.
Нет. Какой-нибудь генератор конфигов + nagios уделывает zabbix и приносит кучу пользы.
юзал вторую айсингу и сейчас юзаю 3-й заббикс.
Все (почти все) автоматизируется через паппет.
айсинга нравилась больше, но и заббикс тоже весьма не плох.
Не хватает возможности запускать два инстанса одновременно.
> Ради интереса, не холивара ради, чем оно лучше icinga(1) или nagiosНу... Они, наверное, примерно как Emax и ViM...
Или как nVidia и AMD, Pentium и Athlon, блондинки и брюнетки, пиво и квас...
Дает тебе иллюзию надежды, что у тебя будет хороший мониторинг без необходимости лезть под капот и полностью настраиваемый по клику мыши.
> Спустя полгода после выпуска версии 3.0Алексей, коли Вы здесь наблюдаетесь -- может, глянете https://support.zabbix.com/browse/ZBXNEXT-2253 на предмет интересности в upstream? Когда этот проект был в работе, было сказано, что до третьей версии такие объёмные изменения всяко не примете (что вполне понятно), а ко времени выхода таковой перетаскивать наработки на версию, которая ещё неизвестно когда понадобится (и понадобится ли), времени не стало уже у нас.
В любом случае благодарю.
Только сейчас заметил коментарий. Ответил тут: https://support.zabbix.com/browse/ZBXNEXT-2253.
> Ответил тут: https://support.zabbix.com/browse/ZBXNEXT-2253Понял, спасибо.