The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Ошибка при настройке BGP привела к 27-минутному сбою в работе Cloudflare, opennews (??), 18-Июл-20, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


57. "Ошибка при настройке BGP привела к 27-минутному сбою в работ..."  +1 +/
Сообщение от пох. (?), 18-Июл-20, 18:16 
Если твой запрос адресован в конечном итоге ns'у клаудфлери (я не про 1.1.1.1, а про dahlia.ns.cloudflare.com и его братьев, на которых и ресолвится "половина интернета", та которая не гугль) - при отвале клаудфлери ресолвер хетзнера ничего кроме таймаута тебе вернуть и не сможет. А поскольку при этом еще и резко возрастает время обработки каждого отдельного запроса - в конце-концов может слечь от нагрузки и хетзнеровский - таймауты не кэшируются.

В свое время именно необходимость целиком подарить свои ресолверы клаудфлери (вместо нормального решения, сохраняющего за мной часть контроля за траффиком) как раз и заставила меня поставить окончательную точку в идее пользоваться ей для своих проектов.

Ответить | Правка | К родителю #53 | Наверх | Cообщить модератору

140. "Ошибка при настройке BGP привела к 27-минутному сбою в работ..."  +/
Сообщение от PnD (??), 21-Июл-20, 23:05 
> таймауты не кэшируются.

Кэшируются так или иначе результирующие SRVFAIL. На текущий момент все крупные (и не очень) резолверы допускают "небольшие" (с их точки зрения) отступления от RFC. Гугл и CF — в пределах разумного.
Akamai (ломают dnssec) и Qrator (кладут на TTL) вообще косячат по чёрному "потому что могут".

* Лидером в моём личном зачёте выступает (скрепный?) yandex dns. Там часть нод кэширует (положительный) ответ на *не определённое* время. Явно ошибка, но всем пох.

Ответить | Правка | Наверх | Cообщить модератору

145. "Ошибка при настройке BGP привела к 27-минутному сбою в работ..."  +/
Сообщение от пох. (?), 22-Июл-20, 17:19 
> Кэшируются так или иначе результирующие SRVFAIL

их нельзя кэшировать никаким разумным способом (servfail это _ответ_, рекурсивного сервера, а там у тебя просто нет ответа). Возможно гугл и может себе позволить специально обрабатывать такие проблемы, но у хетзнера наверняка обычный bind или knot. Поэтому он от такой нагрузки предсказуемо дохнет, тем более что весь интернет не поперекэшируешь, и даже двадцать процентов тоже. (с другой стороны, конечно, а зачем вам ресолвер если интернет умер)

> Там часть нод кэширует (положительный) ответ на *не определённое* время. Явно ошибка, но всем

это не ошибка. Прочитай внимательно документацию и удивись.
(Вкратце: ttl НЕ является временем кэширования, оно вычисляется по очень непростому алгоритму - с этим можно немного поиграть, меняя ttl в SOA, но если у тебя задача типового админа подвала "сделать фэйловер с минимальным ttl" - можешь сразу считать ее сфейленой, это не работает так как большинство думают.)

Ответить | Правка | Наверх | Cообщить модератору

150. "Ошибка при настройке BGP привела к 27-минутному сбою в работ..."  +/
Сообщение от PnD (??), 24-Июл-20, 21:18 
> их нельзя кэшировать никаким разумным способом (servfail это _ответ_, рекурсивного сервера,
> а там у тебя просто нет ответа).

  Т.к. в потроха резолвера unbound я сам лазил, то могу сказать что как минимум там это не так.
Таймаут ожидания ответа таки превращается в SRVFAIL и кэшируется (если не выкл). И это — реальный геморрой на "грязных" каналах.

>> Там часть нод кэширует (положительный) ответ на *не определённое* время. Явно ошибка, но всем
> это не ошибка. Прочитай внимательно документацию и удивись.
> (Вкратце: ttl НЕ является временем кэширования, оно вычисляется по очень непростому алгоритму
> - с этим можно немного поиграть, меняя ttl в SOA, но
> если у тебя задача типового админа подвала "сделать фэйловер с минимальным
> ttl" - можешь сразу считать ее сфейленой, это не работает так
> как большинство думают.)

  Ты не понял. "Не определённое" — это такой эвфемизм для "навечно".
Даже если я идиот и не проинкрементил серийник. (Идиот у нас электронный, но не суть. Резолверам на такие нюансы как номер зоны обычно вообще параллельно.) Все TTL в зоне — из суток. В т.ч. записи в SOA. Когда через пару недель yandex (и только он) продолжает в половине случаев отдавать старую версию, я такого алгоритма не знаю. У нас с ними нормальных контактов нет, так что возможно что их админы до сих пор сидят ровно. Переспрошу при случае граждан кто этим занимался.

Ответить | Правка | Наверх | Cообщить модератору

151. "Ошибка при настройке BGP привела к 27-минутному сбою в работ..."  +/
Сообщение от пох. (?), 27-Июл-20, 14:58 
> Ты не понял. "Не определённое" — это такой эвфемизм для "навечно".

не навечно, но для активно используемой зоны -надолго.

Оно так работает. By design.

> Резолверам на такие нюансы как номер зоны обычно вообще параллельно.

рекурсивным - абсолютно, номер интересует только слейвов. А рекурсор интересует ttl, но он используется не так как большинство нечитавших спецификацию думают.

Ответить | Правка | Наверх | Cообщить модератору

152. "Ошибка при настройке BGP привела к 27-минутному сбою в работ..."  +/
Сообщение от PnD (??), 29-Июл-20, 12:24 
> рекурсивным - абсолютно, номер интересует только слейвов. А рекурсор интересует ttl, но
> он используется не так как большинство нечитавших спецификацию думают.

  А это ничего что согласно основополагающему RFC-1035 SOA вообще не должны кэшироваться (в т.ч. всегда отдаются с TTL=0)?
Я между строк читать не умею, а по тексту написано вот это:
"""
Zero values are interpreted to mean that the RR can only be used for the transaction in progress, and should not be cached. For example, SOA records are always distributed with a zero TTL to prohibit caching.
"""

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру