> Не работать уставшим, посидеть подумать, угу. Особенно когда стоят над душой и нудят:я тебе страшный девопский тайна открою (ее даже Шигорин не знает, потому что альтовские сервера нафиг никому не уперлись): когда у тебя высоконагруженный проект, да еще пусть под слабой даже атакой и в нем половина мощности внезапно ложится - у тебя "над душой" стоит даже не эффективный менеджер (его уже самого к тому моменту в интересных позах имеет инвестор) а система мониторинга, заходящаяся воем, что сейчас вообще ВСЕ пойдет по женскому органу.
То есть тупит база- начинают тормозить прокси - начинают тупить фронты - юзвери злобно жмакают релоад, увеличивая и без того большую нагрузку - и, скорее рано чем поздно, ты получаешь на ВСЕХ хостах LA500 - и сделать с этим уже ничего нельзя, отключай нахрен входящий канал и перезагружай хосты ресетом, это ж линукс, оно уже не очухается. Это все здорово напоминает управление чернобыльским реактором - за пять минут до взрыва.
Ничем, кроме найма большего числа админов, чтобы не лечить неизлечимо больного, а планомерно убирать узкие места, те же бэкапы проверять и переделывать в порядке текущей работы, покупки больше серверов, чтобы было что вводить в качестве резервов (почему, собственно, реплик только две, при том что одна не держит?), в общем - денег, денег и еще раз денег, сравнимо с тем что уже вгрохано в этот сервис, а не еще 5%, это не лечится.
А денег в маргинальных проектах мало и их жмут, особенно когда оно уже как-то завелось и вроде бы работает - "какие ЕЩЕ бэкапы, мы вам azure оплатили, пользуйтесь!". Проще назначить крайних, потерять пол-дня данных и день на восстановление, ну и процентов десять юзербазы, на первый разок.