> Насчёт всех разом сдохших - ясное дело, но согласись, что на такую
> дичь закладываются только в совсем уж суровх применениях.нууу... а чего такого уж невероятного в отказе всей полки или даже - сгорании ее с дымом, вонью, и прихватыванием заодно и самих дисков?
то есть с одной стороны - да, за то и платят за ентер-прайсные решения, чтоб такая херь случалась как можно реже, но план Б надо бы и на этот случай. То есть - с потерями, с падением маловажных сервисов на продолжительные сроки или вообще навсегда, если бизнес может как-то и это пережить, и восстановлением важных за часы, а не минуты, но надо как-то расхлебываться.
Кто-то, наверное, может себе позволить все терабайты уреплицировать на другой конец шарика, и иметь там копию DC (возможно с копиями ответственных инженеров), а кому-то окажется дешевле закрыться на неопределенное время.
> Насчёт восстановления - опять же от архитектуры зависит. Я видел варианты от
Я именно про backblaze, там в бложеке детально описывали. Страх, смерть и ужас, завуалированные под сказку для самых маленьких.
Наиболее простой и удачный для всех исход - если отказавший диск медленно, печально, с ошибками dma, или вообще даже с пропусками блоков - за сутки-двое удается скопировать в лаборатории на столе 1:1
Остальные варианты хуже и ненадежнее.
Как ни смешно, но в основном их спасает надежность современных ширпотребных дисков - отказы того, что уже введено в эксплуатацию (а новый pod долго тестируют, прежде чем считать данные на нем доступными), как ни странно, редкость.