> Вот это ключевое. Сколько не пытался добиться внятного пояснения, что именно надо
> смотреть в SMART - никто не может ничего внятного сказать.Потому что иожет зависеть от накопителя, фирмвари и много чего еще.
Самые ключевые вещи: рост raw read error rate больше "типичного" для девайса, но его можно и накрутить долбя даже 1 несчастный сбойный сектор. Лучше до этого не доводить если винч нужен, фирмварь может обидеться. Число seek error, и тому подобное. Spin retry count намекнет если мотор уже на грани клина, сотни тыщ load cycle намекает что винч очень заезженый уже и напылил себе в гермозону результатами износа от дурных парковок - при этом можно ожидать и россыпь бэдов. UDMA CRC Err не ноль = дерьмовый кабель или плохой контакт разъема чаще всего. Если reallocated более десятка-двух, винч скорее всего уже стремный. А вот само по себе приличное число pending - может и не быть ужас-ужас, они и "софт бэдами" бывают по разным причинам. А может и быть, как с воооон теми WD и вон той фоточкой окислов.
> Все счётчики что-то значат, но в то же время ничего не значат.
Они почти всегда что-то значат. И так или иначе отображают внутреннее состояние винта в меру дури фирмвари. Скажем чисто reallocated обычно имеет что-то общее с размером grown defect list и уйдет в критичное значение когда он станет заканчиваться. До этого лучше не доводить - фирмварь может обидеться, так что записывать что-то на проблемного пациента можно только после отстройки образа с которого вы данные вытащите. И не раньше. А если обычным софтом параллельно с операционкой там орудовать... ну... тем хуже для вас.
> Даже те, что помечены как error. Поэтому диагностика винта по SMART
> вообще никому не впилась.
А мне так нормально для прикидки состояния винча в ряде случаев. Если понимать что может и гнать или не быть панацеей. Сильно лучше чем ничего, как оно было до этого стандарта.
> Там, где могут себе позволить - просто периодически дёргают тест, один бэдблок
> появился - винт под замену. Остальные делают бэкапы.
Один бэд с такой плотностью еще не индикатор "системных" проблем. У меня есть несколько винчей с несколькими реалокейтами которые прекрасно работают годами. А вот десяток реалокейтов за месяц уже точно повод сбэкапать все что бэкапается.