The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Подскажите, диску конец?"
Версия для распечатки Пред. тема | След. тема
Форум Открытые системы на сервере
Исходное сообщение [ Отслеживать ]
Заметили полезную информацию ? Пожалуйста добавьте в FAQ на WIKI.
. "Подскажите, диску конец?" +2 +/
Сообщение от lavremail (ok), 19-Сен-17, 13:30 
> Не роняли, не пинали. Этот системник с райдом второго уровня включается раз
> в неделю, делает свои дела и выключается. Наработка то совсем маленькая.

рейд второго уровня - это что?

> Что могло случиться?
> # smartctl -a /dev/sdb
> smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.12.12-300.fc26.x86_64] (local build)
> Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
> === START OF INFORMATION SECTION ===
> Model Family:     Western Digital Blue Mobile
> Device Model:     WDC WD10JPVX-22JC3T0

для рейд Вы взяли: WD Blue Mobile?

>[оверквотинг удален]
> Always       -    
>    100271
>   3 Spin_Up_Time        
>    0x0027   178   175  
>  021    Pre-fail  Always    
>    -       2058
>   4 Start_Stop_Count        0x0032
>   091   091   000  
>  Old_age   Always      
> -       9449

вот

>   5 Reallocated_Sector_Ct   0x0033   191  
> 191   140    Pre-fail  Always  
>      -      
>  413

появилось что-то

>[оверквотинг удален]
> 000    Old_age   Always    
>    -       0
>  12 Power_Cycle_Count       0x0032  
> 099   099   000    Old_age
>   Always       -  
>      1774
> 191 G-Sense_Error_Rate      0x0032   093  
>  093   000    Old_age  
> Always       -    
>    7

не роняли?

> 192 Power-Off_Retract_Count 0x0032   200   200   000
>    Old_age   Always    
>   -       137
> 193 Load_Cycle_Count        0x0032  
> 195   195   000    Old_age
>   Always       -  
>      15930

и вот - 4,193 - шпиндель up/down

> 194 Temperature_Celsius     0x0022   123  
> 086   000    Old_age   Always
>       -    
>   24
> 196 Reallocated_Event_Count 0x0032   162   162   000
>    Old_age   Always    
>   -       38

появились

> 197 Current_Pending_Sector  0x0032   200   200  
> 000    Old_age   Always    
>    -       58

появились сектора с намеком на бед в будущем

>[оверквотинг удален]
> # 1  Conveyance offline  Completed: read failure    
>    90%      2362  
>        2262201
> # 2  Conveyance offline  Completed: read failure    
>    90%      2362  
>        2262201
> # 3  Short offline       Completed:
> read failure       90%  
>    2358        
>  1026040

short не прошел и два offline тоже не прошли, если Вы все время
включаете и выключаете - неудивительно.
Да и зачем offline, short и long тесты прогнать, но как если шпиндель
up/down?

>[оверквотинг удален]
> 0        0  Not_testing
>     3        
> 0        0  Not_testing
>     4        
> 0        0  Not_testing
>     5        
> 0        0  Not_testing
> Selective self-test flags (0x0):
>   After scanning selected spans, do NOT read-scan remainder of disk.
> If Selective self-test is pending on power-up, resume after 0 minute delay.

Отключать apm, поможет ли или wdidle


> dmesg
> 2468.216597] sd 6:0:0:0: [sdb] Attached SCSI disk
> [ 2472.346413] sd 6:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
> [ 2472.346421] sd 6:0:0:0: [sdb] tag#0 Sense Key : Medium Error [current]

ошибка поверхности если не ошибаюсь

> [ 2472.346426] sd 6:0:0:0: [sdb] tag#0 Add. Sense: Unrecovered read error
> [ 2472.346433] sd 6:0:0:0: [sdb] tag#0 CDB: Read(10) 28 00 00 60
> 16 c5 00 00 08 00
> [ 2472.346438] blk_update_request: critical medium error, dev sdb, sector 6297285
> [ 2476.179034] sd 6:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE

unrecovered - непоправимая ошибка чтения

>[оверквотинг удален]
> [ 2483.737800] sd 6:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
> [ 2483.737808] sd 6:0:0:0: [sdb] tag#0 Sense Key : Medium Error [current]
> [ 2483.737812] sd 6:0:0:0: [sdb] tag#0 Add. Sense: Unrecovered read error
> [ 2483.737819] sd 6:0:0:0: [sdb] tag#0 CDB: Read(10) 28 00 00 60
> 17 88 00 00 08 00
> [ 2483.737825] blk_update_request: critical medium error, dev sdb, sector 6297480
> [ 2483.737835] Buffer I/O error on dev sdb3, logical block 0, async
> page read
> [ 2483.737843] Buffer I/O error on dev sdb3, logical block 1, async
> page read

WD Blue, да еще mobile под RAID?!

Резюме:
- WD Blue да еще Mobile в RAID... нет слов
- smart говорит о том что роняли или были удары
- medium error скорей всего это подтверждает
- ну и spin up/down регулярно - это не для RAID

Отдайте его в notebook, там ему место, предварительно:
- отрубить apm и попробовать wdidle утилиту
- после верхнего, выполнить два-три раза dd на запись
- после чего прогнать smart test short и затем long
посмотреть результат, посмотреть значение reallocation secorts
- попробовать dd на чтение

Сделать вывод: на свалку или в нотебук

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Подскажите, диску конец?, Пантелеев, 19-Сен-17, 10:52  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру