Проблема с диском или это просто ложная тревога?

Добрый день всем. <br/> Я получил уведомление на почту openmediavault, в котором говорится о следующей проблеме: <br/> В системе обнаружена ошибка SMART (OfflineUncorrectableSector) на хосте: <br/> "Следующее предупреждение/ошибка было зарегистрировано демоном smartd: <br/> Устройство: /dev/disk/by-id/ata-WDC_WD60EJRX-89MP9Y1_WD-WX32D80N48HS [SAT], 6 Offline uncorrectable sectors <br/> Информация об устройстве: <br/> WDC WD60EJRX-89MP9Y1, S/N:WD-WX32D80N48HS, WWN:5-0014ee-2bf671bd7, FW:80.00A80, 6.00 TB <br/> Для получения дополнительных сведений смотрите SYSLOG хоста. <br/> Также вы можете использовать утилиту smartctl для дальнейшего исследования. <br/> <br/> В веб-интерфейсе omv нет ошибок, статус диска GOOD, и здесь представлена <a href="https://pastebin.com/uEBERrJm" rel="nofollow">расширенная информация</a>. <br/> <br/> Поделитесь, пожалуйста, вашим мнением: находится ли диск в опасности? Я планирую его заменить, но в данный момент не имею возможности добраться до хранилища.
  • 31 октября 2024 г. 10:23
Ответы на вопрос 2
Здравствуйте!

Сообщение о том, что на диске обнаружены "Offline Uncorrectable Sectors", является серьезным сигналом. Это означает, что некоторые сектора на жестком диске повреждены и данные в них не могут быть восстановлены без дополнительного вмешательства. Даже если веб-интерфейс OpenMediaVault показывает, что статус диска "GOOD", наличие таких ошибок в сообщении SMART говорит о том, что диск, вероятно, находится в состоянии деградации.

Вот несколько шагов, которые вы можете предпринять:

1. **Резервное копирование данных**: Если у вас еще нет резервной копии данных, обязательно создайте ее как можно скорее. Это защитит вас в случае, если диск начнет выходить из строя.

2. **Мониторинг состояния диска**: Используйте утилиту `smartctl`, чтобы получить больше информации о состоянии диска. Например, команда `smartctl -a /dev/sdX` (где `/dev/sdX` - это ваш диск) предоставит более полную информацию о состоянии и ошибках.

3. **Проверка на наличие других ошибок**: Проверьте отсутствие других предупреждений или ошибок, которые могут указывать на проблемы с диском.

4. **Замена диска**: Поскольку вы уже планируете заменить диск, рекомендуется сделать это при первой возможности. Чем быстрее вы его замените, тем меньше вероятность потери данных.

5. **Тестирование диска**: Если вы хотите, вы можете попробовать запустить тест на поверхности диска с помощью команды `smartctl -t long /dev/sdX`, чтобы увидеть, есть ли другие ошибочные сектора. Но будьте осторожны: тест может занять много времени и не защитит вас от потери данных.

В заключение, лучше всего подготовиться к замене диска как можно скорее, чтобы минимизировать риски потери данных. Диск имеет проблемы, и чем дольше вы его используете в таком состоянии, тем выше вероятность критического сбоя.
Offline_Uncorrectable могут возникать, например, при аварийном отключении питания, когда диск не успевает полностью записать секторы из кэша. Но могут и при реальном повреждении диска. Эти секторы, как и Current_Pending_Sectors, могут быть убраны из ошибок, если повторная запись в них будет успешной. Если же запись не удастся и второй раз, то будет попытка ремапа секторов в резервную зону (Reallocated_Event_Count) и, при удачном ремапе сектор отметится в Reallocated_Sector_Ct. 
Так что пока стоит просто проследить за поведением диска. Если счётчики расти не будут, то можно оставить всё как есть.
Похожие вопросы