Ежедневные архивы: 3 июля 2019

smartctl — важное

root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada1 | grep -i temperature
190 Airflow_Temperature_Cel 0x0022   066   060   040    Old_age   Always       -       34 (Min/Max 28/39)
194 Temperature_Celsius     0x0022   034   040   000    Old_age   Always       -       34 (0 22 0 0 0)
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada0 | grep -i temperature
190 Airflow_Temperature_Cel 0x0022   066   060   040    Old_age   Always       -       34 (Min/Max 27/39)
194 Temperature_Celsius     0x0022   034   040   000    Old_age   Always       -       34 (0 21 0 0 0)
root@mx2/usr/local/etc/rc.d>
root@mx2/usr/local/etc/rc.d>
root@mx2/usr/local/etc/rc.d>
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada0 | grep -i Realloc
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada1 | grep -i Realloc
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
root@mx2/usr/local/etc/rc.d>
root@mx2/usr/local/etc/rc.d>
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada1 | grep -i Pending
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada0 | grep -i Pending
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada0 | grep -i Uncorrectable
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
root@mx2/usr/local/etc/rc.d> smartctl -A /dev/ada1 | grep -i Uncorrectable
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
root@mx2/usr/local/etc/rc.d>

Reallocated Sector Count — число переназначенных секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным», и переносит данные в резервную область. Если значение равно более 10, то это как минимум значит что пора проверять всю поверхность диска. Если количество переназначенных секторов увеличится через неделю-две, значит надо менять диск.

Current Pending Sector — число секторов, являющихся кандидатами на замену. Они ещё не определены как плохие, но считывание с них отличается нестабильностью, это так называемые подозрительные сектора.

Offline Uncorrectable Sector Count — количество не скорректированных ошибок, то есть серьёзных повреждений поверхности диска. Такие ошибки появляются, когда заканчивается место в резервной зоне диска для переназначения секторов. Так же могут появляться при резком отключении питания в момент когда диск записывает данные — это так называемые «программные бэд блоки». Если их количество невелико, а остальные параметры касающиеся поверхности диска в норме, то беспокоиться не стоит. Если же их много, и их количество растёт, то искать замену диску и спасать данные надо.

Как показывает наш опыт в случае если значения Uncorrectable Sector Count, Current Pending Sector Count, UDMA_CRC_Error_Count больше нуля, то жесткий диск требует срочной замены.

Отличная инструкция как настроить smartmontools