in

Как читать ошибки SMART у HDD? Проверка ключевых параметров жесткого диска

В предыдущей части мы использовали программы для базовой диагностики жесткого диска, которые показали нам ключевые параметры системы Смарт (S.M.A.R.T. — технология самоконтроля, анализа и отчётности). Настало время разобраться, как пользоваться этими данными и как улучшить здоровье нашего HDD

Как понять, что вашему HDD срочно нужен «доктор»? Даже, если вы никогда не слышали про SMART, шпиндель, SATA и другие страшные вещи, то Windows может сама давать недвусмысленные намеки на то, что с вашем жестким диском что-то не так.

1. Если при загрузке компьютера появляется синий экран и заново перезагрузка. Часто это говорит о сбойных секторах на жестком диске (тут, конечно, нужно смотреть ошибку BSOD — там дается расшифровка его появления), в частности, boot-секторов, отвечающих за корректную загрузку операционной системы

2. При запуске системы постоянно запускается утилита chkdsk

3. Частые зависания при процедуре чтения и/или копирования файлов. Если в процессе перемещения или копирования большого файла таймер оставшегося времени часто стал уходить в бесконечность и больше не возвращается — это тревожный звоночек.

4. Вы никогда не делали и понятия не имеете, что такое дефрагментация

Обозначение полей в таблице SMART

Итак, мы уже определили — нам нужно использовать SMART. Как это сделать — мы описали в прошлой части. Теперь детально рассмотрим каждый параметр, на который стоит обратить внимание. Для примера мы возьмем наш жесткий диск компании Western Digitak — модель WD3200BPVT-55JJ5T1 (WD-WX61E82M9996). Срок службы 5 лет.

Кликните, чтобы увеличить изображение

Значение (Value или Current) — текущее значение данного атрибута. Единиц измерений этого нет — некое абстрактное значение, которым пользуется система. Может изменятся в процессе работы HDD. По умолчанию имеет значение 100 или 200 (т.е. это не действительное текущее значение параметра, а выставленное системой). Имеется много споров, действительно ли SMART корректно выставляет параметр «Значение» (Value). Многие склоняются, что точнее и правильней использовать метрику «Данные» (RAW).

В любом случае, «Значение» (Value) нужно сравнивать с «Порогом» (Threshold) — здесь есть нюансы, но в основном, чем ниже Value, тем хуже работает жесткий диск — оно не должно опускаться до порога или сравняться с ним

Наихудшее (Worst) — Самое худшее значение, до которого опускался параметр «Значение» (Value).

Порог (Threshold)  — Порог, ниже которого параметр «Значение» Value ни в коем случае не должен опускаться. Threshold — постоянный параметр, который установил производитель жесткого диска. Если это случилось, тогда у диска имеются серьезные проблемы со здоровьем. Однако тут есть один нюанс

Многие SMART-программы показывают, что с вашим диском всё в порядке, ориентируясь на параметры «Значение» и «Порог». Да, действительно, диагностика показывает, что значение не приблизилось к порогу, мол, всё окей. Но они не учитывают параметр Данные (RAW), о котором пойдет речь ниже. Зачастую, именно RAW показывает верные значения, а значит ваш диск может быть в опасности!

Данные (RAW или Data, «Сырое значение») — Наиболее точный показатель с тем, что творится с вашим жестким диском. Это уже не абстрактный параметр, как «Значение» (Value), а вполне реальный показатель. Хотя есть мнение, что именно «Данные» (RAW) влияет на показатель Значения, но иногда эти два типа данных сильно расходятся друг с другом. Иногда программы SMART показывают его в десятичной системе измерения — перевести можно с помощью калькулятора (из HEC в DEC). Например, тут — https://lin.in.ua/tools/numconv.html

Частота появления ошибок при чтении с диска

Raw Read Error Rate

Частота ошибок при операции чтения с жесткого диска. Большое количество ошибок (меньшее значение атрибута) говорит о том, что с аппаратной частью диска не всё в порядке.Чем меньше параметр, тем хуже

Данный атрибут — главный показатель здоровья именно механики жесткого диска. Любое замедление блока магнитных головок может вылиться в ошибки чтения, так же как и падения, удары, перегрев и другие физические воздействия на диск. Тут важно понимать, что появление этих ошибок уже означает отрицательную динамику — их будет только больше. Остается только надеяться, что это не произойдет так быстро.

Главный нюанс атрибута Raw Read Error Rate в том, что именно параметр Данные «RAW» показывает реальное количество ошибок, а не параметр «Значение». Поэтому, даже если SMART-программы вам говорят о том, что всё в порядке, обратите внимание на «Данные». В нашем случае, Value=200, а RAW=1380, т.е. реальное количество ошибок чтения у нас 1380!

Однако и тут есть некоторые особенности. Часто винчестеры фирмы Seagate и Samsung в поле RAW показывают умопомрачительные значения под десятки тысяч или миллионов — понятно, что это неверная информация от SMART-программы — ваш диск при таком количестве ошибок был бы уже труп. ИТОГ: В данном атрибуте надо смотреть на RAW — он показывает реальные данные. Но если этот показатель показывает миллионные значения — то лучше ориентироваться на показатель «Значение» (Value)

Время раскрутки

Pin Up Time

Атрибут показывает время за которое диск (шпендель) разогнался из полного покоя до своей рабочего состояния, до «паспортной» скорости, которую зашил производитель на заводе — оно отображено Значение «Порог» (Threshold). Соответственно «Значение»(Value) содержит текущий показатель, конкретный для этой модели и этого производителя. До порогового значения он опускаться не должен. Чем меньше параметр, тем хуже

Данный атрибут некоторыми SMART-программами выделен как критичный, хотя его критичность, на самом деле, спорна. В целом, на этот показатель можно не обращать внимание, т.к. он говорит, скорей, не о здоровье конкретно жесткого диска, а наличие проблем с его питанием — недостаточное напряжение в блоке питания.

Кол-во переназначенных секторов.

Reallocated Sector Count

Счетчик показывает общее количество так называемых «переназначенных» секторов. Сбойный сектор на диске — это очень плохо, поэтому HDD использует специальную резервную область, куда отныне жесткий диск будет обращаться за данными, вместо этого сбойного сектора. Чем меньше параметр, тем хуже!

Наверное, самый главный показатель здоровья жесткого диска. Если этот атрибут, SMART отмечает как проблемный («Значение» (Value) приближается к «Порогу» (Threshold)) — существуют серьезные проблемы с износом одной из головок или поверхностью жесткого диска. Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому максимального значения у него нет

При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности – G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап, ремапинг) либо переназначение, а используемый вместо повреждённого сектор – переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении за данными к этому сектору (с этим номером) запрос будет перенаправляться в резервную область. А она — не бесконечная.

В данном атрибуте смотрим лучше обращать внимание на «Данные» (RAW), а не на «Значение» (Value). Т.к. VALUE может стоять 200 или 100 (по умолчанию системы, но это не значит, что у вас уже 200 ошибок). Именно поле RAW показывает реальное общее количество переназначенных секторов.Самый идеальный вариант в данном случае — ноль в поле «RAW». Даже единица в этом поле говорит о начавшихся проблемах.

Проблема кроется в том, что данный атрибут показывает число уже переназначенных секторов, т.е. исправить это уже нельзя (даже низкоуровневым формтированием). Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому любое значение отличное от ноля — уже плохо. Это значит что уже есть отрицательная для здоровья HDD динамика.

Ошибки позиционирования

Seek Error Rate

Жесткий диск постоянно находится в движении — его головки скользят по поверхности в поисках данных. Иногда этот процесс сбоит и блок магнитных головок оказывается не в том месте — это ошибка позиционирования. При их наличии имеются повреждения сервометок, возможны проблемы с охлаждением и механической частью (шпендель)

Жесткий диск контролирует правильность установки головок на требуемую дорожку поверхности для считывания данных. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. Для данного накопителя причиной большого числа ошибок явился перегрев. Как и в случае с Raw Read Error Rate, «Значение» не должно опуститься ниже «Порога». А в столбец «Данные» (RAW) должен, в идеале, ноль.

Текущее количество нестабильных секторов.

Current Pending Sector Count (C5)

Предвестник больших проблем. Данный атрибут показывает количество секторов, которые диск не смог прочитать с первого раза. Операция будет проведена еще раз при повторном обращении к этому сектору. Если он не прочитается и второй раз, то он улетит в переназначенные сектора (Reallocated Sector Count)

Непрочитанный второй раз сектор будет переназначен в резервную область (как мы уже знаем, это называется ремап). Если всё-таки сектор будет прочтен, то он будет помечен, как стабильный и атрибут улучшиться. Ошибки в этом параметре могут быть вызваны банальным выключением ПК из сети или севшим ноутбуком — в общем, некорректным заверением работы Windows.

Как спасти HDD? Что может улучшить его здоровье?

О продлении жизни жесткого диска вы можете прочитать у нас на сайте (материал готовится к публикации)

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *