Урок #6. Атрибуты S.M.A.R.T.

Итак, атрибутов в S.M.A.R.T. любого жесткого диска достаточно много, но действительно полезных всего лишь несколько штук. И начну я, пожалуй, с атрибутов, характеризующих состояние поверхности диска.

Первый из них имеет ID 005 и называется Reallocated Sector Count. Этот атрибут показывает количество секторов, которые были переназначены в резервную область и я думаю, что это один из важнейших атрибутов, ради которого я чаще всего и изучаю S.M.A.R.T. проблемного жесткого диска.

В одном из предыдущих видео я уже затрагивал тему резервной области и сейчас расскажу об этом более подробно.

Дело в том, что производители закладывают некоторую резервную область, которая по умолчанию никак не отражается на объеме жесткого диска. В случае если жесткий диск при самотестировании обнаруживает сектор, доступ к которому получить не удается, то он его считает поврежденным и помечает его как нечитаемый. Далее вместо этого сектора используется сектор из резервной области жесткого диска. Происходит переназначение, так как каждый сектор на диске имеет свой номер и теперь при обращении к поврежденному сектору запрос будет перенаправляться к сектору из резервной области. Такой процесс переназначения называется «ремап» (от англ. remap) и этот термин широко используется в программах диагностики жестких дисков.

Как вы понимаете, если сектор вышел из строя, то объем жесткого диска уменьшится на размер сектора, но так как по сути сектор подменяется и используемая замена берется из резервной области, то на видимом объеме жесткого диска эта проблема никак не отражается.

Тут нужно понимать, что резервная область не бесконечна и если проблемные сектора возникают регулярно, то такой диск нужно заменить, так как процесс этот необратимый и остановить его скорее всего не получится.

Но при каких значениях данного атрибута стоит задуматься о замене жесткого диска?

Не думаю, что тут можно четко указать какое-то значение. В идеале нужно, чтобы таких секторов не было вообще. Если же они у вас есть, то еще рано паниковать. Регулярно следите за динамикой их появления. Если значение атрибута не изменяется, то возможно не все так плохо. Если же бэд-сектора продолжают появляться и текущее значение атрибута уменьшается, то самое время задуматься о переносе важной информации на другой носитель и поискать гарантийный талон от жесткого диска. Если гарантия еще действует, то я бы в этом случае поменял диск.

Еще один важный нюанс, который вызывает путаницу у многих пользователей — это то, как этот атрибут отображается. Например, если значение Value атрибута равно 100 и значение Worst равно 100, то это не означает, что на диске уже появилось сто битых секторов. Здесь ситуация противоположная — значение Value указывает на ДОСТУПНЫЙ объем резервных секторов! Причем не стоит забывать, что значения Value, Worst и Threshold — это некоторые условные единицы, а отнюдь не штуки.

smart жесткого диска

Я предполагаю, что в данном случае речь идет о процентах. То есть у полностью исправного жесткого диска доступно 100% секторов в резервной области. Если возникают проблемы и обнаруживаются битые сектора, которые подвергаются ремапингу, то есть переназначению из резервной области, то значение Value станет уменьшаться в процентном соотношении, в зависимости от количества использованных секторов резервной области. Еще раз хочу подчеркнуть, что это мое предположение и мне не удалось найти его подтверждение, но у всех исправных жестких дисков, с которыми мне приходилось иметь дело, значение Value данного атрибута было равно 100. К тому же в поле RAW указывается реальное количество операций переназначения и мне доводилось видеть, что у разных дисков при одинаковом значении Value значения RAW отличались.

Как я сказал в прошлом видео, многие программы выводят значения в поле Raw в шестнадцатиричном формате, но все же есть программы, которые показывают это значение в более для нас привычной десятичной системе счисления. В любом случае данное значение легко перевести в десятичный формат, воспользовавшись инженерным калькулятором. В идеале значение Raw данного атрибута должно быть равно нулю, а ноль он и в шестнадцатиричной системе ноль:)

Итак, подводим итог вышесказанному — большое значение Value данного атрибута должно радовать, а не вызывать тревогу.

Следующий атрибут, о котором я хочу рассказать, имеет ID 197 и называется Current Pending Error Count. Он также имеет отношение к проблемным секторам и указывает на количество секторов, которые жесткий диск зачислил в кандидаты на переназначение в резервную область. То есть эти сектора еще не были определены как «бэд», но при обращении к ним возникли какие-то проблемы, поэтому жесткий диск поместил номер такого сектора в список подозрительных секторов. Если в дальнейшем при обращении к этому сектору проблем не возникнет, то он будет исключен из списка. Если же ошибка повторится, то сектор будет переназначен из резервной области. Увеличение количества ошибок свидетельствует о проблемах. Здесь ситуация со значением атрибута аналогична предыдущему и по мере возникновения ошибок значение атрибута Value будет уменьшаться.

Следующий атрибут с ID 198 (Uncorrectable Error Count) по сути показывает то же самое что и атрибут с ID 197, то есть указывает на сектора, с чтением которых возникли проблемы. Просто в данном случае тестирование производится по другой схеме, но понимать данный атрибут нужно также как и предыдущие.

Как понятно, в идеале значение Raw атрибутов 005, 197 и 198 должно быть равно нулю. Отличие значения Raw от нуля, говорит о появлении некоторых проблем. Насколько проблемы серьезные можно судить по динамике возникновения ошибок, то есть необходимо регулярно следить за ситуацией — мониторить ее.

Теперь расскажу об атрибутах, которые также могут указывать на проблемы с диском, но не у всех дисков они могут быть.

Во-первых, это атрибут с ID 184 (End-to-End Error). Он показывает количество ошибок, которые возникли при передаче данных через кэш жесткого диска. У жестких дисков есть кэш, то есть своеобразная оперативная память, которая используется для ускорения передачи данных. Если в поле Raw этого атрибута не нулевое значение, значит есть проблемы.

Следующий атрибут ID 188 (Command Timeout) показывает количество неуспешных операций обращения к диску. Эти операции были прерваны из-за превышения максимально допустимого времени отклика (тайм-аута). Подобные проблемы обычно связаны с плохим питанием или плохим качеством кабелей для передачи данных. Подобные ошибки могут приводить к появлению синего экрана смерти в Windows и значение этого атрибута должно быть равно нулю.

Атрибут с ID 200 (Write Error Rate / MultiZone Error Rate) показывает общее количество ошибок, возникающих при записи информации в сектор. Ненулевое значение этого атрибута свидетельствует о проблемах с поверхностью или механикой жесткого диска.

Ну и последний атрибут с ID 194 (HDA Temperature0, показывает температуру жесткого диска. Показания берутся со встроенного внутри диска датчика, который может находится у разных моделей в разных местах, например, на магнитных головках. Часто в отдельных строчках выводится минимальная и максимальная температуры, зафиксированные за все время работы диска. Эта информация будет полезна для анализа в каких условиях работает ваш жесткий диск. Общая рекомендация — не допускать работу жесткого диска при температуре выше 50 градусов.

Есть и множество других атрибутов, которые либо не несут в себе информацию о здоровье жесткого диска, либо трактовать эту информацию нужно с учетом других атрибутов или внешних факторов, что в свою очередь требует специальных знаний.

Итак, подытожим — что же нам дает S.M.A.R.T.?

Используя информацию S.M.A.R.T. можно бегло оценить состояние жесткого диска без серьезной диагностики, которая может занять не один час. Это, пожалуй, единственный плюс данной технологии.

Стоит помнить о том, что даже отличное состояние всех S.M.A.R.T.-атрибутов НЕ МОЖЕТ гарантировать безотказную работу диска в будущем. Технология работает в режиме реального времени и отражает ТЕКУЩЕЕ состояние жесткого диска.

Используя информацию S.M.A.R.T. далеко не всегда можно выяснить причину возникших с жестким диском проблем. То есть диск может быть явно не в порядке, а атрибуты S.M.A.R.T. будут в идеальном состоянии.

Поэтому можно сформулировать небольшое правило — отличное состояние атрибутов S.M.A.R.T. не может гарантировать полную исправность диска, но ухудшение атрибутов может свидетельствовать о грядущих проблемах.

Ну и в заключении приведу два случая из моей практики, в которых технология S.M.A.R.T. помогла мне решить проблемы.

Первый случай

Я приобрел внешний жесткий диск объемом 2Тб и перед переносом на него своей информации я решил его отформатировать. Полное форматирование диска такого объема занимает приличное время, но прошло несколько часов, а процесс форматирования застыл на 25%. Я не стал прерывать процесс и оставил компьютер включенным на всю ночь, но и утром ничего не изменилось. После перезагрузки я запустил утилиту HDDScan и сразу же выяснилось, что диск имеет кучу проблем и самое главное — закончилась резервная область — атрибут 005. Я в этот же день без проблем поменял диск по гарантии и сразу же запустил SMART для контроля состояния нового диска. Поэтому рекомендую сразу же проверить новый жесткий диск, а также не мешает провести полное его форматирование перед переносом на него своих данных.

Второй случай

Ко мне обратился друг с просьбой решить проблему с ноутбуком, так как мощный компьютер (DELL Alienware) очень сильно тормозил, надолго подвисал и периодически вываливался в синий экран смерти. Я просидел с этим ноутбуком три дня, ища проблему в видеокарте (их на ноутбуке было две и при установке драйверов на одну из них сразу же появлялись проблемы), но уже отчаявшись найти причину я запустил HDDScan и обнаружил целый букет проблем с жестким диском, а точнее с двумя, так как в этой модели ноутбука по умолчанию было установлено два жестких диска. Оба жестких диска этого ноутбука исчерпали ресурс резервной области, имели проблемы с передачей информации через кэш, ранее работали при критических температурах, что вполне могло явиться причиной проблем с позиционированием блока головок. Все это я узнал из показаний S.M.A.R.T. Замена жесткого диска сразу же решила проблему с внезапным зависанием компьютера, но проблему с видеокартой все же пришлось решать отдельно.

В общем, для предварительной оценки состояния жесткого диска технология S.M.A.R.T. подходит идеально и ей следует пользоваться.

Ну а программа HDDScan обладает и другими достаточно богатыми возможностями в плане диагностики жесткого диска и мы с ней продолжим разбираться в следующем видео.