Современный жёсткий диск — уникальный компонент компьютера. Он уникален тем, что хранит в себе служебную информацию, изучая которую, можно оценить «здоровье» диска. Эта информация содержит в себе историю изменения множества параметров, отслеживаемых винчестером в процессе функционирования. Больше ни один компонент системного блока не предоставляет владельцу статистику своей работы! Вкупе с тем, что HDD является одним из самых ненадёжных компонентов компьютера, такая статистика может быть весьма полезной и помочь его владельцу избежать нервотрёпки и потери денег и времени.
Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. (Self-Monitoring, Analisys and Reporting Technology, т. е. технология самомониторинга, анализа и отчёта). Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.
Отмечу, что нижесказанное относится к дискам с интерфейсами SATA и РАТА. У дисков SAS, SCSI и других серверных дисков тоже есть S.M.A.R.T., но его представление сильно отличается от SATA/PATA. Да и мониторит серверные диски обычно не человек, а RAID-контроллер, потому про них мы говорить не будем.
Итак, если мы откроем S.M.A.R.T. в какой-либо из многочисленных программ, то увидим приблизительно следующую картину (на скриншоте приведён S.M.A.R.T. диска Hitachi Deskstar 7К1000.С HDS721010CLA332 в HDDScan 3.3):
S.M.A.R.T. в HDDScan 3.3
В каждой строке отображается отдельный атрибут S.M.A.R.T. Атрибуты имеют более-менее стандартизованные названия и определённый номер, которые не зависят от модели и производителя диска.
Каждый атрибут S.M.A.R.T. имеет несколько полей. Каждое поле относится к определённому классу из следующих: ID, Value, Worst, Threshold и RAW. Рассмотрим каждый из классов.
- ID (может также именоваться Number) — идентификатор, номер атрибута в технологии S.M.A.R.T. Название одного и того же атрибута программами может выдаваться по-разному, а вот идентификатор всегда однозначно определяет атрибут. Особенно это полезно в случае программ, которые переводят общепринятое название атрибута с английского языка на русский. Иногда получается такая белиберда, что понять, что же это за параметр, можно только по его идентификатору.
- Value (Current) — текущее значение атрибута в попугаях (т. е. в величинах неизвестной размерности). В процессе работы винчестера оно может уменьшаться, увеличиваться и оставаться неизменным. По показателю Value нельзя судить о «здоровье» атрибута, не сравнивая его со значением Threshold этого же атрибута. Как правило, чем меньше Value, тем хуже состояние атрибута (изначально все классы значений, кроме RAW, на новом диске имеют максимальное из возможных значение, например 100).
- Worst — наихудшее значение, которого достигало значение Value за всю жизнь винчестера. Измеряется тоже в «попугаях». В процессе работы оно может уменьшаться либо оставаться неизменным. По нему тоже нельзя однозначно судить о здоровье атрибута, нужно сравнивать его с Threshold.
- Threshold — значение в «попугаях», которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие S.M.A.R.T., выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии (для самих гарантийщиков, конечно же) — кто же яснее скажет о здоровье диска, как не он сам, демонстрируя текущее значение атрибута хуже критического порога? Т. е. при значении Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Очевидно, что при Threshold=0 состояние атрибута не будет признано критическим никогда. Threshold — постоянный параметр, зашитый производителем в диске.
- RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не «попугаи», а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.
Этим мы сейчас и займёмся — разберём все наиболее используемые атрибуты S.M.A.R.T., посмотрим, о чём они говорят и что нужно делать, если они не в порядке.
Аттрибуты S.M.A.R.T. | |||||||||||||||||
01 | 02 | 03 | 04 | 05 | 07 | 08 | 09 | 10 | 11 | 12 | 183 | 184 | 187 | 188 | 189 | 190 | |
0x | 01 | 02 | 03 | 04 | 05 | 07 | 08 | 09 | 0A | 0B | 0C | B7 | B8 | BB | BC | BD | BE |
191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 220 | 240 | 254 | ||
0x | BF | С0 | С1 | С2 | С3 | С4 | С5 | С6 | С7 | С8 | С9 | СА | CB | DC | F0 | FE |
Перед тем как описывать атрибуты и допустимые значения их поля RAW, уточню, что атрибуты могут иметь поле RAW разного типа: текущее и накапливающее. Текущее поле содержит значение атрибута в настоящий момент, для него свойственно периодическое изменение (для одних атрибутов — изредка, для других — много раз за секунду; другое дело, что в программах чтения S.M.A.R.T. такое быстрое изменение не отображается). Накапливающее поле — содержит статистику, обычно в нём содержится количество возникновений конкретного события со времени первого запуска диска.
Текущий тип характерен для атрибутов, для которых нет смысла суммировать их предыдущие показания. Например, показатель температуры диска является текущим: его цель — в демонстрации температуры в настоящий момент, а не суммы всех предыдущих температур. Накапливающий тип свойственен атрибутам, для которых весь их смысл заключается в предоставлении информации за весь период «жизни» винчестера. Например, атрибут, характеризующий время работы диска, является накапливающим, т. е. содержит количество единиц времени, отработанных накопителем за всю его историю.
Приступим к рассмотрению атрибутов и их RAW-полей.
Атрибут: 01 Raw Read Error Rate
Тип | текущий, может быть накапливающим для WD и старых Hitachi |
Описание | содержит частоту возникновения ошибок при чтении с пластин |
Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.
Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.
Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.
Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.
Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).
На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.
Атрибут: 02 Throughput Performance
Тип | текущий |
Описание | содержит значение средней производительности диска и измеряется в каких-то «попугаях». Обычно его ненулевое значение отмечается на винчестерах Hitachi. На них он может изменяться после изменения параметров ААМ, а может и сам по себе по неизвестному алгоритму |
Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 03 Spin-Up Time
Тип | текущий |
Описание | содержит время, за которое шпиндель диска в последний раз разогнался из состояния покоя до номинальной скорости. Может содержать два значения — последнее и, например, минимальное время раскрутки. Может измеряться в миллисекундах, десятках миллисекунд и т. п. — это зависит от производителя и модели диска |
Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.
Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.
Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.
Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)
Тип | накапливающий |
Описание | содержит количество раз включения диска. Бывает ненулевым на только что купленном диске, находившемся в запаянной упаковке, что может говорить о тестировании диска на заводе. Или ещё о чём-то, мне не известном |
При оценке здоровья не обращайте на атрибут внимания.
Атрибут: 05 Reallocated Sector Count
Тип | накапливающий |
Описание | содержит количество секторов, переназначенных винчестером в резервную область. Практически ключевой параметр в оценке состояния |
Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение, а используемый вместо повреждённого сектор — переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.
Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.
Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.
На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет
Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?
Атрибут: 07 Seek Error Rate
Тип | текущий |
Описание | содержит частоту возникновения ошибок при позиционировании блока магнитных головок (БМГ) |
Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.
Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.
Атрибут: 08 Seek Time Performance
Тип | текущий |
Описание | содержит среднюю производительность операций позиционирования головок, измеряется в «попугаях». Как и параметр 02 Throughput Performance, ненулевое значение обычно отмечается на дисках Hitachi и может изменяться после изменения параметров ААМ, а может и само по себе по неизвестному алгоритму |
Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 09 Power On Hours Count (Power-on Time)
Тип | накапливающий |
Описание | содержит количество часов, в течение которых винчестер был включён |
Ничего не говорит о здоровье диска.
Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count
Тип | накапливающий |
Описание | содержит количество повторов запуска шпинделя, если первая попытка оказалась неудачной |
О здоровье диска чаще всего не говорит.
Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.
В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.
Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь.
Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)
Тип | накапливающий |
Описание | содержит количество повторных попыток сброса накопителя (установки БМГ на нулевую дорожку) при неудачной первой попытке |
Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.
Атрибут: 12 (0C) Power Cycle Count
Тип | накапливающий |
Описание | содержит количество полных циклов «включение-отключение» диска |
Не связан с состоянием диска.
Атрибут: 183 (B7) SATA Downshift Error Count
Тип | накапливающий |
Описание | содержит количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута |
Не говорит о здоровье накопителя.
Атрибут: 184 (B8) End-to-End Error
Тип | накапливающий |
Описание | содержит количество ошибок, возникших при передаче данных через кэш винчестера |
Ненулевое значение указывает на проблемы с диском.
Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)
Тип | накапливающий |
Описание | содержит количество секторов, которые были признаны кандидатами на переназначение (см. атрибут 197) за всю историю жизни диска. Причём если сектор становится кандидатом повторно, значение атрибута тоже увеличивается |
Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).
Атрибут: 188 (BC) Command Timeout
Тип | накапливающий |
Описание | содержит количество операций, выполнение которых было отменено из-за превышения максимально допустимого времени ожидания отклика |
Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т. д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате (либо дискретным). Из-за ошибок такого рода возможны BSOD в Windows.
Ненулевое значение атрибута говорит о потенциальной «болезни» диска.
Атрибут: 189 (BD) High Fly Writes
Тип | накапливающий |
Описание | содержит количество зафиксированных случаев записи при высоте полета головки выше рассчитанной — скорее всего, из-за внешних воздействий, например вибрации |
Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.
Атрибут: 190 (BE) Airflow Temperature
Тип | текущий |
Описание | содержит температуру винчестера для дисков Hitachi, Samsung, WD и значение «100 − [RAW-значение атрибута 194]» для Seagate |
Не говорит о состоянии диска.
Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)
Тип | накапливающий |
Описание | содержит количество критических ускорений, зафиксированных электроникой диска, которым подвергался накопитель и которые превышали допустимые. Обычно это происходит при ударах, падениях и т. п. |
Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.
Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.
Не говорит о здоровье диска.
Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)
Тип | накапливающий |
Описание | для разных винчестеров может содержать одну из следующих двух характеристик: либо суммарное количество парковок БМГ диска в аварийных ситуациях (по сигналу от вибродатчика, обрыву/понижению питания и т. п.), либо суммарное количество циклов включения/выключения питания диска (характерно для современных WD и Hitachi) |
Не позволяет судить о состоянии диска.
Атрибут: 193 (С1) Load/Unload Cycle Count
Тип | накапливающий |
Описание | содержит количество полных циклов парковки/распарковки БМГ. Анализ этого атрибута — один из способов определить, включена ли на диске функция автоматической парковки (столь любимая, например, компанией Western Digital): если его содержимое превосходит (обычно — многократно) содержимое атрибута 09 — счётчик отработанных часов, — то парковка включена |
Не говорит о здоровье диска.
Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)
Тип | текущий/накапливающий |
Описание | содержит текущую температуру диска. Температура считывается с датчика, который на разных моделях может располагаться в разных местах. Поле вместе с текущей также может содержать максимальную и минимальную температуры, зафиксированные за всё время эксплуатации винчестера |
О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.
Атрибут: 195 (С3) Hardware ECC Recovered
Тип | накапливающий |
Описание | содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска |
Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.
Атрибут: 196 (С4) Reallocated Event Count
Тип | накапливающий |
Описание | содержит количество операций переназначения секторов |
Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.
Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.
Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.
Атрибут: 197 (С5) Current Pending Sector Count
Тип | текущий |
Описание | содержит количество секторов-кандидатов на переназначение в резервную область |
Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.
При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.
Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.
Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).
При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.
Идёт последовательное чтение с ремапом в Victoria 4.46b
В случае неудачи чтения как с remap, так и с Advanced remap, стоит попробовать запустить последовательную запись в тех же Victoria или MHDD. Учитывайте, что операция записи стирает данные, поэтому перед её применением обязательно делайте бэкап!
Запуск последовательной записи в Victoria 4.46b
Иногда от невыполнения ремапа могут помочь следующие манипуляции: снимите плату электроники диска и почистите контакты гермоблока винчестера, соединяющие его с платой — они могут быть окислены. Будь аккуратны при выполнении этой процедуры — из-за неё можно лишиться гарантии!
Невозможность ремапа может быть обусловлена ещё одной причиной — диск исчерпал резервную область, и ему просто некуда переназначать секторы.
Если же значение атрибута 197 никакими манипуляциями не снижается до 0, следует думать о замене диска.
Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
Тип | текущий |
Описание | означает то же самое, что и атрибут 197, но отличие в том, что данный атрибут содержит количество секторов-кандидатов, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой |
Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197.
Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).
Атрибут: 199 (С7) UltraDMA CRC Error Count
Тип | накапливающий |
Описание | содержит количество ошибок, возникших при передаче по интерфейсному кабелю в режиме UltraDMA (или его эмуляции винчестерами SATA) от материнской платы или дискретного контроллера контроллеру диска |
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.
Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).
В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.
Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.
Можно считать, что о здоровье диска атрибут не говорит.
Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)
Тип | текущий |
Описание | содержит частоту возникновения ошибок при записи |
Ненулевое значение говорит о проблемах с диском — в частности, у дисков WD большие цифры могут означать «умирающие» головки.
Атрибут: 201 (С9) Soft Read Error Rate
Тип | текущий |
Описание | содержит частоту возникновения ошибок чтения, произошедших по вине программного обеспечения |
Влияние на здоровье неизвестно.
Атрибут: 202 (СА) Data Address Mark Error
Тип | неизвестно |
Описание | содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо |
Атрибут: 203 (CB) Run Out Cancel
Тип | текущий |
Описание | содержит количество ошибок ECC |
Влияние на здоровье неизвестно.
Атрибут: 220 (DC) Disk Shift
Тип | текущий |
Описание | содержит измеренный в неизвестных единицах сдвиг пластин диска относительно оси шпинделя |
Влияние на здоровье неизвестно.
Атрибут: 240 (F0) Head Flying Hours
Тип | накапливающий |
Описание | содержит время, затраченное на позиционирование БМГ. Счётчик может содержать несколько значений в одном поле |
Влияние на здоровье неизвестно.
Атрибут: 254 (FE) Free Fall Event Count
Тип | накапливающий |
Описание | содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал |
Влияние на здоровье неизвестно.
Подытожим описание атрибутов. Ненулевые значения:
- атрибутов 01, 07, 195 — вызывают подозрения в «болезни» у некоторых моделей дисков;
- атрибутов 10, 11, 188, 196, 199, 202 — вызывают подозрения у всех дисков;
- и, наконец, атрибутов 05, 184, 187, 197, 198, 200 — прямо говорят о неполадках.
При анализе атрибутов учитывайте, что в некоторых параметрах S.M.A.R.T. могут храниться несколько значений этого параметра: например, для предпоследнего запуска диска и для последнего. Такие параметры длиной в несколько байт логически состоят из нескольких значений длиной в меньшее количество байт — например, параметр, хранящий два значения для двух последних запусков, под каждый из которых отводится 2 байта, будет иметь длину 4 байта. Программы, интерпретирующие S.M.A.R.T., часто не знают об этом, и показывают этот параметр как одно число, а не два, что иногда приводит к путанице и волнению владельца диска. Например, «Raw Read Error Rate», хранящий предпоследнее значение «1» и последнее значение «0», будет выглядеть как 65536.
Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.
Продемонстрируем отличия на практике. Вот так выглядит мгновенное значение атрибута 01 на одном из моих Hitachi HDS721010CLA332 в неучитывающей особенности этого атрибута Victoria 4.46b:
Атрибут 01 в Victoria 4.46b
А так выглядит он же в «правильной» HDDScan 3.3:
Атрибут 01 в HDDScan 3.3
Плюсы HDDScan в данном контексте очевидны, не правда ли?
Если анализировать S.M.A.R.T. на разных дисках, то можно заметить, что одни и те же атрибуты могут вести себя по-разному. Например, некоторые параметры S.M.A.R.T. винчестеров Hitachi после определённого периода неактивности диска обнуляются; параметр 01 имеет особенности на дисках Hitachi, Seagate, Samsung и Fujitsu, 03 — на Fujitsu. Также известно, что после перепрошивки диска некоторые параметры могут установиться в 0 (например, 199). Однако подобное принудительное обнуление атрибута ни в коем случае не будет говорить о том, что проблемы с диском решены (если таковые были). Ведь растущий критичный атрибут — это следствие неполадок, а не причина.
При анализе множества массивов данных S.M.A.R.T. становится очевидным, что набор атрибутов у дисков разных производителей и даже у разных моделей одного производителя может отличаться. Связано это с так называемыми специфичными для конкретного вендора (vendor specific) атрибутами (т. е. атрибутами, используемыми для мониторинга своих дисков определённым производителем) и не должно являться поводом для волнения. Если ПО мониторинга умеет читать такие атрибуты (например, Victoria 4.46b), то на дисках, для которых они не предназначены, они могут иметь «страшные» (огромные) значения, и на них просто не нужно обращать внимания. Вот так, например, Victoria 4.46b отображает RAW-значения атрибутов, не предназначенных для мониторинга у Hitachi HDS721010CLA332:
«Страшные» значения в Victoria 4.46b
Нередко встречается проблема, когда программы не могут считать S.M.A.R.T. диска. В случае исправного винчестера это может быть вызвано несколькими факторами. Например, очень часто не отображается S.M.A.R.T. при подключении диска в режиме AHCI. В таких случаях стоит попробовать разные программы, в частности HDD Scan, которая обладает умением работать в таком режиме, хоть у неё и не всегда это получается, либо же стоит временно переключить диск в режим совместимости с IDE, если есть такая возможность. Далее, на многих материнских платах контроллеры, к которым подключаются винчестеры, бывают не встроенными в чипсет или южный мост, а реализованы отдельными микросхемами. В таком случае DOS-версия Victoria, например, не увидит подключённый к контроллеру жёсткий диск, и ей нужно будет принудительно указывать его, нажав клавишу [Р] и введя номер канала с диском. Часто не читаются S.M.A.R.T. у USB-дисков, что объясняется тем, что USB-контроллер просто не пропускает команды для чтения S.M.A.R.T. Практически никогда не читается S.M.A.R.T. у дисков, функционирующих в составе RAID-массива. Здесь тоже есть смысл попробовать разные программы, но в случае аппаратных RAID-контроллеров это бесполезно.
Если после покупки и установки нового винчестера какие-либо программы (HDD Life, Hard Drive Inspector и иже с ними) показывают, что: диску осталось жить 2 часа; его производительность — 27%; здоровье — 19,155% (выберите по вкусу) — то паниковать не стоит. Поймите следующее. Во-первых, нужно смотреть на показатели S.M.A.R.T., а не на непонятно откуда взявшиеся числа здоровья и производительности (впрочем, принцип их подсчёта понятен: берётся наихудший показатель). Во-вторых, любая программа при оценке параметров S.M.A.R.T. смотрит на отклонение значений разных атрибутов от предыдущих показаний. При первых запусках нового диска параметры непостоянны, необходимо некоторое время на их стабилизацию. Программа, оценивающая S.M.A.R.T., видит, что атрибуты изменяются, производит расчёты, у неё получается, что при их изменении такими темпами накопитель скоро выйдет из строя, и она начинает сигнализировать: «Спасайте данные!» Пройдёт некоторое время (до пары месяцев), атрибуты стабилизируются (если с диском действительно всё в порядке), утилита наберёт данных для статистики, и сроки кончины диска по мере стабилизации S.M.A.R.T. будут переноситься всё дальше и дальше в будущее. Оценка программами дисков Seagate и Samsung — вообще отдельный разговор. Из-за особенностей атрибутов 1, 7, 195 программы даже для абсолютно здорового диска обычно выдают заключение, что он завернулся в простыню и ползёт на кладбище.
Обратите внимание, что возможна следующая ситуация: все атрибуты S.M.A.R.T. — в норме, однако на самом деле диск — с проблемами, хоть этого пока ни по чему не заметно. Объясняется это тем, что технология S.M.A.R.T. работает только «по факту», т. е. атрибуты меняются только тогда, когда диск в процессе работы встречает проблемные места. А пока он на них не наткнулся, то и не знает о них и, следовательно, в S.M.A.R.T. ему фиксировать нечего.
Таким образом, S.M.A.R.T. — это полезная технология, но пользоваться ею нужно с умом. Кроме того, даже если S.M.A.R.T. вашего диска идеален, и вы постоянно устраиваете диску проверки — не полагайтесь на то, что ваш диск будет «жить» ещё долгие годы. Винчестерам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние, а бывает и так, что с диском — явные нелады, но в S.M.A.R.T. — всё в порядке. Можно сказать, что хороший S.M.A.R.T. не гарантирует, что с накопителем всё хорошо, но плохой S.M.A.R.T. гарантированно свидетельствует о проблемах. При этом даже с плохим S.M.A.R.T. утилиты могут показывать, что состояние диска — «здоров», из-за того, что критичными атрибутами не достигнуты пороговые значения. Поэтому очень важно анализировать S.M.A.R.T. самому, не полагаясь на «словесную» оценку программ.
Хоть технология S.M.A.R.T. и работает, винчестеры и понятие «надёжность» настолько несовместимы, что принято считать их просто расходным материалом. Ну, как картриджи в принтере. Поэтому во избежание потери ценных данных делайте их периодическое резервное копирование на другой носитель (например, другой винчестер). Оптимально делать две резервные копии на двух разных носителях, не считая винчестера с оригинальными данными. Да, это ведёт к дополнительным затратам, но поверьте: затраты на восстановление информации со сломавшегося HDD обойдутся вам в разы — если не на порядок-другой — дороже. А ведь данные далеко не всегда могут восстановить даже профессионалы. Т. е. единственная возможность обеспечить надёжное хранение ваших данных — это делать их бэкап.
Напоследок упомяну некоторые программы, которые хорошо подходят для анализа S.M.A.R.T. и тестирования винчестеров: HDDScan (работает в Windows, бесплатная), CrystalDiskInfo (Windows, бесплатная), Hard Disk Sentinel (платная для Windows, бесплатная для DOS), HD Tune (Windows, платная, есть бесплатная старая версия).
И наконец, мощнейшие программы для тестирования: Victoria (Windows, DOS, бесплатная), MHDD (DOS, бесплатная).
Содержание
- Как исправить SATA Downshift Error Count or Runtime Bad Block (0xB7)?
- Что делать с «0xB7 SATA Downshift Error Count or Runtime Bad Block»?
- Прекратите использование сбойного HDD
- Восстановите удаленные данные диска
- Просканируйте диск на наличие «битых» секторов
- Снизьте температуру диска
- Произведите дефрагментацию жесткого диска
- Ошибка «SATA Downshift Error Count or Runtime Bad Block» для SSD диска
- Сбросьте ошибку
- Приобретите новый жесткий диск
- Целесообразен ли ремонт HDD?
- Как выбрать новый накопитель?
- Лечение жесткого диска HDD
- #21 Алексей web
Как исправить SATA Downshift Error Count or Runtime Bad Block (0xB7)?
Что делать с «0xB7 SATA Downshift Error Count or Runtime Bad Block»?
При загрузке компьютера или ноутбука возникает S.M.A.R.T. ошибка «0xB7 SATA Downshift Error Count or Runtime Bad Block»?
Что означает «0xB7»: SATA Downshift Error Count or Runtime Bad Block? Допустимые значения атрибута «SATA Downshift Error Count or Runtime Bad Block» отличаются для различных производителей жестких дисков WD (Western Digital), Samsung, Seagate, HGST (Hitachi), Toshiba.
Актуально для ОС: Windows 10, Windows 8.1, Windows Server 2012, Windows 8, Windows Home Server 2011, Windows 7 (Seven), Windows Small Business Server, Windows Server 2008, Windows Home Server, Windows Vista, Windows XP, Windows 2000, Windows NT.
Прекратите использование сбойного HDD
Получение от системы сообщения о диагностике ошибки не означает, что диск уже вышел из строя. Но в случае наличия S.M.A.R.T. ошибки, нужно понимать, что диск уже в процессе выхода из строя. Полный отказ может наступить как в течении нескольких минут, так и через месяц или год. Но в любом случае, это означает, что вы больше не можете доверить свои данные такому диску.
Необходимо побеспокоится о сохранности ваших данных, создать резервную копию или перенести файлы на другой носитель информации. Одновременно с сохранностью ваших данных, необходимо предпринять действия по замене жесткого диска. Жесткий диск, на котором были определены S.M.A.R.T. ошибки нельзя использовать – даже если он полностью не выйдет из строя он может частично повредить ваши данные.
Конечно же, жесткий диск может выйти из строя и без предупреждений S.M.A.R.T. Но данная технология даёт вам преимущество предупреждая о скором выходе диска из строя.
Восстановите удаленные данные диска
В случае возникновения SMART ошибки не всегда требуется восстановление данных с диска. В случае ошибки рекомендуется незамедлительно создать копию важных данных, так как диск может выйти из строя в любой момент. Но бывают ошибки при которых скопировать данные уже не представляется возможным. В таком случае можно использовать программу для восстановления данных жесткого диска — Hetman Partition Recovery.
- Загрузите программу, установите и запустите её.
- По умолчанию, пользователю будет предложено воспользоваться Мастером восстановления файлов. Нажав кнопку «Далее», программа предложит выбрать диск, с которого необходимо восстановить файлы.
- Дважды кликните на сбойном диске и выберите необходимый тип анализа. Выбираем «Полный анализ» и ждем завершения процесса сканирования диска.
- После окончания процесса сканирования вам будут предоставлены файлы для восстановления. Выделите нужные файлы и нажмите кнопку «Восстановить».
- Выберите один из предложенных способов сохранения файлов. Не сохраняйте восстановленные файлы на диск с ошибкой «0xB7 SATA Downshift Error Count or Runtime Bad Block».
Просканируйте диск на наличие «битых» секторов
Запустите проверку всех разделов жесткого диска и попробуйте исправить найденные ошибки.
Для этого, откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с SMART ошибкой.
Выберите Свойства / Сервис / Проверить в разделе Проверка диска на наличия ошибок. [скриншот]
В результате сканирования обнаруженные на диске ошибки могут быть исправлены.
Снизьте температуру диска
Иногда, причиной возникновения «S M A R T» ошибки может быть превышение максимально допустимой температуры работы диска. Такая ошибка может быть устранена путём улучшения вентиляции компьютера. Во-первых, проверьте оборудован ли ваш компьютер достаточной вентиляцией и все ли вентиляторы исправны.
Если вами обнаружена и устранена проблема с вентиляцией, после чего температура работы диска снизилась до нормального уровня, то SMART ошибка может больше не возникнуть.
Произведите дефрагментацию жесткого диска
Откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с ошибкой « 0xB7 SATA Downshift Error Count or Runtime Bad Block». Выберите Свойства / Сервис / Оптимизировать в разделе Оптимизация и дефрагментация диска. Выберите диск, который необходимо оптимизировать и кликните Оптимизировать.
Примечание. В Windows 10 дефрагментацию и оптимизацию диска можно настроить таким образом, что она будет осуществляться автоматически.
Ошибка «SATA Downshift Error Count or Runtime Bad Block» для SSD диска
Даже если у вас не претензий к работе SSD диска, его работоспособность постепенно снижается. Причиной этому служит факт того, что ячейки памяти SSD диска имеют ограниченное количество циклов перезаписи. Функция износостойкости минимизирует данный эффект, но не устраняет его полностью.
SSD диски имеют свои специфические SMART атрибуты, которые сигнализируют о состоянии ячеек памяти диска. Например, «209 Remaining Drive Life», «231 SSD life left» и т.д. Данные ошибки могут возникнуть в случае снижения работоспособности ячеек, и это означает, что сохранённая в них информация может быть повреждена или утеряна.
Ячейки SSD диска в случае выхода из строя не восстанавливаются и не могут быть заменены.
Сбросьте ошибку
SMART ошибки можно легко сбросить в BIOS (или UEFI). Но разработчики всех операционных систем категорически не рекомендуют этого делать. Если же для вас не имеют ценности данные на жестком диске, то вывод SMART ошибок можно отключить.
Для этого необходимо сделать следующее:
- Перезагрузите компьютер, и с помощью нажатия указанной на загрузочном экране комбинации клавиш (у разных производителей они разные, обычно «F2» или «Del») перейдите в BIOS (или UEFI).
- Перейдите в: Аdvanced >SMART settings >SMART self test. Установите значение Disabled.
Примечание: место отключения функции указано ориентировочно, так как в зависимости от версии BIOS или UEFI, место расположения такой настройки может незначительно отличаться.
Приобретите новый жесткий диск
Целесообразен ли ремонт HDD?
Важно понимать, что любой из способов устранения SMART ошибки – это самообман. Невозможно полностью устранить причину возникновения ошибки, так как основной причиной её возникновения часто является физический износ механизма жесткого диска.
Для устранения или замены неправильно работающих составляющих жесткого диска, можно обратится в сервисный центр специальной лабораторией для работы с жесткими дисками.
Но стоимость работы в таком случае будет выше стоимости нового устройства. Поэтому, ремонт имеет смысл делать только в случае необходимости восстановления данных с уже неработоспособного диска.
Как выбрать новый накопитель?
Если вы столкнулись со SMART ошибкой жесткого диска то, приобретение нового диска – это только вопрос времени. То, какой жесткий диск нужен вам зависит от вашего стиля работы за компьютером, а также цели с которой его используют.
На что обратить внимание приобретая новый диск:
Источник
Лечение жесткого диска HDD
#21 Алексей web
Дизайнер. Skype — aleksejus.belovas
- Страна, Город:
Прибалтика - Пол: Мужчина
Подробно про атрибуты:
Атрибут: 01 Raw Read Error Rate
Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.
Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.
Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.
Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.
Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).
На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.
Атрибут: 02 Throughput Performance
Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 03 Spin-Up Time
Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.
Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.
Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.
Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)
При оценке здоровья не обращайте на атрибут внимания.
Атрибут: 05 Reallocated Sector Count
Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение, а используемый вместо повреждённого сектор — переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.
Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.
Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.
На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет
Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?
Атрибут: 07 Seek Error Rate
Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.
Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.
Атрибут: 08 Seek Time Performance
Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 09 Power On Hours Count (Power-on Time)
Ничего не говорит о здоровье диска.
Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count
О здоровье диска чаще всего не говорит.
Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.
В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.
Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь
Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)
Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.
Атрибут: 12 (0C) Power Cycle Count
Не связан с состоянием диска.
Атрибут: 183 (B7) SATA Downshift Error Count
Не говорит о здоровье накопителя. содержит количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута
Атрибут: 184 (B8) End-to-End Error
Ненулевое значение указывает на проблемы с диском.
Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)
Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).
Атрибут: 188 (BC) Command Timeout
Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.
Атрибут: 190 (BE) Airflow Temperature
содержит температуру винчестера для дисков Hitachi, Samsung, WD и значение «100 − [RAW-значение атрибута 194]» для Seagate. Не говорит о состоянии диска.
Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)
Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.
Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.
Не говорит о здоровье диска.
Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)
Не позволяет судить о состоянии диска.
Атрибут: 193 (С1) Load/Unload Cycle Count
Не говорит о здоровье диска.
Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)
О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.
Атрибут: 195 (С3) Hardware ECC Recovered
содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска. Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.
Атрибут: 196 (С4) Reallocated Event Count
Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.
Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.
Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.
Атрибут: 197 (С5) Current Pending Sector Count
Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.
При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.
Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.
Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).
При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.
Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
означает то же самое, что и атрибут 197, но отличие в том, что данный атрибут содержит количество секторов-кандидатов, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой. Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197. Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).
Атрибут: 199 (С7) UltraDMA CRC Error Count
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.
Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).
В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.
Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.
Можно считать, что о здоровье диска атрибут не говорит.
Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)
содержит частоту возникновения ошибок чтения, произошедших по вине программного обеспечения. Влияние на здоровье неизвестно.
Атрибут: 202 (СА) Data Address Mark Error
содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо
Атрибут: 203 (CB) Run Out Cancel
Влияние на здоровье неизвестно.
Атрибут: 220 (DC) Disk Shift
Влияние на здоровье неизвестно.
Атрибут: 254 (FE) Free Fall Event Count
содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал. Влияние на здоровье неизвестно.
Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.
Сообщение отредактировал Алексей web: 03 Декабрь 2014 — 13:45
Источник
Технология S.M.A.R.T. позволяет считывать сохраняемые в служебной области жесткого диска сведения, необходимые для оценки его состояния. Расшифровка термина такова: Self – сам, Monitoring – контроль, Analysis – анализ, Reporting Technology – технология отчетов. Как и для чего использовать S.M.A.R.T., детально рассмотрено в данной статье. Проверить звук микрофона онлайн.
Содержание
- Для чего нужна эта технология
- Программы для просмотра S.M.A.R.T.
- CrystalDiskInfo
- AIDA64
- Victoria
- HDDScan
- Speccy
- Сложности при сканировании
- Значение атрибутов S.M.A.R.T.
- 01 Raw Read Error Rate
- 02 Throughput Performance
- 03 Spin-Up Time
- 04 Number of Spin-Up Times (Start/Stop Count)
- 05 Reallocated Sector Count
- 07 Seek Error Rate
- 08 Seek Time Performance
- 09 Power On Hours Count (Power-on Time)
- 10 (0A) Spin Retry Count
- 11 (0B) Calibration Retry Count (Recalibration Retries)
- 12 (0C) Power Cycle Count
- 183 (B7) SATA Downshift Error Count
- 184 (B8) End-to-End Error
- 187 (BB) Reported Uncorrected Sector Count (UNC Error)
- 188 (BC) Command Timeout
- 189 (BD) High Fly Writes
- 190 (BE) Airflow Temperature
- 191 (BF) G-Sensor Shock Count (Mechanical Shock)
- 192 (C0) Power Off Retract Count (Emergency Retry Count)
- 193 (C1) Load/Unload Cycle Count
- 194 (C2) Temperature (HDA Temperature, HDD Temperature)
- 195 (C3) Hardware ECC Recovered
- 196 (C4) Reallocated Event Count
- 197 (C5) Current Pending Sector Count
- 198 (C6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
- 199 (C7) UltraDMA CRC Error Count
- 200 (C8) Write Error Rate (MultiZone Error Rate)
- 201 (C9) Soft Read Error Rate
- 202 (CA) Data Address Mark Error
- 203 (CB) Run Out Cancel
- 220 (DC) Disk Shift
- 240 (F0) Head Flying Hours
- 254 (FE) Free Fall Event Count
- Предсказание поломки диска в командной строке
- Определение статуса диска
- Прогнозируемый сбой
- Предсказание в Windows PowerShell
- Анализ в приложении Системный монитор
- Что делать с ошибками S.M.A.R.T.
- Прекратите использование сбойного HDD
- Восстановите удаленные данные диска
- Просканируйте диск на наличие битых секторов
- Снизьте температуру диска
- Произведите дефрагментацию жесткого диска
- Приобретите новый жесткий диск
- Как сбросить S.M.A.R.T ошибку и стоит ли это делать?
Для чего нужна эта технология
Все современные жесткие диски оснащены S.M.A.R.T.-блоком, ответственным за отслеживание и сохранение информации об их основных параметрах: нагревание винчестера в процессе работы, скорость вращения, время позиционирования магнитных головок, предназначенных для записи и считывания данных. Также отслеживаются сбои, возникающие при эксплуатации накопителя. Инструкция как сделать тест веб камеры.
В случае обнаружения на дисковой поверхности битых секторов производится их замещение резервными блоками. Использование данной технологии позволяет своевременно предвидеть выход из строя винчестера и заранее позаботиться об его замене на исправное дисковое устройство. Пользователь может, не дожидаясь окончательной поломки жесткого диска, создать резервную копию всех хранящихся на нем файлов. В таком случае потери информации можно больше не опасаться.
Программы для просмотра S.M.A.R.T.
Ряд производителей HDD выпускают также утилиты собственной разработки, предназначенные для получения информации от S.M.A.R.T. Они максимально адаптированы для работы с носителями определенных моделей. Но такой софт разработан не для всех винчестеров, да и его возможностей иногда оказывается недостаточно для всесторонней оценки состояния накопителя.
В качестве альтернативы можно использовать один из многочисленных программных продуктов, созданных сторонними разработчиками. Далее мы рассмотрим несколько хорошо зарекомендовавших себя приложений, предоставляющих доступ к S.M.A.R.T.
CrystalDiskInfo
CrystalDiskInfo – бесплатное приложение для просмотра параметров S.M.A.R.T. и оценки тенденции их изменений. Интерфейс утилиты полностью русифицирован (язык можно переключить с помощью меню). Температура винчестера или твердотельного накопителя показывается в системном трее (внизу экрана справа). Программа позволяет построить график, на котором будут наглядно отображены изменения, произошедшие за последний месяц с носителем информации. В случае необходимости приложение может быть запущено с задержкой. С помощью CrystalDiskInfo пользователю удобно изменить режим работы жесткого диска: установить максимально возможную скорость либо включить режим экономии электроэнергии (при этом также уменьшится издаваемый HDD шум). Помимо этого, разработчиками реализована поддержка внешних HDD и карманов, а также RAID-массивов Intel.
AIDA64
С помощью данного приложения можно получить информацию обо всех аппаратных компонентах системы и их технических характеристиках, а также выполнить их тестирование. Для просмотра информации о жестком диске следует перейти к разделу «Меню» в левой части окна и щелчком по треугольнику слева открыть подменю «Хранение данных». В его нижней части присутствует пункт «SMART», именно его и нужно выбрать. В правой секции окна вверху появится список всех установленных в системе жестких дисков. Остается выбрать только нужный накопитель и щелкнуть мышью по соответствующей строке. Сведения о выбранном диске будут отображены в секции ниже.
AIDA64 – условно-бесплатное приложение, период безвозмездного пользования которым ограничен 30 днями. Чтобы иметь возможность работать с ним и дальше, необходимо купить лицензию.
Victoria
Victoria – одна из лучших утилит для диагностики и восстановления неисправностей жестких дисков. Существует 2 версии программы: для запуска с загрузочного носителя и для работы непосредственно в среде Windows. В последнем случае для корректной работы приложения его следует запускать от имени администратора (соответствующую команду можно выбрать из его контекстного меню посредством щелчка по значку правой кнопкой мыши). Для загрузки с внешнего носителя потребуется предварительно создать загрузочный USB-диск или CD (DVD) и записать на него образ приложения.
После того, как Victoria запустится, на вкладке «Standard» в правой половине окна вверху выбираем тестируемый HDD и жмем на кнопку «Passport» для обновления сведений о нем. В самом низу окна отобразится информация о модели винчестера, его вместимости в дорожках и серийном номере. Затем можно переходить на вкладку “SMART”. Для считывания данных нажимаем на кнопку «Get SMART» в правой секции окна вверху.
При всех своих прочих достоинствах программа бесплатна. Также следует отметить, что ее новейшие версии поддерживают работу со S.M.A.R.T.-данными SSD-накопителей.
HDDScan
Отличительной особенностью утилиты является предельная простота в использовании. Достаточно выбрать из списка «Select Drive» жесткий диск и нажать на кнопку «S.M.A.R.T.», как на экране появится новое окно с подобной информацией о жестком диске. Разработчиками предусмотрена возможность менять некоторые из этих параметров (AAM, APM и др.). И за все это платить ничего не надо.
Speccy
С помощью бесплатного приложения Speccy с поддержкой русского языка можно получить сведения об установленных в компьютере комплектующих и их технических характеристиках. Предусмотрена возможность сохранения этой информации в виде подробного отчета.
Из меню в левой части экрана выбираем «Хранение данных», и в правой части окна приложения появятся сведения сразу обо всех установленных на машине пользователя жестких дисках. Если информация сразу не будет выведена на экран, надо подождать несколько секунд до завершения ее считывания.
Сложности при сканировании
Как правило, при проверке жестких дисков никаких проблем не возникают. Сканирование невозможно только для старых моделей винчестеров, не поддерживающих S.M.A.R.T.-технологию, или самотестирование которых отключено. Но тут уж ничего не поделать.
Определенные проблемы возникнут и в случае подключения винчестера в AHCI-режиме, поскольку данные S.M.A.R.T. в такой ситуации прочесть нельзя. Об этом выводится соответствующее сообщение на экран (например, может отображаться надпись «Non ATA». Чтобы обойти данное ограничение, необходимо загрузить BIOS и перейти на вкладку «Config > Serial ATA (SATA) > SATA Controller Mode Option». Вместо AHCI нужно выбрать Compatibility и сохранить изменения. Когда тестирование закончено, следует вернуться к прежней настройке.
Значение атрибутов S.M.A.R.T.
Для каждого из атрибутов программа тестирования отобразит следующие сведения (в зависимости от приложения они могут несколько отличаться от приведенного здесь списка):
- наименование;
- номер;
- пороговое значение;
- текущее значение;
- графический индикатор состояния на момент тестирования;
- динамика зарегистрированных изменений;
- приблизительная дата окончательной поломки накопителя.
Здесь следует обратить внимание на цвета индикаторов атрибутов. Зеленый цвет говорит о том, что соответствующий ему показатель в норме. Если же какие-то атрибуты попали в желтую зону, ситуацию следует расценивать как тревожную. В случае же окраски индикатора в красный цвет состояние винчестера критическое, и полностью сломаться он может в любой момент.
Рассмотрим каждый из S.M.A.R.T.-атрибутов жесткого диска.
01 Raw Read Error Rate
Этот показатель используется для определения числа ошибок, возникающих при считывании данных с винчестера. Его значения могут интерпретироваться по-разному в зависимости от модели устройства. Для одних производителей идеалом считается нулевое значение, для других же – чем больше, тем лучше.
02 Throughput Performance
Отображает среднее значение производительности накопителя. Строгих норм для него не существует. Для диагностики HDD практически бесполезен.
03 Spin-Up Time
Позволяет установить время, необходимое винчестеру для раскрутки. Сам по себе данный параметр мало что значит. Его следует оценивать только с учетом заявленных технических характеристик конкретного жесткого диска.
04 Number of Spin-Up Times (Start/Stop Count)
Показывает, сколько раз производилось включение жесткого диска за весь период его эксплуатации. Может использоваться для получения косвенной оценки длительности и интенсивности использования устройства.
05 Reallocated Sector Count
Один из важнейших атрибутов, позволяющий определить физическое состояние винчестера. Показывает количество сбойных секторов, замененных на исправные из резервной области. Такая замена называется ремапом. Ремап производится автоматически в случае, если чтение информации с какого-либо участка диска сильно затруднено или невозможно. При этом поврежденный сектор помечается как неисправный, чтобы операционная система больше не пыталась его использовать.
Надо понимать, что резервная область не безгранична, и когда возможности резервирования будут исчерпаны, начнется необратимое разрушение жесткого диска. Число резервных секторов у разных моделей винчестеров различно. Но максимальное их количество не превышает нескольких тысяч (чаще всего не больше тысячи).
07 Seek Error Rate
Отображает данные, с помощью которых можно определить частоту появления сбоев в ходе позиционирования блока магнитных головок. Во многом схож с атрибутом Raw Read Error Rate. Отличие состоит в том, что для дисков Hitachi нормальным считается только нулевое значение. На дисках Seagate, Samsung SpinPoint F1 и более новых его моделей, а также Fujitsu 2.5’’ этот показатель вообще не стоит учитывать.
08 Seek Time Performance
Показывает среднее значение производительности операций позиционирования дисковых головок. Никаких предельных значений для него не предусмотрено.
09 Power On Hours Count (Power-on Time)
С помощью этого параметра мы можем узнать, сколько часов отработал жесткий диск с начала его использования.
10 (0A) Spin Retry Count
Позволяет определить, сколько раз производились повторные запуски шпинделя с момента первой неудачной попытки его старта. Однако рост данного показателя не всегда означает физическую неисправность винчестера. В большинстве случаев проблема связана с плохим контактом HDD с блоком питания или недостаточным количеством получаемой устройством электроэнергии. Если значение атрибута не превышает 2, то все в порядке. В противном случае следует проверить блок питания и его контакт с жестким диском.
11 (0B) Calibration Retry Count (Recalibration Retries)
Здесь отображается число повторных попыток произвести сброс носителя информации (в результате такой процедуры магнитные головки устанавливаются на нулевую дорожку) после того, как была зарегистрирована первая неудачная попытка. Если значение атрибута нулевое, проблемы отсутствуют, если нет – устройство, скорее всего, неисправно.
12 (0C) Power Cycle Count
Отмечается общее число циклов «включение-отключение» винчестера.
183 (B7) SATA Downshift Error Count
В этом параметре хранится информация о том, сколько попыток понижения режима SATA завершилось неудачей. Дело в том, что при выявлении определенных ошибок HDD может попытаться переключиться на работу в режиме с меньшей скоростью. Такое переключение завершится неудачей, если контроллер по каким-либо причинам откажется выполнять поступившую команду. Но в любом случае к здоровью накопителя это отношения не имеет.
184 (B8) End-to-End Error
Дает возможность оценить, сколько всего ошибок возникло в процессе передачи информации через кэш жесткого диска за все время его использования. О проблеме с устройством может свидетельствовать любое ненулевое значение.
187 (BB) Reported Uncorrected Sector Count (UNC Error)
Означает число секторов, которые в скором времени подлежат переназначению. Иногда сектор повторно может определяться как кандидат на переназначение, что также приводит к увеличению значения атрибута. Если в этой строке не ноль (особенно когда атрибут 197 тоже не равен нулю), с винчестером начали происходить деструктивные изменения.
188 (BC) Command Timeout
Сохраняет данные о том, сколько операций пришлось прервать в связи с превышением предельно допустимого периода ожидания. Любое значение больше нуля свидетельствует о наличии таких сбоев. Но не всегда это связано с неисправностью жесткого диска. Проблема может возникнуть также при использовании некачественных кабелей, плохих переходников, поврежденных контактов, несовместимости с контроллером SATA/PATA на системной плате. В Windows такая ошибка может проявляться появлением «синего экрана смерти».
189 (BD) High Fly Writes
Показывает, сколько было зарегистрировано процессов записи на носитель, когда скорость головки превышала рассчитанную величину. Основной причиной этого явления является внешнее влияние (толчки, удары, вибрация). Однако каких-либо стандартов по данному пункту нет.
190 (BE) Airflow Temperature
Выводит на экран температуру жесткого диска в момент тестирования. Нагревание выше +55 – +60ºC негативно отражается на работе устройства. В таком случае полезно будет установить дополнительное охлаждение.
191 (BF) G-Sensor Shock Count (Mechanical Shock)
По этому параметру можно определить число критических ускорений головки HDD. Причинами их появления могут стать падания накопителя либо удары по его корпусу. Но даже если такие ускорения были зарегистрированы датчиками устройства, это еще не значит, что он был поврежден. Состояние HDD нужно оценивать с учетом значений других атрибутов. Также следует отметить, что у жестких дисков Samsung данный параметр можно не смотреть, поскольку его датчики могут реагировать едва ли не на движение воздуха.
192 (C0) Power Off Retract Count (Emergency Retry Count)
Отображаемая в соответствующей строке информация зависит от модели устройства. Здесь может выводиться или общее количество операций парковок магнитных головок, производящихся при появлении аварийных ситуаций, или число циклов включения/выключения устройства за все время его работы.
193 (C1) Load/Unload Cycle Count
Показывает суммарное количество циклов парковки и распарковки магнитных головок накопителя. С помощью этого параметра мы можем узнать, активирована ли автоматическая парковка HDD. Если значение атрибута 192 превышает значение атрибута 09, это означает, что автоматическая парковка включена и используется.
194 (C2) Temperature (HDA Temperature, HDD Temperature)
Выводит температуру винчестера в момент считывания информации из S.M.A.R.T. Также может содержать сведения о минимальной и максимальной температурах устройства, зарегистрированных за период его эксплуатации. Нужно убедиться, что жесткий диск не перегревается (предельно допустимая температура составляет +55ºC).
195 (C3) Hardware ECC Recovered
Позволяет определить общее количество ошибок, обработанных аппаратными средствами ECC HDD. Является аналогом атрибутов 01 и 07.
196 (C4) Reallocated Event Count
Один из наиболее значимых атрибутов для определения реального состояния винчестера. Чем выше его значение, тем хуже обстоят дела. Но для того, чтобы дать объективную оценку состояния устройства, следует учитывать значения и остальных параметров.
Данный показатель находится в тесной связи с атрибутом 05. Если один из них начал ухудшаться, негативные перемены обычно начинают происходить и с другим. Если же перемены затрагивают только атрибут 196, это означает, что в ходе выполнения ремапа оказалось, что проблемы с сектором обусловлены нарушением логической структуры, а не физической неисправностью, и были устранены средствами жесткого диска.
Иногда возникает ситуация, когда значение атрибута 05 больше аналогичного показателя у атрибута 196. В таком случае был выполнен ремап нескольких секторов одновременно.
197 (C5) Current Pending Sector Count
Выводит информацию о количестве секторов, подлежащих перераспределению. Но не всегда они имеют физическую неисправность. Перераспределяются только кандидаты, получившие статус bad, а сектора со статусом soft (логическая ошибка) после их исправления снова становятся пригодными для использования.
198 (C6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
Во многом схож с атрибутом 197. Основное отличие заключается в том, что атрибут 198 показывает зафиксированное число кандидатов на ремап, выявленных в процессе оффлайн-тестирования (оно запускается во время простоя).
199 (C7) UltraDMA CRC Error Count
Этот показатель позволяет определить, сколько ошибок произошло в ходе выполнения операций передачи информации по интерфейсному кабелю, осуществляемых в режиме UltraDMA. Если наблюдается тенденция к росту параметра, это может свидетельствовать о некачественном или поврежденном шлейфе передачи данных, работе шин PCI/PCI-E в режиме разгона или плохом подключении кабеля SATA к соответствующему разъему на материнской плате или винчестере.
При появлении таких ошибок HDD может быть автоматически переключен в режим PIO, следствием чего станет ощутимое снижение его производительности. В большинстве случаев проблема решается переподключением интерфейсного кабеля или заменой его на новый.
200 (C8) Write Error Rate (MultiZone Error Rate)
Данный параметр отвечает за количество ошибок, зарегистрированных при выполнении записи на информационный носитель. Если их число неуклонно возрастает, жесткий диск уже нельзя считать надежным устройствам. В первую очередь это относится к накопителям WD. Для них высокие значения атрибута 200 могут означать скорый выход из строя пишущей головки.
201 (C9) Soft Read Error Rate
Показывает, сколько ошибок возникает в ходе считывания информации.
202 (CA) Data Address Mark Error
Высокие значения этого показателя свидетельствуют о проблемах, возникающих при работе винчестера.
203 (CB) Run Out Cancel
Здесь фиксируется количество ошибок ECC.
220 (DC) Disk Shift
Позволяет узнать значение сдвига пластин по отношению к оси шпинделя накопителя.
240 (F0) Head Flying Hours
Атрибут можно использовать для оценки времени, которое требуется для позиционирования головки. Позволяет отслеживать состояние блока магнитных головок.
254 (FE) Free Fall Event Count
Регистрирует факты падения жесткого диска и предоставляет возможность определить их количество. Если здесь не нулевое значение, это повод для беспокойства, поскольку в таком случае нельзя исключать физическое повреждение HDD.
Предсказание поломки диска в командной строке
Проверить винчестер на наличие неисправностей с использованием командной строки можно двумя способами. Это определение статуса диска и получение информации о его прогнозируемом сбое.
Определение статуса диска
Для того, чтобы проверить S.M.A.R.T. жесткого диска с помощью командной строки, следует придерживаться такой последовательности действий:
- Запустить системное приложение «Командная строка» с административными правами. Найти ярлык командной строки можно в меню «Пуск». Для того, выполнить запуск приложения с привилегированными правами доступа в Windows 10, нужно кликнуть по его ярлыку правой кнопкой мыши, перейти в меню «Дополнительно» и активировать команду «Запуск от имени администратора».
- После того, как окно консоли появится на экране, ввести в него команду wmic diskdrive get status.
- Подтвердить выполнение команды нажатием клавиши «Enter».
- Подождать пару секунд окончания выполнения команды. Результаты проверки отобразятся в столбце «Status». Если с установленными в компьютере дисками все нормально, везде будет стоять «OK». При выявлении ошибок статус может иметь значения «bad», «unknown» или «caution».
Прогнозируемый сбой
Чтобы заранее предсказать вероятную поломку винчестера, пользователю следует придерживаться такого алгоритма:
- Выполнить запуск командной строки в режиме администратора (как это делается, описано в предыдущем разделе).
- Ввести в консоль команду wmic /namespace:\rootwmi path MSStorageDriver_FailurePredictStatus.
- Подтвердить выполнение операции нажатием на «Enter».
- Дождаться вывода результата на экран. Нужная нам информация будет находиться в столбце «PredictFailure». Если результат тестирования – «FALSE», накопитель функционирует нормально. Значение «TRUE» свидетельствует о серьезных проблемах с HDD, в такой ситуации можно ожидать его скорую поломку. Также следует обратить внимание на столбец «Reason», особенно если в нем отображается число больше нуля. Значение выводимого здесь числового кода у разных производителей винчестеров может расшифровываться по-разному.
Предсказание в Windows PowerShell
Windows PowerShell – встроенный расширяемый инструмент автоматизации, предоставляемый компанией «Microsoft». Чтобы предсказать с его помощью возможные неполадки, нужно выполнить следующие шаги:
- Произвести запуск приложения «Windows PowerShell». В Windows 10 проще всего это сделать с помощью меню «Опытного пользователя». Процедура запуска такова: после щелчка правой кнопкой мыши по кнопке «Пуск» откройте это самое меню и выберите в нем команду «Windows PowerShell (администратор)».
- Введите в консоль команду Get-WmiObject -namespace rootwmi –class SStorageDriver_FailurePredictStatus.
- Нажмите «Enter».
- После того, как команда будет выполнена, на экране отобразится отчет в виде таблицы. В ней будет присутствовать информация обо всех установленных в компьютере дисках. Нас прежде всего интересует значение строки «PredictFailure». Если здесь стоит «FALSE», за судьбу жесткого диска можно пока не переживать. «TRUE» свидетельствует о серьезных проблемах с устройством и предсказывает ему скорую утрату работоспособности. О неисправностях может говорить и ненулевое значение строки «Reason» (что означает то или иное число, можно уточнить, обратившись в службу поддержки производителя HDD).
Анализ в приложении Системный монитор
В отличие от рассмотренных ранее предустановленных в систему приложений, «Системный монитор» работает не в консольном, а в графическом режиме. Для оценки состояния винчестера пользователю потребуется:
- Запустить программу «Системный монитор». Для этого нужно щелкнуть на кнопку «Пуск и открыть панель поиска, в которую ввести запрос «Системный монитор». Искомое приложение будет показано в разделе «Лучшее соответствие». Останется только произвести по нему щелчок левой кнопкой мыши.
- В левой секции появившегося окна щелчком по стрелке слева открыть раздел группы «Сборщиков данных». Ниже будут показаны вложенные в него элементы.
- Открыть подраздел «Системные».
- Перейти на вкладку «System Diagnostics (Диагностика системы)». Вызвать ее контекстное меню щелчком правой кнопки мыши. Выбрать в нем строку «Пуск».
- Еще раз развернуть вложенные элементы и открыть раздел «Отчеты».
- Найти подраздел «Системные» и раскрыть его.
- Развернуть содержимое подраздела «System Diagnostics» и изучить его содержимое.
- Кликнуть мышью по диагностическому отчету, наименование которого соответствует кодовому имени компьютера.
- Через некоторое время детальный отчет будет выведен в правой части окна. В нем следует открыть раздел «Предупреждения», а затем в таблице «Базовые системные проверки» в графе «Тесты» щелкнуть по кнопке с плюсом (она располагается около пункта «Проверка диска»).
- Ознакомиться с содержанием строки «Проверка SMART – предсказания сбоя». Если в колонке «Отказ» стоит нулевое значение, а в колонке «Описание» отображается надпись «Выполнена», то проблем с жестким диском не выявлено.
Что делать с ошибками S.M.A.R.T.
Ответ на этот вопрос зависит от характера проблем с винчестером и степени его неисправности.
Прекратите использование сбойного HDD
Если на жестком диске уже появились битые сектора, это говорит о его значительном износе. Фактически он уже начал рассыпаться, и остановить этот процесс невозможно. Дальнейшее использование такого HDD чревато потерей данных. Поскольку причина этого – физическая неисправность устройства, восстановить их скорее всего не получится.
Восстановите удаленные данные диска
Информация с носителя может исчезать и вследствие логических ошибок (они могут возникать при повреждении файловой системы. В таком случае пропавшие в результате сбоя данные подлежат восстановлению (если они не были перезаписаны другими данными), поскольку физические повреждения на жестком диске отсутствуют. Их можно восстановить, например, с помощью программы R-Studio, которая позволяет спасти информацию даже с удаленных или отформатированных разделов.
Просканируйте диск на наличие битых секторов
Проверить HDD на битые сектора можно с помощью стандартных средств Windows. Для этого необходимо перейти к нужному диску (или разделу), вызвать его контекстное меню и открыть пункт «Свойства». Затем на вкладке «Сервис» кликнуть по кнопке «Выполнить проверку» и в открывшемся окне поставить галочки «Автоматически исправлять системные ошибки» и «Проверять и восстанавливать поврежденные сектора». Возможно, потребуется перезагрузка компьютера после нажатия кнопки «Запуск». Проверка очень объемных винчестеров может длиться до нескольких часов. После завершения процедуры логические ошибки будут исправлены, а bad-сектора подвергнуты ремапу (если их резерв еще не исчерпан).
Сканирование может быть выполнено и рядом сторонних приложений. Для этого отлично подходит программа Victoria. Чтобы полностью проверить весь винчестер на битые сектора, следует на вкладке «Standard» выбрать HDD, а затем перейти на вкладку «Tests» и нажать там кнопку «Start». Количество найденных сбойных секторов будет отображаться в процессе сканирования справа от синего прямоугольника, обозначенного «Err». Цифры рядом с красным и оранжевым прямоугольниками – это еще рабочие сектора, но скорость доступа к ним очень низкая (небольшое их количество может находиться даже на новом винчестере). Полная проверка может продолжаться несколько часов.
Снизьте температуру диска
Перегрев жесткого диска может оказывать негативное влияние на работу его механических компонентов и электроники. Поэтому при подъеме его температуры до 55ºC и выше ему требуется дополнительное охлаждение. Для снижения температуры устройства можно установить в корпус компьютера еще один вентилятор. Также существуют специальные вентиляторы, предназначенные для охлаждения винчестеров. Наконец, температуру накопителя можно немного понизить, если отключить установленные в корпус ПК устройства, выделяющие тепло, без которых можно некоторое время обойтись (например, второй HDD или видеокарта в случае наличия в системной плате интегрированной видеокарты).
Произведите дефрагментацию жесткого диска
Замедление скорости чтения и записи на диск зачастую обусловлено высокой степенью фрагментации хранящихся на нем файлов. Сильная фрагментация файловой системы может способствовать ускоренному износу блока магнитных головок. Это приведет к дополнительным проблемам, связанным с ухудшением показателей их позиционирования, а также с ростом температуры накопителя (поскольку файлы разбиваются на фрагменты, зачастую расположенные друг от друга на значительном удалении, магнитным головкам приходится выполнять дополнительные перемещения, что увеличивает выделение тепла).
SSD-диски дефрагментировать не нужно, т.к. в них нет движущихся пластин и головок, в отличии от HDD.
Для предотвращения этих проблем следует выполнить дефрагментацию диска. Для этого нужно зайти в его свойства (путем вызова контекстного меню), перейти на вкладку «Сервис» и нажать на кнопку «Оптимизировать» (в Windows 10). Затем установить курсор на нужный диск или раздел и уже в этом окне кликнуть по кнопке «Оптимизировать». Обычно процедура оптимизации продолжается несколько минут.
Приобретите новый жесткий диск
Если количество сбойных секторов превышает резерв для их переназначения, приближается к этому показателю или неуклонно возрастает, следует позаботиться о покупке нового винчестера. После покупки надо как можно быстрее установить на него операционную систему и скопировать всю информацию, пока ее считывание еще возможно.
Как сбросить S.M.A.R.T ошибку и стоит ли это делать?
Информацию, записанную в S.M.A.R.T. HDD, в принципе можно удалить. После того, как все данные о накопителе будут сброшены, его S.M.A.R.T. станет выглядеть как у совершенно нового диска, котором еще не начали пользоваться. Конечно же, физические проблемы от этого никуда не исчезнут. Но такой возможностью иногда полезно воспользоваться (и не только недобросовестным продавцам бывших в употреблении винчестеров), если, например, сектора, обозначенные как кандидаты на ремап, оказались физически исправными, а такой статус они получили в результате логических проблем с файловой системой.
Данную операцию можно выполнить при помощи специальных приложений. Одной из таких программ является DRevitalize (с некоторыми моделями винчестеров она не работает). После запуска этой утилиты следует выбрать подлежащий обнулению HDD и нажать на кнопку «Start». Далее выбираем пункт «Features menu and firmware data», после чего жмем по строке «Clear defect reassign list» и подтверждаем выполнение операции. Через несколько секунд можно будет перейти на «SMART Reset Attribute Values» и нажать «ОК». Если после проведения этих манипуляций обновление S.M.A.R.T. не произойдет, следует выполнить перезапуск компьютера.
Skip to content
Как исправить SATA Downshift Error Count or Runtime Bad Block (0xB7)?
Что делать с «0xB7 SATA Downshift Error Count or Runtime Bad Block»?
При загрузке компьютера или ноутбука возникает S.M.A.R.T. ошибка «0xB7 SATA Downshift Error Count or Runtime Bad Block»?
Что означает «0xB7»: SATA Downshift Error Count or Runtime Bad Block? Допустимые значения атрибута «SATA Downshift Error Count or Runtime Bad Block» отличаются для различных производителей жестких дисков WD (Western Digital), Samsung, Seagate, HGST (Hitachi), Toshiba.
Актуально для ОС: Windows 10, Windows 8.1, Windows Server 2012, Windows 8, Windows Home Server 2011, Windows 7 (Seven), Windows Small Business Server, Windows Server 2008, Windows Home Server, Windows Vista, Windows XP, Windows 2000, Windows NT.
Программа для восстановления данных
Прекратите использование сбойного HDD
Получение от системы сообщения о диагностике ошибки не означает, что диск уже вышел из строя. Но в случае наличия S.M.A.R.T. ошибки,
нужно понимать, что диск уже в процессе выхода из строя. Полный отказ может наступить как в течении нескольких минут,
так и через месяц или год. Но в любом случае, это означает, что вы больше не можете доверить свои данные такому диску.
Необходимо побеспокоится о сохранности ваших данных, создать резервную копию или перенести файлы на другой носитель информации.
Одновременно с сохранностью ваших данных, необходимо предпринять действия по замене жесткого диска.
Жесткий диск, на котором были определены S.M.A.R.T. ошибки нельзя использовать – даже если он полностью не выйдет из строя он может частично повредить ваши данные.
Конечно же, жесткий диск может выйти из строя и без предупреждений S.M.A.R.T. Но данная технология даёт вам преимущество предупреждая о скором выходе диска из строя.
Восстановите удаленные данные диска
В случае возникновения SMART ошибки не всегда требуется восстановление данных с диска. В случае ошибки рекомендуется незамедлительно
создать копию важных данных, так как диск может выйти из строя в любой момент. Но бывают ошибки при которых скопировать данные уже не представляется возможным.
В таком случае можно использовать программу для восстановления данных жесткого диска — Hetman Partition Recovery.
Для этого:
- Загрузите программу, установите и запустите её.
- По умолчанию, пользователю будет предложено воспользоваться Мастером восстановления файлов. Нажав кнопку «Далее», программа предложит выбрать диск, с которого необходимо восстановить файлы.
- Дважды кликните на сбойном диске и выберите необходимый тип анализа. Выбираем «Полный анализ» и ждем завершения процесса сканирования диска.
- После окончания процесса сканирования вам будут предоставлены файлы для восстановления. Выделите нужные файлы и нажмите кнопку «Восстановить».
- Выберите один из предложенных способов сохранения файлов. Не сохраняйте восстановленные файлы на диск с ошибкой «0xB7 SATA Downshift Error Count or Runtime Bad Block».
Программа для восстановления данных
Просканируйте диск на наличие «битых» секторов
Запустите проверку всех разделов жесткого диска и попробуйте исправить найденные ошибки.
Для этого, откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с SMART ошибкой.
Выберите Свойства / Сервис / Проверить в разделе Проверка диска на наличия ошибок.
[скриншот]
В результате сканирования обнаруженные на диске ошибки могут быть исправлены.
Снизьте температуру диска
Иногда, причиной возникновения «S M A R T» ошибки может быть превышение максимально допустимой температуры работы диска.
Такая ошибка может быть устранена путём улучшения вентиляции компьютера.
Во-первых, проверьте оборудован ли ваш компьютер достаточной вентиляцией и все ли вентиляторы исправны.
Если вами обнаружена и устранена проблема с вентиляцией, после чего температура работы диска снизилась
до нормального уровня, то SMART ошибка может больше не возникнуть.
Произведите дефрагментацию жесткого диска
Откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с ошибкой «
0xB7
SATA Downshift Error Count or Runtime Bad Block». Выберите Свойства / Сервис / Оптимизировать в разделе Оптимизация и дефрагментация диска. Выберите диск, который необходимо оптимизировать и кликните Оптимизировать.
Примечание. В Windows 10 дефрагментацию и оптимизацию диска можно настроить таким образом, что она будет осуществляться автоматически.
Ошибка «SATA Downshift Error Count or Runtime Bad Block» для SSD диска
Даже если у вас не претензий к работе SSD диска, его работоспособность постепенно снижается. Причиной этому служит факт того,
что ячейки памяти SSD диска имеют ограниченное количество циклов перезаписи. Функция износостойкости минимизирует данный эффект, но не устраняет его полностью.
SSD диски имеют свои специфические SMART атрибуты, которые сигнализируют о состоянии ячеек памяти диска.
Например, «209 Remaining Drive Life», «231 SSD life left» и т.д. Данные ошибки могут возникнуть в случае снижения работоспособности ячеек,
и это означает, что сохранённая в них информация может быть повреждена или утеряна.
Ячейки SSD диска в случае выхода из строя не восстанавливаются и не могут быть заменены.
Сбросьте ошибку
SMART ошибки можно легко сбросить в BIOS (или UEFI). Но разработчики всех операционных систем категорически не рекомендуют этого делать.
Если же для вас не имеют ценности данные на жестком диске, то вывод SMART ошибок можно отключить.
Для этого необходимо сделать следующее:
- Перезагрузите компьютер, и с помощью нажатия указанной на загрузочном экране комбинации клавиш (у разных производителей они разные, обычно «F2» или «Del») перейдите в BIOS (или UEFI).
- Перейдите в: Аdvanced > SMART settings > SMART self test. Установите значение Disabled.
Примечание: место отключения функции указано ориентировочно, так как в зависимости от версии BIOS или UEFI,
место расположения такой настройки может незначительно отличаться.
Приобретите новый жесткий диск
Целесообразен ли ремонт HDD?
Важно понимать, что любой из способов устранения SMART ошибки – это самообман.
Невозможно полностью устранить причину возникновения ошибки, так как основной причиной её возникновения
часто является физический износ механизма жесткого диска.
Для устранения или замены неправильно работающих составляющих жесткого диска,
можно обратится в сервисный центр специальной лабораторией для работы с жесткими дисками.
Но стоимость работы в таком случае будет выше стоимости нового устройства.
Поэтому, ремонт имеет смысл делать только в случае необходимости восстановления данных с уже неработоспособного диска.
Как выбрать новый накопитель?
Если вы столкнулись со SMART ошибкой жесткого диска то, приобретение нового диска – это только вопрос времени.
То, какой жесткий диск нужен вам зависит от вашего стиля работы за компьютером, а также цели с которой его используют.
На что обратить внимание приобретая новый диск:
- Тип диска: HDD, SSD или SSHD. Каждому типу присущи свои плюсы и минусы, которые не имеют решающего значения для одних пользователей и очень важны для других. Основные из них — это скорость чтения и записи информации, объём и устойчивость к многократной перезаписи.
- Размер. Два основных форм-фактора дисков: 3,5 дюймов и 2,5 дюймов. Размер диска определяется в соответствии с установочным местом конкретного компьютера или ноутбука.
- Интерфейс. Основные интерфейсы жестких дисков: SATA, IDE, ATAPI, ATA, SCSI, Внешний диск (USB, FireWire и.т.д.).
-
Технические характеристики и производительность:
- Вместимость;
- Скорость чтения и записи;
- Размер буфера памяти или cache;
- Время отклика;
- Отказоустойчивость.
- S.M.A.R.T. Наличие в диске данной технологи поможет определить возможные ошибки его работы и вовремя предупредить утерю данных.
- Комплектация. К данному пункту можно отнести возможное наличие кабелей интерфейса или питания, а также гарантии и сервиса.
Актуально для:
WD HDD
- WD Blue
- WD Green
- WD Black
- WD Red
- WD Purple
- WD Gold
Seagate HDD
- BarraCuda
- FireCuda
- Backup/Expansion
- Enterprise (NAS)
- IronWolf (NAS)
- SkyHawk
Transcend HDD
- 25M (ударостойкие)
- 25H (ударостойкие)
- 25C (простые)
- 25A (с узором)
- 35T (настольные)
Hitachi HDD
- Travelstar
- Deskstar (NAS)
- Ultrastar
HP HDD
- MSA SAS
- Server SATA
- Server SAS
- Midline SATA
- Midline SAS
IBM HDD
- V3700
- Near Line
- Express 2.5
- V3700 2.5
- Server
- Near Line 2.5
LaCie HDD
- Porsche/Mobile
- Porsche
- Rugged
- d2
A-Data HDD
- DashDrive
- HV
- Durable)
- HD
Silicon Power HDD
- Armor
- Diamond
- Stream
Toshiba HDD
- MG, DT, MQ
- P, X, L
- N, S, V
- DT, AL
Dell HDD
- SAS
- SCI
- Hot-Plug
Verbatim HDD
- Go (портативные)
- Save (настольные)
Team Group SSD
- EVO/Lite/GX2 (TLC)
- PD (портативные)
Silicon Power SSD
- Velox/M/Slim
- Ace (3D TLC)
Apacer SSD
- M.2
- ProII
- Portable
- Panther
GOODRAM SSD
- CL (TLC)
- PX (TLC)
- Iridium (MLC/TLC)
Kingston SSD
- Consumer
- HyperX
- Enterprise
- Builder
Patriot SSD
- Flare (MLC)
- Scorch (MLC, M.2)
- Spark (TLC)
- Blast/P (TLC)
- Burst (3D TLC)
- Viper (TLC, M.2)
Samsung SSD
- PRO (3D MLC)
- EVO
- QVO (3D QLC)
- Portable (внешние)
- DCT (серверные)
- PM (серверные)
Seagate SSD
- Nytro
- Maxtor
- FireCuda
- BarraCuda
- Expansion
- IronWolf
A-Data SSD
- Premier (MLC/TLC)
- Ultimate (3D NAND)
- XPG
- SC (внешние)
- SE (внешние)
- Durable
WD SSD
- WD Blue
- WD Green
- WD Black
- WD Red
- WD Purple
- WD Gold
Transcend SSD
- SSDXXX
- PATA
- MTSXXX
- MSAXXX
- ESDXXX
Содержание:
- Что такое SMART и что он показывает?
- Ошибки S.M.A.R.T.
- Примеры ошибок SMART.
- Как исправить SMART ошибку?
- Как отключить проверку SMART?
- Что делать если данные были утеряны?
Средство S.M.A.R.T., показывающее ошибки жесткого диска (HDD или SSD) является сигналом того, что с накопителем случились какие-то неполадки, влияющие на стабильность и работу компьютера.
Помимо этого, такая ошибка – серьезный повод задуматься о сохранности своих важных данных, поскольку из-за проблемного накопителя можно попросту лишиться всей информации, которую практически невозможно восстановить.
Как правило, система тестирования жестких дисков SMART работает незаметно, как бы за кулисами. Если она обнаруживает серьезную проблему, то загрузка компьютера может быть приостановлена, чтобы отобразить предупреждение. Операционная система Windows не включает инструмент для ручного мониторинга или тестирования вашего диска с помощью SMART, но некоторые производители компьютеров, например Toshiba, Dell или HP предустанавливают небольшую диагностическую утилиту, которая проверяет уровни контролируемых атрибутов SMART, обеспечивая надзор за здоровьем привода. Если на вашем компьютере нет подобной утилиты тестирования и вы хотите проверить здоровье своего харда — загрузите тестовую программу, например DiskSmartView, SpeedFan или Smartmontools.
Что такое SMART и что он показывает?
«S.M.A.R.T.» расшифровывается как «self-monitoring, analysis and reporting technology», что в переводе означает «технология самодиагностики, анализа и отчетности».
Каждый жесткий диск, подключённый через интерфейс SATA или ATA, имеет встроенную систему S.M.A.R.T., которая позволяет выполнять следующие функции:
- Проводить анализ накопителя.
- Исправлять программные проблемы с HDD.
- Сканировать поверхность жесткого диска.
- Проводить программное исправление, очистку или замену поврежденных блоков.
- Выставлять оценки жизненноважным характеристикам диска.
- Вести отчётность о всех параметрах жесткого диска.
Система S.M.A.R.T. позволяет давать пользователю полную информацию о физическом состоянии жесткого диска методом выставления оценок, при помощи которых можно рассчитать примерное время выхода HDD из строя. С данной системой можно лично ознакомиться, воспользовавшись программой Victoria или другими аналогами.
С тем, как работать, проверять и исправлять ошибки жесткого диска в программе Victoria, Вы можете ознакомиться в статье «Как протестировать и исправить жесткий диск используя бесплатную программу Victoria».
Центр компьютерной помощи «1 2 3»
S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.
SMART производит наблюдение за основными характеристиками накопителя, каждая из которых получает оценку. Характеристики можно разбить на 2 основные группы:
- параметры, отражающие процесс естественного старения жёсткого диска (число оборотов шпинделя, число перемещений головок, количество циклов включения-выключения);
- текущие параметры накопителя (высота головок над поверхностью диска, число переназначенных секторов, время поиска дорожки и количество ошибок поиска).
Данные хранятся в шестнадцатеричном виде, называемом «raw value», а потом пересчитываются в обычное десятичное «value» — значение, символизирующее надёжность относительно некоторого эталонного значения. Обычно «value» располагается в диапазоне от 0 до 100 (некоторые атрибуты имеют значения от 0 до 200 или до 253).
Высокая оценка говорит об отсутствии изменений данного параметра или медленном его ухудшении. Низкая говорит о возможном скором сбое. Значение, меньшее, чем минимальное, при котором производителем гарантируется безотказная работа накопителя, означает выход узла из строя.
В таблице ниже перечислены основные параметры S.M.A.R.T. и их расшифровка. Красным цветом выделены наиболее важные и критичные для оптимального функционирования винчестера параметры.
# | hex | атрибут | оптимально | описание |
1 | 1 | Raw Read Error Rate | Частота ошибок при чтении данных с пластин диска по вине аппаратной части накопителя. Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 включительно) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных до выдачи в интерфейс. Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (невключительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания. | |
2 | 2 | Throughput Performance | Общая (средняя) производительность диска. Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении. | |
3 | 3 | Spin-Up Time | Время раскрутки шпинделя диска из состояния покоя до номинальной рабочей скорости. Практически ничего не говорит о здоровье диска. Время разгона может различаться у разных дисков (даже одного и того же производителя) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т.п. Винчестеры Fujitsu всегда имеют 1 в этом поле в случае отсутствия проблем с раскруткой шпинделя. | |
4 | 4 | Number of Spin-Up Times Start/Stop Count | Полное число циклов включения диска (запуска-остановки шпинделя). У дисков некоторых производителей (например, Seagate) — счётчик включения режима энергосбережения. При оценке здоровья можно не обращать на этот атрибут значительного внимания. | |
5 | 5 | Reallocated Sectors Count | Количество секторов, переназначенных в случае обнаружения винчестером ошибки чтения/записи в резервную область. Поэтому на современных жёстких дисках нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Чем больше это значение, тем хуже состояние поверхности дисков. При достижении определённого порогового значения (например, 10 ремапов) диск нужно обязательно менять, ведь это означает прогрессирующую деградацию состояния поверхности блинов, головок или другие аппаратные проблемы. | |
6 | 6 | Read Channel Margin | Запас канала чтения. Назначение этого атрибута не документировано — в современных накопителях не используется. | |
7 | 7 | Seek Error Rate | Частота появления ошибок позиционирования блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине). На дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ на значение атрибута можно не обращать внимание, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует об аппаратных проблемах. Для винчестеров Hitachi нормальным значением является только 0. | |
8 | 8 | Seek Time Performance | Средняя производительность операций позиционирования магнитных головок. Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении. | |
9 | 9 | Power On Hours Count Power-on Time |
Число часов (минут, секунд — в зависимости от производителя), проведённых винчестером во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure). Ничего не говорит о здоровье диска как таковом. | |
10 | 0A | Spin-Up Retry Count | Число повторных попыток раскрутки шпинделя диска до рабочей скорости в случае, если первая попытка оказалась неудачной. О здоровье диска чаще всего не говорит. Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью. Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска. В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания. | |
11 | 0B | Calibration Retry Count Recalibration Retries |
Количество повторов запросов сброса накопителя (рекалибровки) в случае, если первая попытка была неудачной. Ненулевое, а особенно растущее значение параметра может означать проблемы с диском. | |
12 | 0C | Power Cycle Count | Количество полных циклов включения-выключения диска. Не связан с состоянием диска. | |
13 | 0D | Soft Read Error Rate | Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению. Все ошибки имеют не механическую природу и указывают лишь на неправильную размётку/взаимодействие с диском программ или операционной системы. | |
183 | B7 | SATA Downshift Error Count | Количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с, по какой-то причине (например, из-за ошибок) может попытаться понизить скоростной режим (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае отказа контроллера изменять режим диск увеличивает значение этого атрибута. Не говорит о здоровье накопителя. | |
184 | B8 | End-to-End Error | Количество ошибок, возникших при передаче данных через кэш винчестера в случае, если паритет данных между хостом и жестким диском не совпадает. Ненулевое значение указывает на проблемы с диском. | |
187 | BB | Reported Uncorrected Sector Count UNC Error |
Количество секторов, которые были признаны кандидатами на переназначение за всю историю жизни диска. Причём если сектор становится кандидатом повторно — значение атрибута также увеличивается. Ненулевое значение атрибута явно указывает на ненормальное состояние диска или на то, что оно было таковым ранее (в сочетании с нулевым значением 197). | |
188 | BC | Command Timeout | Количество операций, выполнение которых было отменено из-за превышения максимально допустимого времени ожидания отклика. Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т.д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА. Из-за ошибок такого рода возможны «синие экраны смерти» в Windows. Ненулевое значение атрибута говорит о потенциальной «болезни» диска. | |
189 | BD | High Fly Writes | Количество зафиксированных случаев записи при высоте полета головки выше рассчитанной (скорее всего, из-за внешних воздействий, например вибрации). Для того, чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи SMART, которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО. | |
190 | BE | Airflow Temperature | Температура воздуха внутри корпуса жёсткого диска. Для дисков Seagate рассчитывается по формуле (100 — HDA Temperature). Для дисков Western Digital — (125 — HDA Temperature). | |
191 | BF | G-Sensor Shock Count Mechanical Shock |
Количество критических ускорений (ударных нагрузок), зафиксированных электроникой диска, которым подвергался накопитель и которые превышали допустимые. Обычно это происходит при ударах, падениях и т. п. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера. Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т.к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи. | |
192 | C0 | Power Off Retract Count Emergency Retry Count |
Для разных винчестеров может содержать одну из следующих двух характеристик: либо суммарное количество парковок диска в аварийных ситуациях (по сигналу от вибродатчика, обрыву/понижению питания и т.п.), либо суммарное количество циклов включения/выключения питания диска (характерно для современных WD и Hitachi). | |
193 | C1 | Load/Unload Cycle Count | Количество полных циклов парковки/распарковки магнитных головок диска. Анализ этого атрибута — один из способов определить, включена ли на диске функция автоматической парковки (например, у дисков Western Digital). Если значение атрибута превосходит (обычно — многократно) значение атрибута 09 (счётчик отработанных часов), то парковка включена. | |
194 | C2 | Temperature HDA Temperature HDD Temperature |
Текущая температура диска, считываемая с датчика, который на разных моделях может располагаться в разных местах. Поле вместе с текущей также может содержать максимальную и минимальную температуры, зафиксированные за всё время эксплуатации винчестера. При работе старайтесь не допускать повышения температуры винчестера выше 50 градусов. | |
195 | C3 | Hardware ECC Recovered | Число коррекции ошибок аппаратной частью диска (чтение, позиционирование, передача по внешнему интерфейсу). На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону. Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07. | |
196 | C4 | Reallocation Event Count | Количество операций переназначения секторов. В поле «raw value» атрибута хранится общее число попыток переноса информации с переназначенных секторов в резервную область. Учитываются как успешные, так и неуспешные попытки. Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты. | |
197 | C5 | Current Pending Sector Count | Количество секторов, являющихся кандидатами на переназначение в резервную область. Они не были ещё определены как плохие, но скорость считывания с них отличается от чтения стабильного сектора (это так называемые подозрительные или нестабильные секторы). В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. Рост значения этого атрибута может свидетельствовать о физической деградации жёсткого диска. При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге он будет либо исправлен, либо переназначен. | |
198 | C6 | (Offline) Uncorrectable Sector Count | Количество секторов-кандидатов на переназначение, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой. Ненулевое значение говорит о неполадках на диске (точно так же, как и с параметром 197). | |
199 | C7 | UltraDMA CRC Error Count | Число ошибок, возникающих при передаче данных по по интерфейсному кабелю в режиме UltraDMA или его эмуляции винчестерами SATA (нарушения целостности пакетов и т. п.). В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере. Для Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с. | |
200 | C8 | Write Error Rate Multi-Zone Error Rate |
Частота возникновения ошибок записи. Ненулевое значение говорит о проблемах с диском — в частности, у дисков WD большие цифры могут означать деградирующие головки. | |
201 | C9 | Soft Read Error Rate | Частота появления ошибок чтения по вине программного обеспечения. | |
202 | CA | Data Address Mark Errors | Число ошибок Data Address Mark (DAM). Ненулевое значение — это плохо | |
203 | CB | Run Out Cancel | Количество ошибок ECC. | |
204 | CC | Soft ECC Correction | Количество ошибок ECC, скорректированных программным способом. | |
205 | CD | Thermal Asperity Rate (TAR) | Number of thermal asperity errors. | |
206 | CE | Flying Height | Высота между головкой и поверхностью диска. | |
207 | CF | Spin High Current | Величина силы тока при раскрутке диска. | |
208 | D0 | Spin Buzz | Number of buzz routines to spin up the drive. | |
209 | D1 | Offline Seek Performance | Производительность поиска во время оффлайновых операций. | |
220 | DC | Disk Shift | Дистанция смещения блока пластин диска относительно оси шпинделя. В основном возникает из-за удара или падения. Единица измерения неизвестна. При увеличении атрибута диск быстро становится неработоспособным. | |
221 | DD | G-Sense Error Rate | Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара. | |
222 | DE | Loaded Hours | Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область. | |
223 | DF | Load/Unload Retry Count | Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки. | |
224 | E0 | Load Friction | Величина силы трения блока магнитных головок при его выгрузке из парковочной области. | |
225 | E1 | Load Cycle Count | Количество циклов перемещения блока магнитных головок в парковочную область. | |
226 | E2 | Load ‘In’-time | Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска. | |
227 | E3 | Torque Amplification Count | Количество попыток скомпенсировать вращающий момент. | |
228 | E4 | Power-Off Retract Cycle | Количество повторов автоматической парковки блока магнитных головок в результате выключения питания. | |
230 | E6 | GMR Head Amplitude | Амплитуда дрожания (расстояние повторяющегося перемещения блока магнитных головок). | |
231 | E7 | Temperature | Температура жёсткого диска. | |
240 | F0 | Head Flying Hours | Время, затраченное на позиционирования головки. Счётчик может содержать несколько значений в одном поле. | |
250 | FA | Read Error Retry Rate | Число ошибок во время чтения жёсткого диска. | |
254 | FF | Free Fall Event Count | Количество ускорений свободного падения диска, которым он подвергался (проще говоря, показывает, сколько раз диск падал). |
Ошибки S.M.A.R.T.
Как правило, в нормально работающем накопителе система S.M.A.R.T. не выдает никаких ошибок даже при невысоких оценках. Это обусловлено тем, что появление ошибок является сигналом возможной скорой поломки диска.
Ошибки S.M.A.R.T. всегда свидетельствуют о какой-либо неисправности или о том, что некоторые элементы диска практически исчерпали свой ресурс. Если пользователю стали демонстрироваться подобные сообщения, следует задуматься о сохранности своих данных, поскольку теперь они могут исчезнуть в любой момент!
Топ 20 бесплатных инструментов мониторинга дисков
В посте собран перечень 20 лучших бесплатных инструментов разбивки, диагностики, шифрования, восстановления, клонирования, форматирования дисков. Вообщем практически все что нужно для базовой работы с ними.
TestDisk
TestDisk позволяет восстанавливать загрузочные разделы, удаленные разделы, фиксировать поврежденные таблицы разделов и восстанавливать данные, а также создавать копии файлов с удаленных/недоступных разделов.
Примечание: PhotoRec ето связанное с TestDisk приложением. С его помощью возможно восстановить данные в памяти цифровой камеры на жестких дисках и компакт-дисках. Кроме того можно восстановить основные форматы изображений, аудиофайлы, текстовые документы, HTML-файлы и различные архивы.
При запуске TestDisk предоставляется список разделов жесткого диска, с которыми можно работать. Выбор доступных действий, осуществляемых в разделах, включает: анализ для корректировки структуры (и последующее восстановление, в случае обнаружения проблемы); изменение дисковой геометрии; удаление всех данных в таблице разделов; восстановление загрузочного раздела; перечисление и копирование файлов; восстановление удаленных файлов; создание снапшота раздела.
EaseUS Partition Master
EaseUS Partition Master — инструмент для работы с разделами жесткого диска. Он позволяет создавать, перемещать, объединять, разделять, форматировать, изменяя их размер и расположение без потери данных. Также помогает восстанавливать удаленные или потерянные данные, проверять разделы, перемещать ОС на другой HDD/SSD и т.д.
Слева представлен перечень операций, которые можно выполнить с выбранным разделом.
WinDirStat
Бесплатная программа WinDirStat проводит анализ использованного места на диске. Демонстрирует, как данные распределяются и какие из них занимают больше места.
Клик по полю в диаграмме выведет на экран рассматриваемый файл в структурном виде.
После загрузки WinDirStat и выбора дисков для анализа, программа сканирует дерево каталога и предоставляет статистику в таких вариантах: список каталогов; карта каталогов; список расширений.
Clonezilla
Clonezilla создает образ диска с инструментом клонирования, который также упакован с Parted Magic и первоначально доступен, как автономный инструмент. Представлен в двух версиях: Clonezilla Live и Clonezilla SE (Server Edition).
Clonezilla Live является загрузочным дистрибутивом Linux, позволяющим клонировать отдельные устройства. Clonezilla SE — это пакет, который устанавливается на дистрибутиве Linux. Он используется для одновременного клонирования множества компьютеров по сети.
OSFMount
Использование данной утилиты дает возможность монтировать ранее сделанные образы дисков и представлять их в виде виртуальных приводов, непосредственно просмотривая сами данные. OSFMount поддерживает файлы образов, такие как: DD, ISO, BIN, IMG, DD, 00n, NRG, SDI, AFF, AFM, AFD и VMDK.
Дополнительная функция OSFMount — создание RAM-дисков, находящихся в оперативной памяти компьютера, что существенно ускоряет работу с ними. Для запуска процесса нужно перейти в File > Mount new virtual disk.
Ошибка «SMART failure predicted»
В данном случае S.M.A.R.T. оповещает пользователя о скором выходе диска из строя. Важно: если Вы увидели такое сообщение на своем компьютере, срочно скопируйте всю важную информацию и файлы на другой носитель, поскольку данный жесткий диск может прийти в негодность в любой момент!
Сколько записывается на SSD
В следующей таблице я свел данные об использовании SSD, до которых дотянулись руки. Они эксплуатируются в одном настольном ПК и трех разных ноутбуках. Никто их не бережет и не жалеет, файлы подкачки не отключает, временные файлы не переносит. Оба 840 Pro служат системными дисками и хранят личные файлы (кроме видео), Kingston – это полигон для виртуальных машин и второй файл подкачки, а Crucial выступал даже хранилищем фильмов.
Samsung 840 Pro 256GB | Samsung 840 Pro 256GB | Samsung 840 EVO 120GB | Kingston Hyper-X 3K 120GB | Crucial MX100 256GB | PLEXTOR 128M5Pro 128GB | |
Текущий срок службы диска (лет) | 2.25 | 2.25 | 2 | 3.25 | 1.25 | 2.25 |
Применено мифов | 0 | 0 | 0 | 0 | 0 | 0 |
Запись всего | 7.3TB | 5.0TB | 1.6TB | 5.5TB | 4.1TB | 5.7TB |
Запись в год | 3.2TB | 2.2TB | 0.8TB | 1.7TB | 3.3TB | 2.5TB |
Запись в день | 9GB | 6GB | 2GB | 5GB | 9GB | 7GB |
Ресурс NAND диска (лет) | 22.8 | 33.2 | — | 45.3 | 21.8 | — |
Износ флэш-памяти – это последнее, от чего умрут диски из таблицы. Им гарантируется 20-40GB записи в день, но ни один даже до 10GB не дотягивает! А ведь у современных SSD гарантийные объемы еще выше.
Как исправить SMART ошибку?
Ошибки S.M.A.R.T. свидетельствуют о скорой поломке жесткого диска, поэтому исправление ошибок, как правило, не приносит должного результата, и ошибка остается. Помимо критических ошибок, существуют еще и другие проблемы, которые могут вызывать сообщения такого рода. Одной из таких проблем является повышенная температура носителя.
Ее можно посмотреть в программе Victoria во вкладке SMART под пунктом 190 «Airflow temperature» для HDD. Или под пунктом 194 «Controller temperature» для SDD.
Если данный показатель будет завышен, следует принять меры по охлаждению системного блока:
- Проверить работоспособность кулеров.
- Очистить пыль.
- Поставить дополнительный кулер для лучшей вентиляции.
Другим способом исправления ошибок SMART является проверка накопителя на наличие ошибок.
Это можно сделать, зайдя в папку «Мой компьютер», кликнув правой клавишей мыши по диску или его разделу, выбрав пункт «Сервис» и запустив проверку.
Если ошибка не была исправлена в ходе проверки, следует прибегнуть к дефрагментации диска.
Чтобы это сделать, находясь в свойствах диска, следует нажать на кнопку «Оптимизировать», выбрать необходимый диск и нажать «Оптимизировать».
Если ошибка не пропадет после этого, скорее всего, диск просто исчерпал свой ресурс, и в скором времени он станет нечитаемым, а пользователю останется только приобрести новый HDD или SSD.
Ошибки позиционирования
Seek Error Rate
Жесткий диск постоянно находится в движении — его головки скользят по поверхности в поисках данных. Иногда этот процесс сбоит и блок магнитных головок оказывается не в том месте — это ошибка позиционирования. При их наличии имеются повреждения сервометок, возможны проблемы с охлаждением и механической частью (шпендель)
Жесткий диск контролирует правильность установки головок на требуемую дорожку поверхности для считывания данных. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. Для данного накопителя причиной большого числа ошибок явился перегрев. Как и в случае с Raw Read Error Rate, «Значение» не должно опуститься ниже «Порога». А в столбце «Данные» (RAW) должен быть (в идеале) ноль.
Как отключить проверку SMART?
Диск с ошибкой S.M.A.R.T. может выйти из строя в любой момент, но это не означает, что им нельзя продолжать пользоваться.
Стоит понимать, что использование такого диска не должно подразумевать в себе хранение на нем сколько-либо стоящей информации. Зная это, можно провести сброс smart настроек, которые помогут замаскировать надоедливые ошибки.
Для этого:
Шаг 1. Заходим в BIOS или UEFI (кнопка F2 или Delete во время загрузки), переходим в пункт «Advanced», выбираем строку «IDE Configuration» и нажимаем Enter. Для навигации следует использовать стрелочки на клавиатуре.
Шаг 2. На открывшемся экране следует найти свой диск и нажать Enter (жесткие диски подписаны «Hard Disc»).
Шаг 3. Опускаемся вниз списка и выбираем параметр SMART, нажимаем Enter и выбираем пункт «Disabled».
Шаг 4. Выходим из BIOS, применяя и сохраняя настройки.
Стоит отметить, на некоторых системах данная процедура может выполняться немного по-другому, но сам принцип отключения остается прежним.
После отключения SMART ошибки перестанут появляться, и система будет загружаться в штатном порядке до тех пор, пока HDD окончательно не выйдет из строя. В некоторых ситуациях ошибки могут показываться в самой ОС, тогда достаточно несколько раз отклонить их, после чего появится кнопка «Больше не показывать».
Расшифровка результатов
Система сохраняет информацию в шестнадцатеричном виде, именуемом как raw value («сырые значения»). Данные форматируются в параметр value, отображающий надежность винчестера в соответствии с эталоном.
Оценка производится, в основном, по шкале от 0 до 100, но некоторые пункты измеряются в диапазоне от 0 до 253. Высокая цифра указывает на нормальное состояние, а низкая — на возможность скорой поломки. Если результат меньше минимума, при котором изготовитель винта гарантирует его безотказную работу, значит, узел вышел из строя.
Как это выглядит?
Программа выдает результаты в виде таблицы, разделенной на несколько обязательных полей:
- ID (Num) — идентификационный номер параметра;
- Name — его описание;
- VAL — цифра, отображающая состояние диска (о чем говорилось выше);
- Wrst (Worst) — худшее значение value за всю историю вашего харда;
- Thresh (Threshold) — число, достигнув которого винт выйдет из строя.
Что делать если данные были утеряны?
При случайном форматировании, удалении вирусами или утере любых важных данных следует быстро вернуть утерянную информацию самым эффективным методом.
Одним из таких методов является программа для восстановления данных RS Partition Recovery. Данная утилита сможет быстро вернуть удаленные фотографии, видеофайлы, звуковые дорожки, картинки, документы и любые другие файлы, которые исчезли с накопителя по различным причинам. RS Partition Recovery имеет продвинутую систему сканирования и поиска удаленной информации, что позволяет находить и восстанавливать даже те файлы, которые были удавлены достаточно давно. Детальнее с возможностями и главными особенностями RS Partition Recovery можно ознакомиться на официальном сайте производителя
Что означают данные SMART, связанные со сроком службы SSD
Фирменные и сторонние утилиты выводят упрощенные сведения, и зачастую этого достаточно.
Но у SMART много интересных атрибутов, поэтому давайте разбираться. Чтобы не гадать, нужно сверяться с документацией, которая идет в комплекте с фирменной утилитой в справке или прилагается в PDF, либо выложена в разделе поддержки на сайте изготовителя. Конечно, там все на английском, поэтому использую только английские название атрибутов, несмотря на локализацию CDI.
Список ссылок на документацию SMART производителей SSD
Добавляйте в комментариях
ссылки на описание атрибутов ваших дисков.
- Samsung (справка к утилите Magician, веб-сайт)
- Kingston (SandForce)
- Crucial (M5xx, M600, MXxxx)
Атрибуты объема записи в NAND
Давайте посмотрим, как определяют ключевой параметр разные изготовители.
Total LBAs Written / Total Host Sector Writes
Некоторые изготовители считают количество блоков LBA (Samsung, Crucial). Чтобы получить значение в байтах, надо умножить на 512. На Samsung 840 Pro записано 7.3TB.
Здесь попутно указывается текущее значение [в процентах], поэтому можно грубо оценить износ накопителя. Но для оценки срока жизни есть специальные атрибуты, которые мы рассмотрим ниже.
Lifetime Writes from Host
Этот атрибут используется в дисках на SF. Указывается значение в гигабайтах или в байтах, по количеству цифр понятно. На Kingston Hyper-X 3K записано 5.5TB
Заметьте, что здесь процент износа оценить невозможно.
Атрибуты износа и срока службы NAND
В SMART всех дисков есть конкретный показатель износа или процент оставшегося здоровья SSD.
Percent Lifetime Remaining / SSD Life Left
Оставшийся процент жизни SSD. 5.5TB – ничто.
Wear Leveling Count / Media Wearout Indicator
Износ NAND. У Samsung (на картинке) и Intel соответственно этот атрибут отражает количество пройденных циклов перезаписи (RAW Values) и текущий уровень жизни SSD в процентах.
Ниже с помощью этого показателя мы определим ресурс NAND в 840 Pro и 840 EVO.
Used Reserved Block Count (total) и Reallocated Sector Count
Количества использованных резервных блоков и переназначенных секторов. Чтобы здесь испортить идеальные показатели, нужно очень
много записывать. Так, победитель эксперимента над шестью SSD 840 Pro начал заметно использовать резервные блоки только после записи 600TB. Обратите внимание, что WLC опустился до нуля на 500TB.
А вот так на картинках хорошо видна связь количества использованных резервных блоков и переназначенных секторов.
Вычисляем ресурс NAND (количество циклов перезаписи)
Зная число пройденных циклов и процент износа, можно подсчитать количество циклов P/E, которые выдерживает память. По науке, надо последовательно записать терабайт десять, сопоставляя каждое падение счетчика WLC на единицу с объемом записанных данных. Но можно прикинуть, усреднив значения двух 840 Pro с MLC NAND, которые у нас с братом из одной партии. Для сравнения с ними добавлены два 840 EVO 120GB с самым большим износом из комментариев
Модель Samsung | Износ (WLC) | Записано | Пройдено циклов P/E | Ресурс циклов P/E | Ресурс записи в NAND |
840 Pro | 3% | 7.3TB | 86 | Среднее: 3058 | Среднее: 250TB |
840 Pro | 2% | 5.2TB | 65 | ||
840 EVO | 7% | 10.3TB | 75 | Среднее: 1123 | Среднее: 160TB |
840 EVO | 8% | 14TB | 94 |
Таблица высвечивает пару любопытных особенностей:
- Samsung не озвучивала выносливость флэш-памяти 840 Pro в циклах P/E, в отличие от Kingston. Но ресурс NAND у обоих накопителей одинаковый – 3 000 циклов или 3K.
- У 840 EVO ресурс памяти соответствует TLC NAND — 1 000 циклов. Ожидаемо, расчетный ресурс записи в терабайтах ниже, чем у 840 PRO, но не в три раза.
Из результатов эксперимента выше видно, что даже израсходовав ресурс, во флэш-память можно записать очень много данных. Но на практике при нуле процентов жизни диск надо срочно менять.
Вычисляем мультипликатор увеличения записи
Вы уже видели эти показатели выше глазами CDI в контексте срока жизни SSD, но сейчас я хочу обратить ваше внимание на атрибуты без описаний, причем в фирменной утилите.
Kingston HyperX 3K | Атрибуты 233 и 234 не описаны даже в документации
О назначении параметров я догадался сам, а потом нашел подтверждения в сети (это как раз тот случай, когда легче искать информацию по десятичному номеру атрибута утилиты изготовителя). Обратите внимание, что значения атрибутов 234 и 241 совпадают, т.е. 234 – это тоже объем записи на диск. Значение 233 меньше, а диск – SandForce, главной особенностью которого является сжатие данных контроллером. Все сходится!
Атрибут 233 – это NAND Writes
!
Если диск выводит объем записи во флэш-память, можно вычислить соотношение физической записи в NAND к логической записи ОС — мультипликатор .
Для накопителя Kingston WA=4567/5512=0.8
. Он меньше 1, т.е. сжатие действительно экономит ресурс SSD. В презентациях SandForce заявляла 0.5, впрочем.
Давайте теперь посмотрим на диск без сжатия – типичный для 2015-2016 годов накопитель на MLC NAND 16nm с контроллером Marvell на примере Crucial MX100. В отсутствие сжатия идеальное значение WA равно 1. У Crucial мультипликатор вычисляется немного сложнее.
ИД | Атрибут | RAW-значение |
247 | Host program page count | 277655968 |
248 | Background program page count | 2665992986 |
ИД 247 – это операции программирования ячеек, исходящие от ОС, т.е. аналог Host Writes. ИД 248 – это операции контроллера в дополнение
к записям ОС. Поэтому NAND Writes = ИД 247 + ИД 248. В документации формула дается после упрощения дроби: WA=1+(ИД 248/ИД 247).
Даже без вычислений видно, что физических операций на порядок больше логических записей ОС. Точный WA= (277655968+2665992986)/277655968=10.6
. Это многовато, на форумах Crucial я не видел WA>6. Скорее всего, такой большой мультипликатор связан с условиями эксплуатации диска – он регулярно забивался скачанными фильмами на протяжении большей части службы. Но, думаю, сценарий “один диск SSD 256GB в ноутбуке” достаточно распространен.
3 года назад, опираясь на характеристики HyperX 3K при записи «один объем диска в день», я оценивал срок службы накопителя в 8 лет. Тогда я брал WA=10, а фактический мультипликатор оказался в 12 раз меньше. Однако для более нового SSD Crucial десятикратное увеличение объема записи в NAND оказалось реальностью. Переходим к объемам записи.
Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (невключительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.
Практически ничего не говорит о здоровье диска. Время разгона может различаться у разных дисков (даже одного и того же производителя) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т.п. Винчестеры Fujitsu всегда имеют 1 в этом поле в случае отсутствия проблем с раскруткой шпинделя.
Start/Stop Count
Чем больше это значение, тем хуже состояние поверхности дисков. При достижении определённого порогового значения (например, 10 ремапов) диск нужно обязательно менять, ведь это означает прогрессирующую деградацию состояния поверхности блинов, головок или другие аппаратные проблемы.
Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
На дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ на значение атрибута можно не обращать внимание, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует об аппаратных проблемах. Для винчестеров Hitachi нормальным значением является только 0.
Power-on Time
В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.
Recalibration Retries
UNC Error
Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т.д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА. Из-за ошибок такого рода возможны «синие экраны смерти» в Windows. Ненулевое значение атрибута говорит о потенциальной «болезни» диска.
Для того, чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи SMART, которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО.
Mechanical Shock
Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т.к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.
Emergency Retry Count
HDA Temperature
HDD Temperature
Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге он будет либо исправлен, либо переназначен.
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере. Для Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.
Multi-Zone Error Rate
Сохранность наших файлов и данных напрямую зависит от состояния жесткого диска, на котором они хранятся. Важно иметь полное представление о работе этого устройства и вовремя спрогнозировать возможные сбои. Это даст возможность перенести важную информацию на резервный носитель. Полное представление о том, в каком состоянии механическая часть жесткого диска, поверхность физических дисков даёт технология S.M.A.R.T.
Сокращение S.M.A.R.T. обозначает в свободном переводе технология самоконтроля, анализа и отчета. Соответственно названию она занимается самоконтролем диска, анализом параметров на предмет предполагаемого сбоя и отчета по набору атрибутов.
Одна группа атрибутов отражает состояние диска в данный момент, другая фиксирует механический износ деталей устройства. У каждого атрибута есть свой номер и значение(Value). Диск хранит значение атрибута в удобном для себя шестнадцатеричном формате (Raw value), а программа пересчитывает его в понятные нам десятичные цифры. Современная система информационной безопасности позволяет обеспечить такие параметры диска, при которых злоумышленник не сможет получить доступ к конфиденциальной информации.
Система DLP создает защитный цифровой барьер, который и препятствует утечкам информации. Для оценки состояния есть пороговые значения атрибутов (Threshold), их определяет производитель диска. Значение ниже порога, уже не нормальная работа жесткого диска или вообще неисправность. Очень полезное для прогноза сбоев, наихудшее значение атрибута (Worst),показывает худшее число, которое принимал параметр за весь период работы диска. Дополнительно многие программы показывают значение атрибута в цвете (зеленый, желтый, красный) или шкалой. Value обычно имеет диапазон от 0 до 100, но есть атрибуты со значениями выше 200.
Атрибутов S.M.A.R.T. достаточно много, рассмотрим основные и жизненно важные. Набор параметров возьмем из статьи о программе для проверки жесткого диска. Как выглядит таблица S.M.A.R.T. показано на картинке ниже.
Здесь есть номер атрибута, его описание, значение Value, значение Worst, Raw value в hex формате и пороговое значение Threshold. Рядом с атрибутом кружок, по цвету которого можно оценить значение атрибута.
001 Raw Read Error Rate
— Как часто появляются ошибки чтения из-за аппаратной части накопителя. Ошибок нужно бы поменьше.
003 Spin Up Time
– Как быстро диск набирает рабочую скорость. С износом повышается.
004 Start/Stop Count
– Количество запусков и остановок диска. Не критично.
005 Reallocation Sector Count
– Важный атрибут. Количество переназначения нечитаемых (Bad) секторов в резервную область диска.
Сбойный сектор заменяется запасным из резервной области.
При попадании на Bed головка уходит на переназначенный сектор, считывает информацию и возвращается. Операция переназначения называется Remap. Большое количество переназначенных секторов говорит о дефекте поверхности диска и возможно скорой потери данных.
007 Seek Error Rate
– Ошибки позиционирования магнитных головок диска. Вызываются износом механики или поверхности.
008 Seek time Performance
– Как быстро позиционируются головки.
Повышается с износом.
009 Power-On Hours Count
– Время работы диска. В качестве Thresholdвремя наработки
на отказ при тестах производителя.
010 Spin Retry Count
– Счетчик числа повторной попытки раскрутить диск до рабочей скорости. Если таких попыток становиться много, скорый отказ неизбежен.
011 Recalibration Retries
– Счетчик повтора рекалибровки при неудачной первой попытке. Показывает износ механики.
012 Device Power Cycle Count
– Сколько раз включился-выключился диск. Чистая статистика использования.
013 Soft read error rate
– Число программных ошибок при чтении. К механике не имеет отношения и не критичен.
183 SATA Downshift Error Count
– Присутствует у дисков производства Samsung и Western Digital. Информационный параметр, не критичен, но указывает на старение диска.
184 End To End Error Count
– Диск проверяет и сравнивает данные, которые переданы и которые приняты материнской платой. Атрибут выводит количество ошибок сравнения. Не критичен.
187 Reported Uncorrectable Error
– Не восстановимые ошибки. Чем меньше ошибок, тем лучше. Значение ухудшается при износе.
188 Reported Command Timeouts
– Рапорт о задержке команды. Не критичен.
190 Airflow Temperature
– Температура внутри корпуса жесткого диска. Указаны минимальное и максимальное значения.
194 HDA Temperature
– Показания термодатчика внутри корпуса диска, используются для расчета атрибута 190.
195 Hardware ECC Recovered
– Сколько производилось коррекций ошибок аппаратной частью диска. Повышение числа предупреждает о возможном отказе.
196 Reallocation Event Count
– Еще один важный атрибут. Считает удачные и неудачные попытки Remap. Показание растет
даже после полного использования резервной области диска. Критичен.
197 Current Pending Errors Count
– Число секторов диска операции, с которыми выдают ошибки. Программа готовит их для возможного переназначения (Remap). Рост количества секторов сигнализирует о возможном сбое и потере информации.
198 Uncorrectable Errors Count
– Число ошибок обращения к сектору, которые нельзя исправить. Это критично.
199 UltraDMA CRC Errors
– Ошибки контрольной суммы при передаче данных. Говорит скорее о неисправном шлейфе или окисленных контактах разъёма, чем о неисправном диске.
200 Write Error Rate
— Количество ошибок записи на диск. Увеличивается со сроком эксплуатации.
201 Soft Read Error Rate
– Как часто появляются программные ошибки чтения информации. Не критично.
Из описанных параметров можно получить полное представление о состоянии поверхности диска и ресурсе механики.
Если какой либо из критичных параметров достиг значения Threshold
нужно немедленно делать резервную копию информации. При сбоях по критичным атрибутам восстановление утраченных данных крайне затруднено или часто вообще невозможно.
Читайте также: Простой ремонт жесткого диска
И снова здравствуйте. Перевод следующей статьи подготовлен специально для студентов курса «Администратор Linux». Поехали!
Что такое S.M.A.R.T.?
S.M.A.R.T. (расшифровывается как Self-Monitoring, Analysis, and Reporting Technology) – это технология, вшитая в накопители, такие как жесткие диски или SSD. Ее основная задача – это мониторинг состояния.
На деле, S.M.A.R.T. контролирует несколько параметров во время обычной работы с диском. Он мониторит такие параметры как количество ошибок чтения, время запуска диска и даже состояние окружающей среды. Помимо этого, S.M.A.R.T. также может проводить тесты с использованием накопителя.
В идеале, S.M.A.R.T. позволит прогнозировать предсказуемые отказы, такие как отказы, вызванные механическим износом или ухудшением состояния поверхности диска, а также непредсказуемые отказы, вызванные каким-либо неожиданным дефектом. Поскольку обычно диски не выходят из строя внезапно, S.M.A.R.T. помогает операционной системе или системному администратору идентифицировать те диски, которые скоро выйдут из строя, чтобы их можно было заменить и избежать потери данных.
Что не относится к S.M.A.R.T.?
Все это, конечно, круто. Однако S.M.A.R.T. – это не хрустальный шар. Он не может спрогнозировать отказ со стопроцентной вероятностью и не может гарантировать, что накопитель не выйдет из строя без предупреждения. В лучшем случае S.M.A.R.T. стоит использовать для оценки вероятности поломки.
Учитывая статистический характер прогнозирования отказов, технология S.M.A.R.T. особенно интересует компании, использующие большое количество устройств для хранения данных. Чтобы выяснить, насколько точно S.M.A.R.T. может прогнозировать отказы и сообщать о необходимости замены дисков в центрах обработки данных или серверных мейнфреймах, даже проводились специальные исследования.
В 2016 году Microsoft и университет штата Пенсильвания провели исследование, связанное с SSD.
Согласно этому исследованию, некоторые атрибуты S.M.A.R.T. считаются хорошими индикаторами неизбежности отказа. В особенности в статье упоминаются:
Счетчик переназначенных (Realloc) секторов:
Несмотря на то, что основополагающие технологии радикально отличаются, этот показатель остается востребованным как в мире SSD, так и в мире жестких дисков. Стоит отметить, что из-за особенностей алгоритмов балансировки износа, используемых в SSD, когда несколько секторов выходят из строя, то с большой вероятностью можно предположить, что скоро выйдут из строя еще больше.
Ошибки в цикле Program/Erase (P/E):
Это признак проблем с основным оборудованием флеш-памяти, связанных с тем, что диск не может удалить данные из блока или сохранить их там. Дело в том, что процесс производства несовершенен, поэтому появление таких ошибок вполне можно ожидать. Однако флеш-память имеет ограниченное число циклов записи/удаления. По этой причине внезапное увеличение числа событий может сигнализировать о том, что диск достигает своего предела, и вполне ожидаемо, что другие ячейки памяти также начнут выходить из строя.
CRC и неисправимые ошибки («Data Error ”):
События такого типа могут быть вызваны ошибками хранения, либо проблемами с внутренним каналом связи накопителя. Этот индикатор учитывает как исправленные ошибки (без проблем сообщенные хост-системе), так и неисправленные ошибки (из-за которых происходит блокировка диска, сообщившего хост-системе о невозможности чтения). Другими словами, исправляемые ошибки невидимы для операционной системы, тем не менее они влияют на производительность накопителя, увеличивая вероятность переназначения сектора.
SATA downshift count:
Из-за временных помех, проблем с каналом связи между накопителем и хостом или из-за внутренних проблем с накопителем, интерфейс SATA может переключиться на более низкую скорость передачи сигналов. Снижение скорости соединения ниже номинального уровня оказывает очевидное влияние на производительность диска. Таким образом, этот показатель является наиболее значимым, в особенности, когда он коррелирует с наличием одного или нескольких предыдущих показателей.
Согласно исследованию, 62% вышедших из строя SSD показали наличие как минимум одного из вышеприведенных симптомов. С другой стороны можно сказать, что 38% изученных накопителей сломались без индикации этих симптомов. В исследованиях не упоминалось, были ли какие-то еще сообщения об отказах от S. M. A. R. T. по другим «симптомам». По этой причине нельзя напрямую сопоставить эти значения с отказом без предупреждения в 36% случаев из статьи от Google.
В исследовании Microsoft и университета штата Пенсильвания не раскрывались модели исследуемых дисков, однако, по словам авторов, большинство дисков поступают от одного и того же поставщика в течение уже нескольких поколений.
В ходе исследования также были отмечены значительные различия в надёжности между различными моделями. Например, «худшая» изученная модель показывает двадцатипроцентную частоту отказов через 9 месяцев после первой ошибки переназначения и до 36-ти процентов отказов в течение 9 месяцев после первого появления ошибок данных. «Худшей» моделью было названо более старое поколение дисков, рассматриваемых в статье.
С другой стороны, с теми же симптомами, что приведены выше, накопители нового поколения отказали в 3% и 20% в соответствии с теми же ошибками. Трудно сказать, можно ли объяснить эти цифры улучшением конструкции накопителя и производственного процесса, или здесь роль играет эффект устаревания накопителя.
Самое интересное, что упоминается в статье (я уже писал об этом ранее), так это то, что увеличение количества зарегистрированных ошибок может случить тревожным индикатором:
«Существует большая вероятность появления симптомов, предшествующих отказу SSD, которые активно себя проявляют и быстро прогрессируют, сильно сокращая время жизни накопителя до нескольких месяцев.»
Другими словами, одна случайная ошибка, о которой сообщил S.M.A.R.T., определенно не должна рассматриваться как сигнал о неизбежном отказе. Однако, когда исправный SSD начинает сообщать о все большем количестве ошибок, следует ждать краткосрочного или среднесрочного сбоя.
Но как узнать, в каком состоянии сейчас ваш SSD? Для удовлетворения своего любопытства, либо из желания начать внимательно следить за своими накопителями, вы можете использовать инструмент мониторинга smartctl
.
Использование smartctl
для мониторинга состояния вашего SSD в Linux
Чтобы следить за S.M.A.R.T статусом вашего диска, я предлагаю использовать инструмент smartctl
, который является частью пакета smartmontool
(по крайней мере на Debian/Ubuntu).
sudo apt install smartmontools
smartctl
– это инструмент командной строки, но это особенно помогает в случаях, когда вам нужно автоматизировать сбор данных, например, с ваших серверов.
Первый шаг в использовании smartctl
– это проверка того, есть ли на вашем диске S.M.A.R.T. и поддерживается ли он инструментом:
sh$ sudo smartctl -i /dev/sdb
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Seagate Momentus 7200.4
Device Model: ST9500420AS
Serial Number: 5VJAS7FL
LU WWN Device Id: 5 000c50 02fa0b800
Firmware Version: D005SDM1
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: 7200 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 2.6, 3.0 Gb/s
Local Time is: Mon Mar 12 15:54:43 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Как видите, мой внутренний жесткий диск ноутбука действительно поддерживает S.M.A.R.T. и он включен. Итак, как теперь получить S.M.A.R.T статус? Есть ли какие-то зафиксированные ошибки?
Выдача отчета «о всей S.M.A.R.T. информации о диске» — это опция -a
:
sh$ sudo smartctl -i -a /dev/sdb
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Seagate Momentus 7200.4
Device Model: ST9500420AS
Serial Number: 5VJAS7FL
LU WWN Device Id: 5 000c50 02fa0b800
Firmware Version: D005SDM1
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: 7200 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 2.6, 3.0 Gb/s
Local Time is: Mon Mar 12 15:56:58 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 0) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 110) minutes.
Conveyance self-test routine
recommended polling time: ( 3) minutes.
SCT capabilities: (0x103f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 111 099 006 Pre-fail Always - 29694249
3 Spin_Up_Time 0x0003 100 098 085 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 095 095 020 Old_age Always - 5413
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 3
7 Seek_Error_Rate 0x000f 071 060 030 Pre-fail Always - 51710773327
9 Power_On_Hours 0x0032 070 070 000 Old_age Always - 26423
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 096 037 020 Old_age Always - 4836
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 072 072 000 Old_age Always - 28
188 Command_Timeout 0x0032 100 096 000 Old_age Always - 4295033738
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 056 042 045 Old_age Always In_the_past 44 (Min/Max 21/44 #22)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 184
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 104
193 Load_Cycle_Count 0x0032 001 001 000 Old_age Always - 395415
194 Temperature_Celsius 0x0022 044 058 000 Old_age Always - 44 (0 13 0 0 0)
195 Hardware_ECC_Recovered 0x001a 050 045 000 Old_age Always - 29694249
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 1
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 25131 (246 202 0)
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 3028413736
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1613088055
254 Free_Fall_Sensor 0x0032 100 100 000 Old_age Always - 0
SMART Error Log Version: 1
ATA Error Count: 3
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 3 occurred at disk power-on lifetime: 21171 hours (882 days + 3 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 08 ff ff ff 4f 00 00:45:12.580 READ FPDMA QUEUED
60 00 08 ff ff ff 4f 00 00:45:12.580 READ FPDMA QUEUED
60 00 08 ff ff ff 4f 00 00:45:12.579 READ FPDMA QUEUED
60 00 08 ff ff ff 4f 00 00:45:12.571 READ FPDMA QUEUED
60 00 20 ff ff ff 4f 00 00:45:12.543 READ FPDMA QUEUED
Error 2 occurred at disk power-on lifetime: 21171 hours (882 days + 3 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 ff ff ff 4f 00 00:45:09.456 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:45:09.451 READ FPDMA QUEUED
61 00 08 ff ff ff 4f 00 00:45:09.450 WRITE FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:45:08.878 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:45:08.856 READ FPDMA QUEUED
Error 1 occurred at disk power-on lifetime: 21131 hours (880 days + 11 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 ff ff ff 4f 00 05:52:18.809 READ FPDMA QUEUED
61 00 00 7e fb 31 45 00 05:52:18.806 WRITE FPDMA QUEUED
60 00 00 ff ff ff 4f 00 05:52:18.571 READ FPDMA QUEUED
ea 00 00 00 00 00 a0 00 05:52:18.529 FLUSH CACHE EXT
61 00 08 ff ff ff 4f 00 05:52:18.527 WRITE FPDMA QUEUED
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 10904 -
# 2 Short offline Completed without error 00% 12 -
# 3 Short offline Completed without error 00% 0 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Понимание выходных данных команд smartctl
На выходе получается много информации, которую не всегда легко понять. Наиболее интересной, вероятно, является та часть, которая помечена как “Vendor Specific SMART Attributes with Thresholds”. Она сообщает различные статистические данные, собранные S.M.A.R.T. устройством, и позволяет сравнить эти значения (текущие или худшие за все время) с некоторым порогом, определенным поставщиком.
Например, вот мои отчеты о переназначенных секторах на диске:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 3
Вы можете заметить атрибут «Pre-fail». Он означает, что значение является аномальным. Таким образом, если значение превышает пороговое, велика вероятность сбоя. Другая категория »Old_age» используется для атрибутов, отвечающих значениям «нормального износа».
Последнее поле (здесь со значением «3») соответствует исходному значению атрибута, которое сообщает диск. Обычно это число имеет физическое значение. Здесь это фактическое количество переназначенных секторов. Для других атрибутов это может быть температура в градусах Цельсия, время в часах или минутах или количество раз, когда для диска было выполнено определенное условие.
В дополнение к исходному значению, диск с поддержкой S.M.A.R.T. должен сообщать «нормализованные значения» (значения полей, самые худшие и пороговые). Эти значения нормируются в диапазоне 1-254 (0-255 для пороговых значений). Прошивка диска выполняет эту нормализацию с помощью некоторого внутреннего алгоритма. Кроме того, разные производители могут нормализовать один и тот же атрибут по-разному. Большинство значений представлены в процентах, причем чем выше, тем лучше, но так бывает не всегда. Когда параметр ниже или равен пороговому значению, указанному производителем, диск считается неисправным в терминах этого атрибута. Помня о всех указаниях из первой части статьи, когда атрибут, показывающий ранее значение “pre-fail” все-таки дал сбой, наиболее вероятно, что скоро диск выйдет из строя.
В качестве второго примера возьмем “seek error rate”:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
7 Seek_Error_Rate 0x000f 071 060 030 Pre-fail Always - 51710773327
На самом деле (и это основная проблема отчетности S.M.A.R.T.), точное значение полей каждого атрибута понимает только поставщик. В моем случае Seagate использует логарифмическую шкалу для нормализации значения. Таким образом, «71» означает примерно одну ошибку на 10 миллионов запросов (10 в степени 7,1). Забавно, что самым худшим показателем за все время была одна ошибка на 1 миллион запросов (10 в 6-й степени).
Если я правильно понимаю, то это значит, что головки моего диска сейчас расположены точнее, чем раньше. Я не следил за этим диском внимательно, поэтому анализирую полученные данные весьма субъективно. Возможно накопитель просто надо было немного «обкатать» с тех пор как он был введен в эксплуатацию? Или может быть это следствие механического износа деталей и, следовательно, теперь имеет место меньшая сила трения? В любом случае, какова бы ни была причина, это значение является скорее показателем производительности, чем ранним предупреждением об ошибке. Так что меня оно не сильно беспокоит.
Помимо вышеприведенного и трех крайне подозрительных ошибок, записанных около шести месяцев назад, этот диск находится в удивительно хорошем состоянии (по данным S.M.A.R.T.) для стокового диска ноутбука, проработавшего более 1100 дней (26423 часа).
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
9 Power_On_Hours 0x0032 070 070 000 Old_age Always - 26423
Из любопытства я провел этот же тест на гораздо более новом ноутбуке, оснащенном SSD:
sh$ sudo smartctl -i /dev/sdb
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: TOSHIBA THNSNK256GVN8
Serial Number: 17FS131LTNLV
LU WWN Device Id: 5 00080d 9109b2ceb
Firmware Version: K8XA4103
User Capacity: 256 060 514 304 bytes [256 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: Solid State Device
Form Factor: M.2
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-3 (minor revision not indicated)
SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Mar 13 01:03:23 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Первое, что бросается в глаза, так это то, что несмотря на наличие S.M.A.R.T., устройства нет в базе данных smartctl
. Но это не помешает инструменту собирать данные с SSD, однако он не сможет сообщить точные значения различных атрибутов, специфичных для поставщика:
sh$ sudo smartctl -a /dev/sdb
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 120) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 11) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000a 100 100 000 Old_age Always - 0
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0x0007 100 100 050 Pre-fail Always - 0
5 Reallocated_Sector_Ct 0x0013 100 100 050 Pre-fail Always - 0
7 Unknown_SSD_Attribute 0x000b 100 100 050 Pre-fail Always - 0
8 Unknown_SSD_Attribute 0x0005 100 100 050 Pre-fail Offline - 0
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 171
10 Unknown_SSD_Attribute 0x0013 100 100 050 Pre-fail Always - 0
12 Power_Cycle_Count 0x0012 100 100 000 Old_age Always - 105
166 Unknown_Attribute 0x0012 100 100 000 Old_age Always - 0
167 Unknown_Attribute 0x0022 100 100 000 Old_age Always - 0
168 Unknown_Attribute 0x0012 100 100 000 Old_age Always - 0
169 Unknown_Attribute 0x0013 100 100 010 Pre-fail Always - 100
170 Unknown_Attribute 0x0013 100 100 010 Pre-fail Always - 0
173 Unknown_Attribute 0x0012 200 200 000 Old_age Always - 0
175 Program_Fail_Count_Chip 0x0013 100 100 010 Pre-fail Always - 0
192 Power-Off_Retract_Count 0x0012 100 100 000 Old_age Always - 18
194 Temperature_Celsius 0x0023 063 032 020 Pre-fail Always - 37 (Min/Max 11/68)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
240 Unknown_SSD_Attribute 0x0013 100 100 050 Pre-fail Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Выше вы видите выходные данные абсолютно нового SSD. Данные понятны даже в случае отсутствия нормализации или метаинформации для данных конкретного поставщика, как в моем случае с “Unknown_SSD_Attribute.” Я могу только надеяться, что в последующих версиях smartctl
в базе данных появятся данные об этой модели диска, и я смогу лучше определять потенциальные проблемы.
Проверьте свой SSD в Linux с помощью smartctl
До сих пор мы рассматривали данные, собранные во время нормальной работы накопителя. Однако протокол S.M.A.R.T. также поддерживает несколько команд для автономного тестирования для запуска диагностики по требованию.
Автономное тестирование может проводиться во время обычных операций с диском, если не было указано иное. Поскольку тест и запросы ввода-вывода хоста будут конкурировать, производительность диска упадет на время теста. Спецификация S.M.A.R.T. определяет несколько видов автономного тестирования:
Короткое автономное тестирование (-t short
)
Такой тест проверит электрическую и механическую, производительность, а также производительность чтения диска. Короткое автономное тестирование обычно занимает всего несколько минут (обычно от 2 до 10).
Расширенное автономное тестирование (-t long
)
Этот тест занимает почти в два раза больше времени. Как правило, это просто более детальная версия короткого автономного тестирования. Кроме того, этот тест будет сканировать всю поверхность диска на наличие ошибок данных без ограничения по времени. Продолжительность теста будет пропорциональна размеру диска.
Транспортировочное автономное тестирование (-t conveyance
)
Этот тестовый набор предложен в качестве сравнительно быстрого способа проверки на возможные повреждения, возникшие во время транспортировки устройства.
Вот примеры, взятые с тех же дисков, что были выше. Я предлагаю вам угадать, где какой:
sh$ sudo smartctl -t short /dev/sdb
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Mon Mar 12 18:06:17 2018
Use smartctl -X to abort test.
Сейчас производится проверка. Давайте дождемся завершения, чтобы посмотреть результат:
sh$ sudo sh -c 'sleep 120 && smartctl -l selftest /dev/sdb'
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 171 -
Проведем тот же тест на другом диске:
sh$ sudo smartctl -t short /dev/sdb
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Mon Mar 12 21:59:39 2018
Use smartctl -X to abort test.
И еще раз, отправим в сон на две минуты и посмотрим результат:
sh$ sudo sh -c 'sleep 120 && smartctl -l selftest /dev/sdb'
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 26429 -
# 2 Short offline Completed without error 00% 10904 -
# 3 Short offline Completed without error 00% 12 -
# 4 Short offline Completed without error 00% 0 -
Интересно, что в этом случае мы видим, что производители диска и компьютера, похоже, уже тестировали диск (на времени жизни в 0 часов и 12 часов). Я сам определенно был гораздо менее озабочен состоянием диска, чем они. Итак, поскольку я уже показал быстрые тесты, то и расширенный тоже запущу, чтобы посмотреть как это происходит.
sh$ sudo smartctl -t long /dev/sdb
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 110 minutes for test to complete.
Test will complete after Tue Mar 13 00:09:08 2018
Use smartctl -X to abort test.
Судя по всему на этот раз ждать придется гораздо дольше, чем при проведении короткого теста. Так что давайте посмотрим:
sh$ sudo bash -c 'sleep $((110*60)) && smartctl -l selftest /dev/sdb'
[sudo] password for sylvain:
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 20% 26430 810665229
# 2 Short offline Completed without error 00% 26429 -
# 3 Short offline Completed without error 00% 10904 -
# 4 Short offline Completed without error 00% 12 -
# 5 Short offline Completed without error 00% 0 -
В последнем тесте обратите внимание на различие в результатах, полученных с помощью короткого и расширенного теста, даже если они были выполнены один за другим. Ну, возможно, этот диск не в таком уж и хорошем состоянии! Отмечу, что тест остановился после первой ошибки чтения. Поэтому, если вы хотите получить исчерпывающую информацию обо всех ошибках чтения, вам придется продолжать тест после каждой ошибки. Я призываю вас взглянуть на одну очень хорошо написанную страницу руководства smartctl(8) для получения дополнительной информации о параметрах -t select
, N-max
и -t select
, чтобы уметь делать так:
sh$ sudo smartctl -t select,810665230-max /dev/sdb
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Selective self-test routine immediately in off-line mode".
SPAN STARTING_LBA ENDING_LBA
0 810665230 976773167
Drive command "Execute SMART Selective self-test routine immediately in off-line mode" successful.
Testing has begun.
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Selective offline Completed without error 00% 26432 -
# 2 Extended offline Completed: read failure 20% 26430 810665229
# 3 Short offline Completed without error 00% 26429 -
# 4 Short offline Completed without error 00% 10904 -
# 5 Short offline Completed without error 00% 12 -
# 6 Short offline Completed without error 00% 0 -
Заключение
Определенно, S.M.A.R.T. – это именно та технология, которую стоит добавить в свой инструментарий для мониторинга работоспособности дисков ваших серверов. Вам также стоит взглянуть на S.M.A.R.T. Disk Monitoring Daemon smartd(8), который может помочь вам автоматизировать мониторинг с помощью отчетов системного журнала.
Учитывая статистическую природу прогнозирования сбоев, я не уверен, что агрессивный S.M.A.R.T. мониторинг будет сильно полезен на персональных компьютерах. Помните, что каким бы ни был накопитель, однажды он все равно выйдет из строя – и, как мы видели ранее, в одной трети случаев он сделает это без предупреждения. Поэтому ничто не обеспечит целостность ваших данных лучше, чем RAID технология и резервные копии!
До встречи на курсе, друзья!
Атрибут: 01 Raw Read Error Rate
Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.
Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.
Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.
Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.
Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).
На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.
Атрибут: 02 Throughput Performance
Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 03 Spin-Up Time
Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.
Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.
Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.
Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)
При оценке здоровья не обращайте на атрибут внимания.
Атрибут: 05 Reallocated Sector Count
Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение, а используемый вместо повреждённого сектор — переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.
Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.
Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.
На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет
Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?
Атрибут: 07 Seek Error Rate
Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.
Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.
Атрибут: 08 Seek Time Performance
Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 09 Power On Hours Count (Power-on Time)
Ничего не говорит о здоровье диска.
Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count
О здоровье диска чаще всего не говорит.
Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.
В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.
Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь
Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)
Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.
Атрибут: 12 (0C) Power Cycle Count
Не связан с состоянием диска.
Атрибут: 183 (B7) SATA Downshift Error Count
Не говорит о здоровье накопителя. содержит количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута
Атрибут: 184 (B8) End-to-End Error
Ненулевое значение указывает на проблемы с диском.
Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)
Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).
Атрибут: 188 (BC) Command Timeout
Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.
Атрибут: 190 (BE) Airflow Temperature
содержит температуру винчестера для дисков Hitachi, Samsung, WD и значение «100 − [RAW-значение атрибута 194]» для Seagate. Не говорит о состоянии диска.
Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)
Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.
Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.
Не говорит о здоровье диска.
Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)
Не позволяет судить о состоянии диска.
Атрибут: 193 (С1) Load/Unload Cycle Count
Не говорит о здоровье диска.
Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)
О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.
Атрибут: 195 (С3) Hardware ECC Recovered
содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска. Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.
Атрибут: 196 (С4) Reallocated Event Count
Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.
Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.
Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.
Атрибут: 197 (С5) Current Pending Sector Count
Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.
При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.
Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.
Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).
При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.
Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
означает то же самое, что и атрибут 197, но отличие в том, что данный атрибут содержит количество секторов-кандидатов, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой. Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197. Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).
Атрибут: 199 (С7) UltraDMA CRC Error Count
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.
Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).
В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.
Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.
Можно считать, что о здоровье диска атрибут не говорит.
Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)
содержит частоту возникновения ошибок чтения, произошедших по вине программного обеспечения. Влияние на здоровье неизвестно.
Атрибут: 202 (СА) Data Address Mark Error
содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо
Атрибут: 203 (CB) Run Out Cancel
Влияние на здоровье неизвестно.
Атрибут: 220 (DC) Disk Shift
Влияние на здоровье неизвестно.
Атрибут: 254 (FE) Free Fall Event Count
содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал. Влияние на здоровье неизвестно.
Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.
Источник
Привет друзья! В предыдущей статье с Вами узнали о лучшей программе по диагностике и ремонту жёстких дисков под названием Victoria. Также мы теперь знаем, что такое S.M.A.R.T. и о чём говорят его атрибуты, как за секунду определить состояние здоровья Вашего винчестера или твердотельного накопителя SSD. В этой статье мы переходим к самому главному, а именно процессу восстановления информации на жёстких дисках и избавления винчестера от сбойных секторов (бэд-блоков), но перед началом статьи я хочу предупредить Вас. Столкнувшись с неудовлетворительной работой жёсткого диска (скрипы, щёлкания, зависания операционной системы, невозможность скопировать важные данные) простые пользователи без соответствующего опыта сразу обращаются к таким серьёзным программам, как Victoria, MHDD, HDDScan и к сожалению, зачастую только ухудшают ситуацию. Почему? Я Вам отвечу.
Очень много того, что написано о Виктории в интернете, — написано непрофессионалами, а любителями. Профессионалы редко пишут статьи, они в этом отношении немного ленивые. Если Вы хотите узнать о программе Victoria всё, нужно много работать с этой программой самому и посещать специализированные форумы в интернете касающиеся расшифровки показателей S.M.A.R.T., восстановлению данных (создание посекторного образа больного винта с бэдами), и уже в последнюю очередь там обсуждают механизм работы программы Виктория. Именно такая последовательность в большинстве случаев правильная — сначала спасение данных (снятие посекторного образа с неисправного винчестера), затем лечение жёсткого диска.
- Запомните, самое главное правило при восстановлении информации с неисправного жёсткого диска, да и любого накопителя информации звучит так: винчестер в любой момент может «приказать долго жить», поэтому число обращений к нему должно быть сведено к минимуму. А значит, перед работой с Victoria нужно обязательно делать образ «больного» жёсткого диска и восстанавливать информацию уже с образа, как только информация будет восстановлена, тогда можно проводить какие-то операции с жёстким диском, к примеру лечить его алгоритмами Advanced REMAP или Erase.
Поэтому в нашей сегодняшней статье много информации не только о программе Victoria, но и о программе DMDE, при помощи которой мы и будем создавать посекторный образ неисправного жёсткого диска, это тоже нужно сделать правильно, дабы пользовательские данные не пропали. Не спорю, многим читателям, читающим сейчас эти строки, информация на жёстком диске может быть и не нужна, они просто хотят подлечить свой винчестер от сбойных секторов (бэд-блоков) и запустить его обратно в эксплуатацию, дабы сэкономить деньги и не покупать новый жёсткий диск. В этом случае, они просто могут пропустить некоторые части статьи.
Друзья, если Вы читаете эти строки, значит у Вас какая-то проблема с жёстким диском. Когда мы задумываемся о том, что с нашим жёстким диском происходит что-то не то?
-
С жёсткого диска невозможно скопировать нужную информацию на другой накопитель, при копировании операционная система зависает и спасает только перезагрузка.
-
Windows может неожиданно зависнуть на любом этапе работы.
-
Невозможно переустановить операционную систему, в процессе установки происходит зависание на распаковке файлов Windows или установщик сообщает об ошибке «Невозможно продолжить установку…», или Windows очень долго устанавливается, например несколько часов.
-
При включении компьютера сразу запускается утилита Chkdsk и проверяет разделы жёсткого диска на ошибки.
-
Жёсткий диск издаёт посторонние звуки (щелчки, скрип) и периодически не определяется в BIOS.
Итак, поехали, во-первых, в программе Виктория точно установим номера сбойных секторов (бэд-блоков), затем сделаем посекторную копию жёсткого диска и этим спасём пользовательские данные, а дальше произведём скрытие сбойных секторов бэд-блоков (рэмап) в программе Victoria. Также узнаем, как делать «Запись по всей поляне» (тест Erase), то есть при обнаружении сбойного сектора переписывать весь блок (256 секторов) жёсткого диска нулями.
Примечание: если вы не читали первую статью из нашей серии о программе Виктория, то вам будет не всё понятно, поэтому я рекомендую сначала прочитать начальную статью, затем переходить к этой. В данный момент вы читаете вторую статью, но есть ещё статьи:
Для примера возьмём реальный жёсткий диск, имеющий сбойные сектора. Друзья, минимальная единица информации на жёстком диске, это сектор, объём пользовательских данных составляет 512 байт, если информацию в секторе невозможно прочесть, значит сектор является нечитаемым или другими словами сбойным. Все зависания операционной системы происходят при чтении инфы с такого сектора. Данный винчестер WDC WD5000AAKS-00A7B2 (объём 500 ГБ) реально неисправен.
Операционная система на нём постоянно зависает и периодически при загрузке запускается проверка жёсткого диска на ошибки. Последней каплей для хозяина винчестера стало то, что не получалось скопировать важные данные на другой диск и даже переустановка операционной системы закончилась очередным зависанием на распаковке файлов Windows, замена установочного диска с операционкой ничего не дала, зависание повторилось на другом этапе установки. Вот тогда и встал вопрос о том, что делать с этим жёстким диском, ведь на одном из разделов находились важные данные и их нужно было скопировать.
Запускаем программу Victoria от имени администратора. Соглашаемся со всеми предупреждениями о работе в 64-битной системе.
Выбираем начальную вкладку Standard. Если у нас несколько жёстких дисков, в правой части окна выделяем левой мышью нужный жёсткий диск, в нашем случае WDC WD5000AAKS-00A7B2
и переходим на вкладку SMART,
жмем кнопку Get SMART, справа от кнопки засветится сообщение GOOD и откроется S.M.A.R.T. выбранного нами жёсткого диска.
S.M.A.R.T. этого винта оказался не самый хороший. Почему? Читайте нашу первую статью из цикла о программе Виктория. Здесь скажу лишь, что целых четыре атрибута S.M.A.R.T. горят красным, в том числе и самый важный параметр, атрибут
5 Reallocated Sector Count— (remap), обозначающий число переназначенных секторов это значит запасные сектора на резервных дорожках заканчиваются и скоро сбойные сектора переназначать будет нечем.
Переходите на вкладку Tests.
В правой части окна программы отметьте пункт Ignor и пункт read, затем нажмите Start. Запустится простой тест поверхности жёсткого диска без исправления ошибок. Этот тест не принесёт никаких плохих или хороших воздействий на Ваш винчестер, но когда тест закончится, мы узнаем в каком состоянии находится наш жёсткий диск.
Начинается сканирование поверхности жёсткого диска и через некоторое время обнаруживаются сбойные сектора. Через 40 минут Victoria выдаёт нам такой результат:
-
Очень много хороших секторов с хорошей задержкой чтения не более 5 ms — 3815267
-
Также имеются сектора с нехорошей задержкой чтения 200 ms
-
Секторов с неудовлетворительной задержкой чтения более 600 ms (кандидаты в бэд-блоки) нет совсем, но…
-
Что совсем плохо, присутствуют полноценные сбойные сектора (бэд-блоки), информацию из которых прочитать совсем не удалось — 13!
13 сбойных секторов (бэд-блоков), все они начинаются в области 6630400, а заканчиваются на 980000000, то есть рассыпаны по всему жёсткому диску. Номера бэд-блоков нужно записать. Друзья, вполне возможно все наши проблемы с жёстким диском могут быть из-за этих 13 бэдов и от них нужно избавиться, но сначала сделаем посекторный образ больного винта.
Жёсткий диск пострадавшего WDC WD5000AAKS-00A7B2 (объём 500 ГБ) был разделён на два раздела: диск D: с операционной системой объём 120 ГБ и диск E: с данными объём 345 ГБ.
Перед работой с программой Victoria обезопасим себя и сделаем полный образ раздела диск E: объём 345 ГБ и данные будем вытаскивать именно с образа. Образ сделаем в другой программе DMDE и расположим его на другом физическом диске SAMSUNG HD403LJ (объём 400 ГБ) я покажу Вам как это сделать.
Управление дисками моего компьютера
Важные данные находятся на Новом томе (E:) объём 347 ГБ жёсткого диска WDC WD5000AAKS (общий объём 500 ГБ), значит создавать будем образ раздела (E:). Посекторный образ раздела (E:) создадим на жёстком диске SAMSUNG HD403LJ (объём 400 ГБ), на нём всего один раздел без данных Новый том (F:). Третий физический диск в системе, это твердотельный накопитель SSD (объём 120 ГБ) диск (C:), на нём находится наша работающая операционная система Windows 8.1, в которой мы сейчас и находимся.
И скачиваем программу, жмём GUI для Windows.
DMDE скачивается в архиве, разархивируем его и запускаем файл dmde.exe.
Затем выбираем язык Русский.
Принимаем условия Лицензионного соглашения. В начальном окне программы нам нужно для создания образа выбрать или Физическое устройство (то есть полностью жёсткий диск) или раздел с данными.
Нужен нам только том (E:), поэтому отмечаем левой мышью наш жёсткий диск WDC WD5000AAKS, затем отмечаем пункт Логические диски
и раздел (E:), затем жмём ОК.
Меню. Создать образ/клон…
Место для записи, жмём Диск.
Новый том (F:) и ОК. Нужно чтобы раздел, на котором будет создан посекторный образ неисправного жёсткого диска (или раздела с нечитаемыми данными) был по объёму не меньше этого диска.
ОК.
На новом томе (F:) удалятся все данные, соглашаемся Да.
Начинается создание посекторной копии раздела (E:) больного жёсткого диска WDC WD5000AAKS на новом томе (F:) другого здорового жёсткого диска диска SAMSUNG HD403LJ, которое продолжается 6 часов (с особо «бэдастых» винтов образ снимается несколько суток) и наглухо зависает на 83 процентах, прождав пару часов я нажал на кнопку Прервать! Друзья, если прервать создание образа посекторного раздела под самый конец (всё-таки 83%) то нас ждёт два варианта, как говаривал Суворов — «либо грудь в крестах, либо голова в кустах».
После прерывания операции заходим на Новый том (F:) и смотрим, есть ли на нём какие-либо данные и…они есть, всё основное, что нам было нужно программе DMDE удалось перенести на диск (F:), практически все данные читаются без ошибок. Значит случай у нас не сложный и бэды в основном софтовые.
Но в некоторых случаях не всё так будет радужно и при попытке войти на раздел с посекторной копией нас будет ждать вот эта ошибка: Нет доступа к F:. Файл или папка повреждены. Чтение невозможно.
Нет доступа к F:. Файловая система не распознана. Убедитесь, что все требуемые системные драйвера загружены и том не повреждён.
Но и в этом случае сдаваться мы не будем и поступим так.
Друзья, не всегда процесс создания посекторной копии заканчивается успешно даже по истечении нескольких часов, но если прекратить создание посекторной копии данные в ней могут оказаться нечитаемые.
Или в процессе создания посекторной копии появится вот такая ошибка «Запрос не был выполнен из-за ошибки ввода/вывода на устройстве» (смотрите скришнот ниже) обозначающая, что DMDE не смогла прочитать информацию в сбойном секторе (номер сектор указан в ошибке) в этом случае нажмите
«Повторить», произойдёт повторная попытка считывания информации с данного сектора и она может закончится успехом. Если данная ошибка с этим же сектором появится опять, тогда нажмите
«Игнорировать» и создание посекторного образа продолжится, но информацию в этом секторе мы потеряем и в результате в посекторной копии не откроется один какой-либо файл. Если ошибка «Запрос не был выполнен из-за ошибки ввода/вывода на устройстве» будет появляться слишком часто, можно выбрать
«Игнорировать всё» и подобные ошибки будут пропущены, а можно нажать кнопку
«Параметры» и соответствующе настроить программу DMDE для такого тяжёлого случая. Нажмите в этом окне кнопку Параметры.
В параметрах нужно быть внимательным, так как настроить здесь можно много чего. Например заставить DMDE создавать посекторный образ с жёсткого диска не с начала, а с конца, для этого нужно отметить пункт
«Обратный ход», иногда это приносит результат.
И опять нажмите «Параметры».
В этом окне отметьте пункт «Не ждать, если устройство не готово — Всегда». При выборе опции операция будет продолжена даже
в случае ошибки, связанной с отсутствием готовности устройства. Если не отметить эту опцию, то на некоторых «бэдастых» винчестерах будет выводиться предупреждение с ожидаемой реакцией пользователя, то есть на автомате создание образа происходить не будет.
Число повторов авто при ошибке CRC — 0
Число авто повторов, если сектор не найден — 0
Заполнять плохие секторы (hex)
Затем ОК и ОК, начинается создание посекторного образа.
Щёлкните левой мышью для увеличения изображения
Также работоспособным показал себя такой вариант настроек.
Пропускать ошибки ввода-вывода — Всегда
Не ждать, если устройство не готово — Всегда
Число повторов при ошибке CRC — 0
Число авто повторов, если сектор не найден — 0
Вообще я Вам посоветую изучить мануал к программе DMDE http://dmde.ru/manual.html или http://dmde.ru/docs/DMDE-manual-ru.pdf, так же можете дождаться нашей статьи о создании посекторного образа неисправного жёсткого диска различными программами, в ней мы рассмотрим даже создание загрузочной флешки с программой DMDE.
- Если DMDE Вам не поможет, тогда можно попробовать другие программы, например Acronis True Image. Конечно, существуют ещё способы, с помощью которых можно сделать посекторный образ сбойного винта, например загрузиться с какой-нибудь операционной системы, основанной на Linux, к примеру Ubuntu, но сам процесс описывать здесь не буду и лучше напишу отдельную статью. Также под Линуксом можно запустить утилиту safecopy..
- Что делать, если всё же посекторную копию жёсткого диска Вам сделать не удастся, выбирать Вам. Можете обратиться в хороший и зарекомендовавший себя сервис по восстановлению данных и посекторную копию с Вашего жёсткого диска снимут на специальном дорогостоящем оборудовании специалисты, например с помощью того же комплекса PC−3000. Если Вам не жалко Ваши данные, то можете рискнуть и запустить в программе Victoria алгоритмы, избавляющие поверхность Вашего жёсткого диска от сбойных секторов (бэд-блоков), как это сделать написано далее, жёсткий диск после этой операции может вернуться к жизни.
- Важно: Казанский (разработчик программы Виктория) обещает, что самый новаторский алгоритм скрытия бэд-блоков BB = Advanced REMAP НЕ деструктивен для данных, но в некоторых случаях для Ваших файлов это может быть деструктивно, так как даже самый продвинутый алгоритм Виктории Advanced REMAP скрытие дефектов (ремап), это по любому изменение трансляции винта, а значит потеря пользовательских данных (подробности далее. Хочу сказать, что иногда бывало и так, что вылечит Victoria жёсткий диск от бэдов и Вам даже удастся скопировать инфу с такого харда, но к сожалению не вся информация получается читаемая.
Итак, в нашем случае сделать посекторную копию больного жёсткого диска, а именно нового тома (E:) программе DMDE сделать удалось, правда в некоторых местах DMDE немного зависала, но всё закончилось успешно. Посекторная копия нового тома (E:) представляет из себя точную копию и расположена на томе (F:). Все имеющиеся данные успешно читаются и копируются.
Основная задача решена и пользовательские данные спасены, теперь приступаем к процедуре лечения жёсткого диска.
Друзья, давайте теперь представим, что у нас не получилось сделать посекторный образ жёсткого диска с бэд-блоками и мы ничего другого не придумали и решили избавить наш хард от бэдов в программе Victoria, в надежде на то, что после скрытия сбойных секторов нам удастся прочитать и скопировать информацию на жёстком диске.
Примечание: избавить винт от бэдов в работающей Windows трудно, тем более, если к примеру у Вас ноутбук с одним жёстким диском и на этом же жёстком диске установлена операционная система и Вы эту же операционную хотите излечить от бэд-блоков. В таких случаях создают загрузочную флешку с Викторией, загружают с неё ноутбук и избавляются от сбойных секторов. Предлагаю создать загрузочную флешку в следующей статье, а сейчас мы узнаем как это делается прямо в работающей операционной системе, я Вам всё продемонстрирую.
Remap
В главном окне Виктории отмечаем пункт Remap, обозначающий алгоритм переназначения бэд-блоков секторами с резервных дорожек в процессе сканирования. Тест в режиме чтения Read, то есть от начала к концу и жмём на кнопку Start.
Пока идёт сканирование поговорим вот о чём.
1. Что происходит при данном алгоритме Remap? Производится (несколько раз) попытка принудительной записи информации в сбойный сектор жёсткого диска, если попытка удачна, значит сектор становится здоровым и удаляется из списка бэд-блоков (ремап не происходит). Если попытка записи неудачна, значит больной сектор переназначается здоровым сектором со специально предназначенной для таких случаев резервной дорожки винчестера.
2. Remap это переназначение (замена) больного сектора, присвоение его номера LBA другому физически здоровому сектору из резервной дорожки. Информация из сектора (на момент переназначения) висит в ОЗУ винта, и как только сектор переназначен — записывается назад.
Remap в основном не деструктивен для информации, если Ваши данные и потеряются, то только в одном сбойном секторе, но согласитесь, данные в бэд-блоке и так были нечитаемы. Во втором случае данные будут просто перенесены на сектор с резервной дорожки.
Результат. Как я и говорил в работающей Windows трудно что-либо исправить и Victoria не может осуществить Ремап. Через 20 минут тот же самый результат, 13 бэд-блоков и нам с Вами придётся делать загрузочную флешку с Викторией и работать в ДОСе.
Как в программе Victoria сканировать определённую область на жёстком диске
Если Вам известны точные адреса сбойных секторов, вы можете задать в программе Victoria точные параметры сканирования. Например, мы знаем, что наши бэд-блоки начинаются с сектора 770 000 000, тогда в пункте Start LBA: здесь задать это число и программа Victoria именно с сектора 770 000 000 начнёт сканирование и исправление поверхности жёсткого диска, также, если задать нужное Вам число в пункте End LBA: то Victoria закончит сканирование на нужном Вам секторе.
Алгоритм Erase
Друзья, вы можете спросить меня, а что будет если применить тест Erase или ещё есть Write?
Erase при обнаружении нечитаемого сектора принудительно переписывает весь блок из 256 секторов нулями (осторожно, в некоторых случаях ваши данные на жёстком диске удалятся).
- Чаще всего попадаются софтовые (программные) бэды, которые убираются быстрее всего обнулением — алгоритмом Erase, да и при неудачной записи в сектор нулей вполне может произойти Remap, так как микропрограмма винчестера может посчитать такой сектор сбойным. Если Erase не поможет, тогда можно выбрать Remap, но как мы знаем, шансы, что Remap будет произведён в работающей Windows невелики.
- Софтовые (программные) бэды в некоторых случаях можно убрать даже простым форматированием средствами самой Windows. Всю разницу между существующими бэд-блоками: физическими и программными, читайте в нашей статье всё о бэд-блоках. В двух словах объясню, что физические бэды (физически разрушившийся сектор) восстановить невозможно (возможен только ремап, переназначение), а логические (программные, ошибки логики сектора) восстановить можно.
- Друзья, мы можем избавиться от бэд-блоков посекторно, но тогда наша статья будет ещё длиннее, это мы тоже сделаем в следующей статье.
Мне не хочется ставить эксперимент над нашим жёстким диском WDC WD5000AAKS, так как я планирую в следующей статье вылечить его от бэд-блоков в ДОС режиме с помощью загрузочной флешки с программой Виктория и всё таки вернуть хозяину вылеченный от бэдов жёсткий диск с неповреждёнными данными.
Я просто покажу Вам на другом винчестере как запустить этот тест в работающей Windows.
В главном окне Виктории выбираем наш жёсткий диск и идём на вкладку Tests отмечаем пункт Erase (осторожно, в некоторых случаях ваши данные на жёстком диске удалятся) — при обнаружении нечитаемого сектора принудительно переписывает весь блок из 256 секторов нулями, естественно информация при этом в целом блоке секторов полностью теряется, но если перезапись происходит, блок возвращается в работу (становится здоровым).
Тест в режиме чтения Read, то есть от начала к концу и жмём Start.
Часто при «обнулении» в работающей Windows будут выходить вот такие ошибки:
Block (номер сбойного сектора) try Erase 256 sectors. Переписать блок секторов не удалось.