Защо твърдият ми диск се повреди или се срине толкова бързо и без видима причина?

Смята се, че над 90% от цялата нова информация, произведена в света, се съхранява на магнитни носители, повечето от тях на твърди дискове. Въпреки важността им, има сравнително малко публикувани работи относно моделите на откази на дисковите устройства(failure patterns of disk drives) и ключовите фактори, които влияят на техния живот. Повечето налични данни се основават или на екстраполация от експерименти за ускорено стареене или от сравнително скромни полеви проучвания.

Защо твърдият ми диск се повреди или се срине

Освен това по-големите проучвания на населението рядко разполагат с инфраструктура за събиране на здравни сигнали от работещи компоненти, което е критична информация за подробен анализ на неизправността.

Според проучване на около 100 000 устройства, проведено от университета Карнеги Мелън(Carnegie Mellon University) , клиентите сменят дисковите устройства със скорост, далеч по-висока от тази, предложена от прогнозното средно време между отказите ( MTBF ), предоставено от доставчиците на устройства .

Повреда на твърдия диск

Проучване на Carnegie Mellon изследва големи производствени системи, включително високопроизводителни компютърни сайтове и сайтове за интернет(Internet) услуги, работещи с SCSI , FC и SATA устройство. Листовете с данни за тези устройства изброяват MTBF между 1 милион и 1,5 милиона часа, което според проучването трябва да означава годишна честота на отказ „от най-много 0,88%.“ Проучването обаче показва типични годишни нива на подмяна между 2% и 4%, „и до 13% наблюдавани при някои системи“.

И така, какво означава това за вас, потребителят, който купува твърди дискове и компютри с твърди дискове?

Имам над 25 години опит в инженерството, производството и разработката на софтуер, така че първо нека разгледаме важен аспект от типичните производствени процеси от автомобили и самолети до твърди дискове и смартфони. Типичният производител на всеки краен продукт всъщност произвежда няколко от компонентите, които съставляват крайния продукт. Те всъщност възлагат на външни изпълнители производството и често проектирането на почти всички подкомпоненти, като предоставят надзор на доставчика, вариращ от никакъв до обширни спецификации, тестване и надзор. Доставчикът, избран за доставка на компонента, често е най-ниската оферта, докато някои производители избират най-добрия доставчик въз основа на стойността, която е комбинация от цена, качество и надеждност.

Тази система за аутсорсинг често се нарича многоетажна база на доставчиците. Доставчик от първо ниво доставя директно на производителя на крайния продукт. Доставчиците на доставчика от първо ниво са доставчици от второ ниво и така върви надолу по хранителната верига. Технически в случая на производителя на твърди дискове, те всъщност са доставчик от първо ниво за производителя на компютъра. Тази система обяснява защо, когато правителството на (Government)Съединените (United) щати(States) се бореше с това дали да спаси американските автомобилни производители(US Automobile Manufacturers) , хората бяха цитирани да казват, че ако им бъде позволено да паднат, стотици хиляди хора ще загубят работата си. Имаха предвид служителите на всички доставчици на ниво.

В система като тази качеството на крайния продукт е толкова добро, колкото е най-слабото звено във веригата за доставки. Много(Very) сложен и строг контрол на качеството и методи за проектиране се използват от повечето доставчици, за да гарантират качеството на своите продукти, но в крайна сметка това все пак се свежда до потенциала за човешка грешка. Дори и най-сложните изключени светлини, 24/7, компютърно контролирани и роботизирани производствени предприятия в света са обект на човешка грешка. Човекът, който програмира робота, може да не се концентрира върху задачата, което кара робота да поставя микрочип на част от микрометъра извън целта на всяка 100-та операция, което причинява проблеми на твърдия ви диск, когато идентичният компютър на вашия колега ни е добре.

Ранните неуспехи като този не са необичайни. Това е, което всички гаранции наричат ​​„производствени дефекти“. Вътрешният индустриален термин е неуспех на детската смъртност(Infant Mortality Failure) ( МВФ(IMF) ). Гаранциите имат ограничение във времето, защото са предназначени да ви предпазят от МВФ(IMFs) . Всъщност има различни нива на МВФ(IMFs) . Повечето електроника преминават през някакъв вид тест, често наричан изгаряне. Това е тест за незабавен отказ или повреда в първите няколко минути. Те са причинени от груби производствени дефекти, които причиняват катастрофална повреда почти веднага.

По-досадните МВФ(IMFs) са тези, които стигат до вас, потребителя, работят безупречно за кратък период от време, а след това, бам, е мъртъв. Производителите мразят тези неуспехи, защото сега вашето мнение за производителя е опетнено. Никога не сте знаели за неуспехите по време на изгаряне и сте били щастливи, че не знаете за тях, но когато вашият твърд диск умре в нощта преди критичен краен срок, вие се разпадате и изисквате от света компенсация. Цената на тази повреда е дългосрочна и по-висока от цената на нов твърд диск. Това може да доведе до загуба на клиент завинаги. Ето защо никога няма да притежавам друг компютър на HP, въпреки че може да са страхотни компютри. Получих лош и той ме опетни срещу HP завинаги.

Свързано(Related) : Твърдият диск се изтри сам! какво да правя ?

И така, какво можете да направите, за да се защитите?

Аз лично винаги правя много изследвания преди всяка нова покупка на електроника. IMF може да бъде постоянен проблем с един производител или модел, докато не бъде намерена и коригирана основната причина за проблема. Може дори да е дефект в дизайна, а не производствен проблем. Наскоро закупих нов HD телевизор с голям екран и мислех, че искам най-добрата 3D (Panasonic 3D) плазма(Plasma) на Panasonic , докато не научих чрез четене на рецензии от няколко източника, че моделите от 2010 г. изпитват ранна (в рамките на 3 месеца) загуба на черно и недостатъчно беше налична информация, за да се определи дали е коригирана в моделите от 2011 г. Така че купих втория си избор.

Другото по-очевидно нещо, което можете да направите специално с компютърен твърд диск, е да архивирате данните си или да изобразите цялата си система. Аз лично използвам продукт, наречен Acronis True Image . Правя резервно копие на цялата си система и след това правя постепенно архивиране всяка вечер. Настроил съм го да запази 10 предишни стъпки, така че винаги мога да се върна към по-ранна скорошна версия. Поддържам това на специален 1 TB външен твърд диск(Hard Drive) . Ами ако този твърд диск се повреди, казвате? Е, вероятността твърдият диск на вашия компютър и външният ви твърд диск да се повредят едновременно е отдалечена, но аз притежавам собствен бизнес, така че имам излишен външен твърд диск, на който правя излишни резервни копия, само за да съм в безопасност.

Също така бих ви препоръчал да вземете качествен предпазител от пренапрежение, не от вида, който получавате в Walmart до удължителните кабели, а устройство с добро качество от търговец на дребно като Best Buy или друг търговец на компютърни консумативи. ИЗПОЛЗВАМ устройство на Belkin , което струва около $40 USD .

Проверете това, ако имате нужда от безплатен софтуер за наблюдение на твърдия диск за потенциална повреда(Freeware to Monitor Hard Disk for Potential Failure) .(Check this if you need some Freeware to Monitor Hard Disk for Potential Failure.)

Авторът на тази публикация за гости, Ранди Л. Милър е главен изпълнителен директор на Alagad Incorporated.(The author of this Guest Post, Randy L. Miller is the C.E.O of Alagad Incorporated.)



About the author

Аз съм софтуерен инженер с повече от 10 години опит в работата с Apple iOS и edge устройства. Моят опит в хардуерното инженерство ме кара да се стремя да се уверя, че устройствата на нашите клиенти са възможно най-надеждни и гладки. Пиша код през последните няколко години и се научих да използвам Git, Vim и Node.js.



Related posts