Tutorial

Enkle spørgsmål: Hvad er SMART & Hvad gør det?

Mange af os har oplevet en harddiskfejl; nogle af os har endda forsøgt at finde ud af mere om pålideligheden af harddiske og deres dybt skjulte forudsigelsesfunktion, der er en del af en teknologi, der hedder SMART. Man kan argumentere for, at SMART ikke er så pålidelig som det ikke forudsiger fejl i alle tilfælde. Denne kendsgerning er delvist sandt, men det egentlige indre arbejde i dette selvovervågningssystem er ikke så enkelt. Så lad os forsøge at afhjælpe denne usikre situation og undersøge, hvordan SMART virkelig virker. Lad os komme igang:

SMART - En smule historie

SMART, som undertiden er skrevet som SMART (selvovervågning, analyse og rapporteringsteknologi), er et system, der overvåger de interne oplysninger på dit drev. Det blev udviklet fra og med 1992, og det er nu inkluderet i alle moderne harddiskdrev (IDE) og Serial ATA (HDD'er). Selvfølgelig er det en funktion, der også findes i solid state drives (SSD'er).

Dens historie dækker en række navne som Predictive Failure Analysis eller IntelliSafe og input fra alle de store harddiskproducenter: IBM, Seagate, Quantum, Western Digital. Endelig fremgår dets dokumentation for første gang i 2004 inden for Parallel ATA-standarden og modtog regelmæssige revisioner frem til 2008.

Dens oprettelse var baseret på behovet for at overvåge en disks status, og det vil formentlig fortælle dig, om harddisken er ved at godt, dø. Selvom du måske tror, at SMART vil gætte magisk, hvis drevet er sundt, viser det faktisk en række variabler, hvis nummer og type varierer fra kørslen til drev, der er indikatorer for dens pålidelighed. For en fuldstændig liste over attributter, da der er ca. 50 af dem (for eksempel råfeilfrekvens, oprydningstid, rapporterede ukorrekte fejl, strøm til tiden, belastningstælling osv.) Kan du få adgang her.

Bortset fra nogle enkeltforsøg (Google, Backblaze), er de fleste SMART-data ikke-dokumenterede. Systemet giver en lang række interne data, men der er mange uoverensstemmelser i statistikken, især fordi mange af harddiskproducenterne bruger forskellige definitioner og målinger. For eksempel gemmer nogle producenter strøm på tider som timer, mens andre måler i minutter eller sekunder. Derudover forsøger ingen af dem at forklare, hvilke af de forskellige attributter eller variabler, der er værd at være opmærksomme på, og få os til at drukne i data.

Før vi forsøger at forstå, hvilke af attributterne der er relevante, skal vi først skelne mellem hovedtyperne af fejl: forudsigelig og ikke forudsigelig. Den første type omfatter de fejl, der vises i tide, og som skyldes defekte diskmekanismer eller skader på diskens overflade. Problemer bliver værre over tid, og disken vil i sidste ende svigte. Ikke-forudsigelige fejl skyldes pludselige hændelser, som vi kan nævne for eksempel pludselige strømforstyrrelser.

BEMÆRK: Det er vigtigt at forstå, at SMART kun kan hjælpe dig med at registrere forudsigelige fejl.

Vigtige SMART attributter

Harddiskens sundhedstilstand overvåges konstant ved brug af flere sensorer. Værdierne måles ved hjælp af typiske algoritmer, og derefter tilpasses de tilsvarende attributter i overensstemmelse med resultaterne.

I ethvert overvågningsprogram, du vil bruge alle SMART-attributter, vil disse felter være:

Identifikator: Definitionen af attributten. Det har normalt en standard betydning, og den er markeret med et tal mellem 1 og 250 (for eksempel 9 er Power-on Count). Alligevel giver alle diskovervågnings- og testværktøjer navnet og en tekstbeskrivelse af attributten.
Tærskelværdi: minimumsværdien for attributten. Hvis denne værdi er nået, er din harddisk ved at svigte.
Værdi: Aktuel værdi af attributten. Algoritmen beregner dette tal baseret på de rå data. En ny harddisk vil have et højt nummer, det teoretiske maksimum (100, 200 eller 253 afhængigt af producenten), der vil falde i løbet af harddiskens levetid.
Værste: Den mindste værdi af attributten nogensinde registreret.
Data: rå målte værdier fra en sensor eller en tæller. Dette er de data, der bruges af algoritmen designet af producenten af harddisken. Dens indhold afhænger af attributten og maker af harddisken. Regelmæssige brugere skal springe over denne.
Flag: Formålet med attributten. Dette indstilles normalt af producenten og vil derfor variere fra disk til disk. Hver af attributterne er enten kritiske og kan forudsige en forestående fejl (for eksempel ID 5 reallocated sectors count) eller statistisk uden direkte effekt på status (for eksempel ID 174 uventet effekt tab count).

BEMÆRK: Husk altid, at når du forsøger at forstå status for enhver SMART-attribut, skal du kontrollere værdierne for disse tre felter: værdi, tærskel og flag. Husk også, at mindre værdier er en indikation på et fald i pålideligheden.

Disk temperatur er en meget diskuteret parameter. Det vurderes stadig, at værdier over 60 ° C vil reducere levetiden for en harddisk og øge sandsynligheden for skade. Vi anbefaler at bruge en ventilator til at reducere temperaturen på dine harddiske og måske forlænge deres liv.

Som vi nævnte ovenfor, er ikke alle SMART-attributter kritiske for fejlprognoser. De to ovennævnte undersøgelser om harddiskfejlfrekvenser og andre kilder er enige om, at en vigtig hjælp til at identificere fejlsystemer er ID 5-omfordelte sektortællinger. Omfordeling sker, når drevets logik remballerer en beskadiget sektor som følge af tilbagevendende bløde eller hårde fejl til en ny fysisk sektor fra sine ekstra enheder. Denne egenskab afspejler det antal gange, en remapping er sket, og det er en indikation af HDD'ens overflade slitage.

En anden nyttig egenskab, der skal overvåges, er ID 197 - Nuværende Afventer Sektorantal. Dette tæller de "ustabile" sektorer, hvilket betyder de beskadigede med læsfejl, der venter en remapping, en slags "probation" -system. SMARTs algoritmer har blandede følelser om denne særlige egenskab, da det undertiden ikke er overbevisende, men det siges at det kan give en tidligere advarsel om mulige problemer.

Den sidste af disse indikatorer, som skal overvåges, er ID 187-rapporterede ukorrekte fejl. Det er antallet af fejl, der er umulige at genoprette, og det er nyttigt, fordi det synes at have samme betydning for alle producenter.

BEMÆRK: Alle ovennævnte SMART attributter har en værdi, der er let at fortolke. Hvis de rapporterer et nummer på 1 eller mere, er det meget muligt, at dit drev mislykkes, så start bedre sikkerhedskopiering. Alligevel, selv om disse er nyttige indikatorer for driftsikkerhed, er de ikke idiotsikker, og du bør sammenligne dem med de råd, der gives af dit valgte HDD-overvågningsværktøj.

Konklusion

Dette var vores korte undersøgelse af SMARTs indre arbejde og dets evner til at overvåge og forudsige harddiskfejl. Det vigtigste synspunkt, du bør huske, er, at dette selvovervågningssystem vil hjælpe dig med at gennemgå status for din harddisk. Hvis du vil bruge disse SMART-data for at se, om dit eget drev har problemer, skal du læse de artikler, der anbefales nedenfor.