Du er her: Hjem --> Annet --> Datatips --> Avlese S.M.A.R.T. status for å forebygge harddiskkrasj

Harddisk S.M.A.R.T. status

Alle nyere harddisker har et innebygget selvovervåkningssystem. Dette kalles S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology. Dette systemet registrerer informasjon rundt harddisken. For eksempel hvor mange timer den har stått på (ID=09), og hvor mange ganger den har blitt slått av og på (ID=0C).

Avlesning av S.M.A.R.T. info med CrystalDiskInfo

For å lese av S.M.A.R.T. parametrene fra harddiskene i systemet bruker man et program. Eksempelvis gratisprogrammet CrystalDiskInfo. Dette støtter både magnetisk harddisk og SSD. Det er enkelt å installere. Og det er enkelt å kjøre. Og det er enkelt å få en indikasjon på om det er et problem eller ikke - det lyser gult (eller rødt) hvis det er et problem. Hvis det er et problem betyr dette ofte at harddisken er iferd med å feile. Da bør man ta en backup. Og så kjøpe en ny harddisk og klone den gamle til den nye. Og begynne å bruke den nye istedenfor den gamle.

S.M.A.R.T. pending harddisk.

Fig. 1 CrystalDiskInfo analyse av maskin med 5 fysiske harddisker (26/1-2020). De 4 første er interne, den siste (K:) er en ekstern harddisk. Vi ser at alle er markert blå, utenom den som inneholder G: filsystemet. Her er det advarsler. Programmet viser her S.M.A.R.T. detaljene for den som har advarsler. Man kan veksle mellom hvilken disk hvis detaljer vises ved å trykke på høyre/venstre pilene eller temperatur/bokstav områdene i den horisontale raden øverst i program vinduet.

I Fig. 1 ser vi en CrystalDiskInfo analyse av en multiboot maskin (min arbeidsstasjon). Mitt primære operativsystem, Windows 10, er C:. Dette er ok - markert med blått. Vi ser det er en feil på G: filsystemet. Dette er per 26/1-2020. Dette er en over 10 år gammel WD Raptor disk med Win XP-64. Som jeg brukte mye før. C5 Current Pending Sector Count har verdien 5 (hex), som også er 5 (desimal). Harddisken har hatt problemer med å lese 5 sektorer. De er markert som mulig korrupte. C6 Uncorrectable Sector Count har verdien 1. Dette tolker jeg som en sektor (eller del av sektor) er ødelagt og ikke kan leses. Her er det altså et datatap.

Jeg sjekket S.M.A.R.T. statusen for maskinen min 6. januar 2020 i forbindelse med at en Windows 10 profil var korrupt. Da var situasjonen som i Fig. 1 bortsett fra at C6 feilen ikke var der. Profilproblemet var ikke på grunn av korrupte data på C:. Men jeg gikk uansett på komplett og kjøpe en ny disk. Som ble liggende litt. Den 26. februar var jeg igang igjen. Når jeg nå kjørte CrystalDiskInfo hadde det oppstått nok en feil på G:, denne gangen en C6 feil. Nå altså med et reelt datatap. Dette indikerer at denne harddisken er "på vei", det vil si, her kommer det flere og flere feil. Så her er det bare å klone det som er igjen jo før jo heller og bytte til ny disk.

Avlesning av S.M.A.R.T. info fra kommandolinjen

Hvis man ikke har CrystalDiskInfo kan man få en indikasjon på S.M.A.R.T. statusen fra Windows kommandolinje: wmic diskdrive get caption,size,status. Eller: wmic diskdrive (for å hente mer info om harddiskene i systemet).

I det følgende vil jeg se på mer avanserte S.M.A.R.T. tolkninger og anvendelser.

Klone harddisk med S.M.A.R.T. advarsel

G: inneholder ikke verdifulle data. Men den inneholder Windows XP-64, et gammelt men meget bra operativsystem. Samt mange bra programmer. Så jeg var interessert i å redde disken før den tok kvelden. Et gratis program for kloning er MiniTool PartitionWizard (de har også en betal versjon). Kloning vil si å kopiere alle bit fra den gamle til den nye, ikke bare filene, men også data og filer som er til harddiskens eget interne bruk. Jeg kjøpte en ny harddisk. Den gamle var på 150 giga. Den nye på 4 terra. Jeg måtte dele den i to partisjoner. Systempartisonen kunne være på max 2048 giga. Til den andre partisjonen ble det igjen 1678 giga. Årsaken til begrensningen er at min maskin har MBR partisjons tabell. Og BIOS/CMOS, ikke UEFI. Koplet den nye harddisken til maskinen min med et USB-til-SATA adapter. Kjørte MiniTool PartitionWizard og klonet den gamle til den nye. Man kan altså klone selv om de to harddiskene er av forskjellig størrelse. Deretter åpnet jeg maskinen, koplet av den gamle SATA disken og koplet på den nye. Jeg har en multiboot maskin og bruker bootloaderen GRUB. Det fungerte uten at jeg måtte endre noe her. Jeg kunne boote maskinen til Win XP-64, nå altså på en ny 4 terra harddisk. Alt fungerte perfekt.

Når jeg kjørte CrystalDiskInfo på den nye 4 terra harddisken var den OK. Det var ingen advarsler. Men hvis det var et datatap på den gamle vil dette ha kommet med på den nye.

Når jeg kjørte CrystalDiskInfo på den gamle harddisken, hadde den de samme S.M.A.R.T. feilene som før kloningen. Det vil si - det å lese alle bitsene på den reparerte ikke noen feil. Nedenfor skal vi se at å skrive over den gamle reparerte feilene.

Overskrive harddisk med 0 og 1 for å slette og reparere

Etter å ha klonet den gamle harddisken og byttet til ny harddisk, valgte jeg å overskrive den gamle med 0'er og 1'ere. Primært for å slette personlige data. Jeg brukte MiniTool til dette også. Når jeg nå kjørte CrystalDiskInfo viser den at harddisk feilene har forsvunnet. Det tyder på at disken rettet seg selv når den fikk muligheten til å skrive til stedene som var ustabile. Også C6 feilen forsvant.

Sletter gammel harddisk ved å overskrive med nuller og enere.

Fig. 2 Sletter harddisk ved å overskrive med 0 og 1.

S.M.A.R.T. pending sektorer forsvant etter overskrivning.

Fig. 3 Etter å ha overskrevet den feilende harddisken med 0 og 1 forsvant S.M.A.R.T. feilen. Dette er harddisk statusen per 30/1-2020.

Det er litt rart at det å lese over harddisken (da vi klonet) ikke endret S.M.A.R.T. resultatet. Mens når vi skrev til harddisken så ble den helt friskmeldt. Jeg ville for eksempel tro at det å lese over harddisken ville ført til at Reallocated Sectors Count ville fått en verdi over 0. Og jeg ville tro at å skrive til disken ikke ville reparert fysiske feil.

S.M.A.R.T. på SSD og magnetisk harddisk

Hver S.M.A.R.T. harddisk parameter har et ID nummer. Hvilke parametre som støttes varierer mellom harddisker. Vanlig magnetisk harddisk og SSD har bare noen få S.M.A.R.T. parametre felles - som antall timer disken har stått på, og antall oppstarter. Magnetisk harddisk og SSD er to veldig forskjellige teknologier så det er naturlig at de har forsjellige kontroll parametre. Man må lese av Raw Values kolonnen for å finne verdiene. I CrystalDiskInfo er verdiene oppgitt i heksadesimal, så man må omgjøre til desimal.

S.M.A.R.T. for en SSD Samsung Evo.

Fig. 4 S.M.A.R.T. for en SSD Samsung EVO (rundt 3 år gammel, min systemdisk med Win10). Det er andre S.M.A.R.T. parametre enn for WD Raptor disken vi har sett på ovenfor.

S.M.A.R.T. for en ekstern magnetisk harddisk.

Fig. 5 S.M.A.R.T. for en ekstern magnetisk harddisk (rundt 2 år gammel, brukes til backup).

C5h Pending sector og C6h Uncorrectable sector

C5 Current Pending Sector Count er en parameter for magnetiske harddisker, ikke for SSD. En magnetisk harddisk ser ut som en CD plate. Men det er en annen teknologi. En CD lagrer data ved fysiske indensjoner i platen og kan bare skrives til (brennes) en gang. En harddisk lagrer data ved å reversere små magneters polaritet. En magnetisk harddisk plate består av konsentriske ringer (tracks). Hvert track er delt inn i sektorer på 512 byte. 1 byte er 8 bits. En bit kan ha verdien 0 eller 1. En sektor består fysisk av 512 små magneter. En magnet har en polaritet - dvs den ene siden er nordpol, den andre sørpol. En harddisk lagrer en 0 og en 1 ved å reversere polariteten. Eksempelvis: nord-sør er 0, sør-nord er 1. For at en "read" skal være utvetydig må magnetfeltet ha en viss styrke. Dersom man ved lesing av en bit registrerer retningen på feltet men under kriteriet for hva som er utvetydig, vil sektoren markeres som "pending". Det vil si, disken har registrert at en sektor begynner å bli slitt e.l. Når en sektor feiler på denne måten, altså gradvis, vil dataene på den flyttes til et annet sted på harddisken (reallokeres). Vi får sannsynligvis ikke et datatap. En sektor markeres som feilet og kan ikke mer brukes. Den har typiske en fysisk feil slik at magneten på den ikke klarer å holde tilstrekkelig magnetfelt (Gauss, Tesla). Så vi mister litt av kapasiteten på harddisken. Vi forstår at mange slike feilete sektorer ikke er et godt tegn. En read som ikke bare er usikker, men umulig å tolke, vil bety at filen det gjelder vil være korrupt og ikke kan brukes. Vi risikerer datatap. Hvis dette skjer på operativsystem filer risikerer vi at maskinen ikke starter. Bare en eller flere Pending sektorer er et dårlig tegn og ofte nok til at vi vil bytte harddisk. Eventuelt kan man bare bruke den man har til den krasjer. En vurdering her er hvor viktige dataene der er. Og om man har backup (som man har testet restore og vet at det fungerer). Når disken krasjer er det sannsynlig med datatap.

En sektor er den minste enheten som kan leses. En harddisk kan for eksempel ikke lese bare halvparten av bitsene i en sektor. Sektor størrelsen er fysisk markert på en disk, det er ikke noe man kan konfigurere i software. En blokk er en gruppe sektorer, gjerne 8, slik at en blokk er 4K. En blokk er den minste addresserbare enheten på en harddisk. Blokk størrelsen kan konfigureres i software. En fil kan ikke oppta mindre plass enn 1 blokk. Det er fordeler og ulemper med stor/liten blokk størrelse. Med stor blokk størrelse går det mindre plass til å lagre adresse referanser. Men dersom man har mange små filer vil mye plass gå tapt fordi de ikke-fulle blokkene taper mer plass når de er store.

Den gamle harddisken som nå ser ut til å være ok kommer jeg til å bruke i en server/testmaskin jeg skal bygge fra deler jeg har liggende.

S.M.A.R.T. på Synology RAID1

S.M.A.R.T. for en Synology.

Fig. 6 S.M.A.R.T. for Synology, to disker i RAID1. Bildet er manipulert slik at vi kan sammenlikne Raw data verdiene for de to diskene. Begge diskene er OK, Disk1 har vært i bruk i flere år, Disk2 bare i noen uker.

I Synologyen er det to magnetiske harddisker, begge Western Digital. Disk1 er WD green 2TB og flere år gammel. Disk2 er WD red 4TB og ny. De to diskene er konfigurert i et RAID1 (speiling). Alle S.M.A.R.T. radene er OK for begge diskene. Alle kolonnene er for Disk1, bortsett fra den siste som er for Disk2. Det er gjerne tallene her som er interessante. De tre kolonnene som er skravert med grått (Value, Worst, Threshold) er det noe uklart hva representerer. I Raw Data kolonnen ser vi at den gamle harddisken har mye høyere verdier på ID4 (Start_Stop_Count) og ID9 (Power_On_Hours). Noe som er logisk. På C3 Spin_Up_Time ser vi at den nye disken er litt raskere enn den gamle, men ikke så mye.

Referanser

  1. Wikipedia S.M.A.R.T.
    https://en.wikipedia.org/wiki/S.M.A.R.T.
Telefon: 67 20 71 21 / 92 60 51 57 psdigital logo tema