Vraag Is mijn harde schijf defect?


Ik heb zojuist geprobeerd een test uit te voeren op mijn hdd en ik wil geen zelftest uitvoeren. Hier is het resultaat:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

Dus faalt deze schijf?


41
2017-11-24 08:42


oorsprong


Wanneer ik de grafische tool gebruik, staat er 'zelftest mislukt' - Michel
Het herhaalde read failure berichten geven meestal een defecte schijf aan, dus ja ... - HBruijn
Michel, welkom bij SF, en bedankt voor een goede eerste vraag. Zoals je misschien zult zien als je besluit om rond deze delen te blijven (wat ik hoop dat je dat zult doen), is een goede eerste vraag een zeldzaam en kostbaar iets. U had een hypothese die geschikt was voor de site ("mijn HDD faalt"), je hebt het relevante hulpmiddel gevonden en hebt geleerd hoe je het moet gebruiken, maar je hebt wat hulp nodig bij het interpreteren van de resultaten. Dus je kwam hier, gaf ons alle relevante informatie, geen overtollige onzin en stelde een vraag die een concessiemodel was Bedankt, blijf alsjeblieft in de buurt! - MadHatter
+1: uitstekende eerste vraag. Om optimaal gebruik te maken van Server Fault, registreer uw account en bekijk enkele van de andere sites op de website Stack Exchange netwerk. We hopen dat u meer inhoud van hoge kwaliteit kunt bijdragen aan Stack Exchange. - bwDraco


antwoorden:


Je schijf is erg blij om een ​​zelftest uit te voeren; uit de samenvatting heeft het meer dan vijf van hen gedaan in het afgelopen uur. En ze zijn allemaal vroeg in de test mislukt met leesfouten.

Ja, deze harde schijf werkt niet. Zoals het beroemde Google Labs-rapport al zei (hoewel ik op dit moment geen hand kan leggen op een link), als smartctl zegt dat je drive faalt, dat is het waarschijnlijk (ik parafraseer).

Bewerk: probeer het niet te bewaren. Haal alle gegevens eruit en vervang deze.


43
2017-11-24 08:45



Als het faalt, faalt het. Het is technisch mogelijk om het te repareren, maar het is uiterst onwaarschijnlijk dat het kosteneffectief is in vergelijking met de kosten van een nieuwe schijf. - Sobrique
@Michel Het ontbreken van een zelftestfout is geen bewijs van een rit is niet jammer genoeg, maar de aanwezigheid van een fout in de zelftest moet altijd worden beschouwd als bewijs dat het is is falende. - Rob Moir
@Michel: je zou kunnen proberen de kabels te vervangen. Soms kan een drive defect raken, niet vanwege problemen in de drive, maar vanwege slechte stroom- of datakabels. - Thomas Padron-McCarthy
@ JorgeNerín: Ik denk dat je een uitstekend punt hebt, maar het bewijs is dat zowel ik als het OP het al begrijpen - het OP moet, want hij heeft er de afgelopen twee uur ten minste vijf geïnitieerd. Wat betreft tests, ben ik het met je eens dat een lange test een betere indicatie zou zijn dat de schijf gezond is, maar als het zowel de korte als de overdrachtstests in de eerste 10% van de rit niet lukt, denk ik dat we redelijkerwijs kunnen concluderen dat de schijf is schot. Wat hoop je dat je zou onthullen door uitgebreidere tests uit te voeren? - MadHatter
@ JorgeNerín <grin> dat is logisch! Ik sprak alleen omdat het OP begon met het antropomorfiseren van zijn drive: "Ik heb net geprobeerd een test uit te voeren op mijn hdd en het wil niet voltooien een zelftest"Ik denk niet dat een van ons denkt dat het station in leven is, noch dat het zelftests alleen plant! - MadHatter


Om uw vraag te beantwoorden, is een mislukte SMART-test een trefzekere indicatie van dreigende schijffouten. Maak een back-up van uw gegevens en vervang de schijf zo snel mogelijk om mogelijk gegevensverlies te voorkomen.

@ sj0h noemde de Load Cycle Count, die erg hoog is op 447.630. (De meeste moderne harde schijven zijn ontworpen om bestand te zijn tegen 600.000 laad / ontlaadcycli.) Dit wordt meestal veroorzaakt door de Advanced Power Management (APM) -functie, die probeert energie te besparen door de hoofden te parkeren (ze uit de platen te laden) na enkele seconden van inactief. De hoofden worden zo nodig weer op de platen geladen. Op de meeste systemen, waar vaste schijven intermitterend worden, aan-en-uit activiteit, kan dit veel laad- / ontlaadcycli veroorzaken. Als u APM wilt uitschakelen, voert u de volgende opdracht uit bij een rootprompt:

smartctl -s apm,off /dev/sda

Deze opdracht moet worden uitgevoerd telkens wanneer het systeem wordt uitgezet of in de sluimerstand wordt gezet of als de schijf anderszins wordt uitgeschakeld, omdat deze instelling niet wordt bewaard als de schijf wordt uitgeschakeld.

In mijn ervaring zal het doen van dit het aantal laad / uitlaadcycli drastisch verminderen en dus de kansen dat je dit soort fouten in de toekomst opnieuw zult ervaren. Houd er echter rekening mee dat als u dit doet, het stroomverbruik en de aandrijftemperatuur toenemen. Als de omvormer constant draait bij een temperatuur van meer dan 50 ° C, neemt het risico op voortijdig falen toe, dus mogelijk wilt u APM tijdens de warmere maanden op (of aan als het uit is) laten staan.


10
2017-11-25 07:01





Behalve de leesfouten, kunt u ook de Load Cycle Count overwegen. Bij bijna 500.000 kan dit duiden op een reden voor falen, of op zijn minst een hoge belastingcyclusslijtage. Er is een laadcyclus voor elke minuut van de opstarttijd. Controleer na het vervangen van de schijf of de nieuwe schijf dit ook niet doet.


2
2017-11-25 03:13



Zeer goede observatie. Hoe kan iemand vaststellen waarom de schijf elke minuut draait en een back-up maakt? - dotancohen
@dotancohen, zie mijn antwoord - APM is de schuldige. - bwDraco


Ja, je hebt 16 sectoren onleesbaar, je hebt geprobeerd om verschillende tests uit te voeren die allemaal in ongeveer hetzelfde gebied van de schijf hebben gefaald, dus maak snel een back-up, maar houd er rekening mee dat je al ontoegankelijke gegevens hebt die nu in de buurt van sectoren 92290592, 92290596.

Je hebt misschien andere problematische gebieden, je weet nog steeds niet of die 16 sectoren opeenvolgend of verspreid zijn, als je wilt spelen na een back-up kun je een selectieve zelftest doen met -t select, startlba-endlba.

Current_Pending_Sector betekent dat de harde schijf-firmware geprobeerd heeft het te lezen, maar dat kan het niet, het zal een paar keer meer proberen (wanneer het OS ernaar vraagt) tot het faalt en het als Offline_Unkorrigeerbaar markeren of de beschadigde sector voor een andere reserve-sector vervangen als de OS schrijft ernaar (waardoor Reallocated_Sector_Ct wordt verhoogd).


2
2017-11-25 21:37





Ik zou de schijf persoonlijk vervangen. Als u om wat voor reden dan ook nog niet wilt doen, maar nog een tijdje met de schijf rondsurft, hebt u een manier nodig om ervoor te zorgen dat u de slechte gebieden niet per ongeluk gebruikt voor nieuwe bestanden.

Ik had zo'n drive op een oude Mac die alleen maar video opneemt, en besloot dat ik hem nog niet wilde veranderen, omdat de video's gewoon leuk waren om te hebben. Dus ik moest de fouten isoleren. Eerst maakte ik een lege map voor slechte bestanden, en toen probeerde ik alle bestaande bestanden op de schijf te lezen en alle bestanden met een fout werden verplaatst naar de map met slechte bestanden (hopelijk alleen onbelangrijk).

Toen maakte ik een heleboel uniek genoemde één megabyte-bestanden om de harde schijf te vullen (dus alle lege ruimte bevond zich nu in een van deze 1 MB-bestanden) en herhaalde daarna de procedure. Alle bestanden met fouten erin, zijn verplaatst naar de map met slechte bestanden en de bestanden die nog over waren, waren goed en konden worden verwijderd om de slechte ruimte terug te winnen.

Je kunt de schijf nu wat langer gebruiken, maar gebruik hem niet voor belangrijke dingen. Het zullen falen meer en het zal hoogstwaarschijnlijk onhandig zijn als het gebeurt.


1
2017-11-24 23:52





Dit is geen goed teken. Zorg ervoor dat van de inhoud van de schijf een back-up wordt gemaakt en gebruik de schijf niet voor iets belangrijks.

Ik heb echter schijven met falende sectoren gezien die ze opnieuw toewijzden en jarenlang operationeel bleven, dus je kon het een tijdje bewaren, bijvoorbeeld voor onbelangrijke dingen of extra back-ups.

Een ding om te doen is dan om te zien welke bestanden zijn beschadigd door de onleesbare sectoren en schrijf deze sectoren om herallocatie door de schijf te forceren (verplaats ze van "Current_Pending_Sector" naar "Reallocated_Sector_Ct"). Zie als u Linux gebruikt http://smartmontools.sourceforge.net/badblockhowto.html. Zodra de sectoren opnieuw zijn toegewezen, moet de zelftest voorbijgaan of meer onleesbare sectoren melden.

Ik ben het niet eens met de meeste antwoorden, omdat ik denk dat dit geen slechte sectoren zijn nodig een aanwijzing voor dreigend falen. Zoals http://blog.mmueh.net/index.php/2010/12/09/luks-meets-badblocks/ zegt: "elke harde schijf begint op een bepaald punt in zijn leven slechte sectoren te produceren".


1
2017-11-26 08:08



hoewel ik het ermee eens ben dat het falen niet zeker is met een slechte sector gebeurt, de kans dat een bestuurder faalt na één slechte sector aanzienlijk toeneemt (ik denk dat dat ook in het google rapport stond, maar ik kan de huidige bron momenteel niet vinden) - Dennis Nolte