Einzelnen Beitrag anzeigen
Alt 01.11.2005, 13:24   #3 (permalink)
kerri
Die Kerrimaus
 
Benutzerbild von kerri
 

Registriert seit: 17.11.2003
Beiträge: 2.987

kerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz seinkerri kann auf vieles stolz sein

Standard AW: Eine Einfuehrung in SMART (und die smartmontools unter Linux)

2.7. Wie sehen Fehler aus:

Ich habe noch eine Samsung SP1213N getestet, bei der ein Fehler aufgetreten ist. Der selftestlog sieht folgendermassen aus:

Code:
 # smartctl -l selftest /dev/hda
smartctl version 5.1-18 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
 
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended off-line   Completed: read failure       00%       911         0x04bccbc1
# 2  Extended off-line   Completed: read failure       00%       909         0x04bccbc1
# 3  Short off-line      Completed without error       00%       908         -
# 4  Extended off-line   Completed: read failure       00%       902         0x04bccbc1
# 5  Extended off-line   Completed without error       00%       893         -
# 6  Short off-line      Completed without error       00%       874         -
# 4  Extended off-line   Completed: read failure       00%       893         0x04bccbc1
Wie man sieht, ist bei einigen der Extended (=long) Tests ein Fehler aufgetreten. Bricht ein Test mit einem Fehler ab, kann man sich genauere Angaben zu dem Fehler anzeigen lassen mit smartctl -l error /dev/hdb (error log):

Code:
 # smartctl -l error /dev/hda
smartctl version 5.1-18 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
 
=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
Warning: ATA error count 2304 inconsistent with error log pointer 5
 
ATA Error Count: 2304 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Timestamp = decimal seconds since the previous disk power-on.
Note: timestamp "wraps" after 2^32 msec = 49.710 days.
 
Error 2304 occurred at disk power-on lifetime: 908 hours
  When the command that caused the error occurred, the device was active or idle.
 
  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 03 4f c2 e0
 
  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Timestamp  Command/Feature_Name
  -- -- -- -- -- -- -- --   ---------  --------------------
  b0 d4 00 03 4f c2 e0 00   10280.313  SMART EXECUTE OFF-LINE IMMEDIATE
  b0 d1 01 01 4f c2 e0 00   10280.313  SMART READ ATTRIBUTE THRESHOLDS [OBS-4]
  b0 d0 01 00 4f c2 e0 00   10280.250  SMART READ DATA
  b0 da 00 00 4f c2 00 00   10280.188  SMART RETURN STATUS
  b0 da 00 00 4f c2 e0 00   10280.125  SMART RETURN STATUS
 
[und 4 weitere Fehler...]
Hier werden jeweils die 5 zuletzt aufgetretenen Fehler angezeigt.


Hier auch noch die Attribute dieser Platte:
Code:
 # smartctl -A /dev/hda
smartctl version 5.1-18 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
 
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   056   041   000    Pre-fail  Always       -       7296
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       348
  5 Reallocated_Sector_Ct   0x0033   253   253   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   253   253   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0024   092   089   000    Old_age   Offline      -       8714
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       109593
 10 Spin_Retry_Count        0x0013   253   253   049    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       192
194 Temperature_Celsius     0x0022   190   139   000    Old_age   Always       -       27
195 Hardware_ECC_Recovered  0x000a   100   100   000    Old_age   Always       -       184012074
196 Reallocated_Event_Count 0x0012   100   100   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0033   253   253   010    Pre-fail  Always       -       0
198 Offline_Uncorrectable   0x0031   100   100   010    Pre-fail  Offline      -       1
199 UDMA_CRC_Error_Count    0x000b   100   100   051    Pre-fail  Always       -       0
200 Multi_Zone_Error_Rate   0x000b   100   100   051    Pre-fail  Always       -       0
201 Soft_Read_Error_Rate    0x000b   100   100   051    Pre-fail  Always       -       0
Man sieht, das ein unkorrigierbarer Offlinefehler vermerkt ist ('Offline_Uncorrectable'), was aber offenbar noch kein Grund zur Sorge ist.
Die 'Power_On_Hours' sind hier in halben Minuten angegeben, mit smartctl -A -v 9,halfminutes /dev/hda (Attribut #9 angegeben in halben minuten=halfminutes ) kann man das auch gleich noch in Stunden umrechnen lassen:
Code:
# smartctl -A -v 9,halfminutes  /dev/hda
[...]
  9 Power_On_Half_Minutes   0x0032   100   100   000    Old_age   Always       -       913h+31m
[...]
So... das wars dann erstmal, ich hoffe, es war auch fuer die Nicht-Linuxer unter Euch einigermassen interessant zu lesen und zu erfahren, was man mit Festplatten so alles anstellen kann, und was sie einem alles preisgeben, wenn man weiss, welche Fragen man zu stellen hat.

Links:
(1): http://smartmontools.sourceforge.net
(2): http://smartlinux.sourceforge.net/smart/attributes.php

Es gibt auch einige Windows-Alternativen zu den smartmontools. Ob die aehnlich maechtig sind, wie die smartmontools kann ich allerdings nicht sagen. Das Anzeigen der Attribute sollten allerdings all diese Programme auch beherrschen. (Besonderer Dank geht an Heaver fuer das Ausgraben dieses Links.)



PS.: Doofe Begrenzung auf 10000 Zeichen pro Beitrag


----------------------------------------------------
Fragen, Anregungen, Bemerkungen, Berichtigungen, etc. bitte hier aeussern.

Geändert von kerri (11.06.2006 um 23:54 Uhr)
kerri ist offline   Mit Zitat antworten
Für diesen Beitrag bedankt sich:
tele (15.06.2007)