2.7. Wie sehen Fehler aus:
Ich habe noch eine Samsung SP1213N getestet, bei der ein Fehler aufgetreten ist. Der selftestlog sieht folgendermassen aus:
Code:
# smartctl -l selftest /dev/hda
smartctl version 5.1-18 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended off-line Completed: read failure 00% 911 0x04bccbc1
# 2 Extended off-line Completed: read failure 00% 909 0x04bccbc1
# 3 Short off-line Completed without error 00% 908 -
# 4 Extended off-line Completed: read failure 00% 902 0x04bccbc1
# 5 Extended off-line Completed without error 00% 893 -
# 6 Short off-line Completed without error 00% 874 -
# 4 Extended off-line Completed: read failure 00% 893 0x04bccbc1
Wie man sieht, ist bei einigen der Extended (=long) Tests ein Fehler aufgetreten. Bricht ein Test mit einem Fehler ab, kann man sich genauere Angaben zu dem Fehler anzeigen lassen mit
smartctl -l error /dev/hdb (error log):
Code:
# smartctl -l error /dev/hda
smartctl version 5.1-18 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
Warning: ATA error count 2304 inconsistent with error log pointer 5
ATA Error Count: 2304 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Timestamp = decimal seconds since the previous disk power-on.
Note: timestamp "wraps" after 2^32 msec = 49.710 days.
Error 2304 occurred at disk power-on lifetime: 908 hours
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 03 4f c2 e0
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name
-- -- -- -- -- -- -- -- --------- --------------------
b0 d4 00 03 4f c2 e0 00 10280.313 SMART EXECUTE OFF-LINE IMMEDIATE
b0 d1 01 01 4f c2 e0 00 10280.313 SMART READ ATTRIBUTE THRESHOLDS [OBS-4]
b0 d0 01 00 4f c2 e0 00 10280.250 SMART READ DATA
b0 da 00 00 4f c2 00 00 10280.188 SMART RETURN STATUS
b0 da 00 00 4f c2 e0 00 10280.125 SMART RETURN STATUS
[und 4 weitere Fehler...]
Hier werden jeweils die 5 zuletzt aufgetretenen Fehler angezeigt.
Hier auch noch die Attribute dieser Platte:
Code:
# smartctl -A /dev/hda
smartctl version 5.1-18 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 056 041 000 Pre-fail Always - 7296
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 348
5 Reallocated_Sector_Ct 0x0033 253 253 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 253 253 051 Pre-fail Always - 0
8 Seek_Time_Performance 0x0024 092 089 000 Old_age Offline - 8714
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 109593
10 Spin_Retry_Count 0x0013 253 253 049 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 192
194 Temperature_Celsius 0x0022 190 139 000 Old_age Always - 27
195 Hardware_ECC_Recovered 0x000a 100 100 000 Old_age Always - 184012074
196 Reallocated_Event_Count 0x0012 100 100 000 Old_age Always - 1
197 Current_Pending_Sector 0x0033 253 253 010 Pre-fail Always - 0
198 Offline_Uncorrectable 0x0031 100 100 010 Pre-fail Offline - 1
199 UDMA_CRC_Error_Count 0x000b 100 100 051 Pre-fail Always - 0
200 Multi_Zone_Error_Rate 0x000b 100 100 051 Pre-fail Always - 0
201 Soft_Read_Error_Rate 0x000b 100 100 051 Pre-fail Always - 0
Man sieht, das ein unkorrigierbarer Offlinefehler vermerkt ist ('Offline_Uncorrectable'), was aber offenbar noch kein Grund zur Sorge ist.
Die 'Power_On_Hours' sind hier in halben Minuten angegeben, mit
smartctl -A -v 9,halfminutes /dev/hda (Attribut #9 angegeben in halben minuten=halfminutes ) kann man das auch gleich noch in Stunden umrechnen lassen:
Code:
# smartctl -A -v 9,halfminutes /dev/hda
[...]
9 Power_On_Half_Minutes 0x0032 100 100 000 Old_age Always - 913h+31m
[...]
So... das wars dann erstmal, ich hoffe, es war auch fuer die Nicht-Linuxer unter Euch einigermassen interessant zu lesen und zu erfahren, was man mit Festplatten so alles anstellen kann, und was sie einem alles preisgeben, wenn man weiss, welche Fragen man zu stellen hat.
Links:
(1):
http://smartmontools.sourceforge.net
(2):
http://smartlinux.sourceforge.net/smart/attributes.php Es gibt auch einige Windows-Alternativen zu den smartmontools. Ob die aehnlich maechtig sind, wie die smartmontools kann ich allerdings nicht sagen. Das Anzeigen der Attribute sollten allerdings all diese Programme auch beherrschen. (Besonderer Dank geht an Heaver fuer das Ausgraben dieses Links.)
PS.: Doofe Begrenzung auf 10000 Zeichen pro Beitrag
----------------------------------------------------
Fragen, Anregungen, Bemerkungen, Berichtigungen, etc.
bitte hier aeussern.